OpenAI Perkenalkan GPT-OSS, Open AI Setara Model Premium


Ilustrasi OpenAI

Ilustrasi OpenAI

Dunia kecerdasan buatan (AI) terus berkembang pesat. Inovasi demi inovasi hadir untuk memberikan solusi yang lebih canggih, efisien, dan terjangkau bagi pengembang maupun pengguna akhir. Salah satu langkah besar terbaru datang dari OpenAI yang resmi memperkenalkan gpt-oss-120b dan gpt-oss-20b dua open-weight language models yang menggabungkan kemampuan penalaran kelas dunia dengan efisiensi penyebaran tinggi.

Model ini bukan sekadar evolusi, tetapi sebuah lompatan dalam teknologi AI terbuka. Dengan lisensi Apache 2.0 yang fleksibel, kedua model ini menghadirkan performa mendekati atau bahkan melampaui model kepemilikan (proprietary) sekelasnya, namun tetap bisa dijalankan di perangkat keras konsumen tanpa biaya infrastruktur yang selangit.

 

Mengapa gpt-oss Penting?

Selama ini, banyak model AI berkualitas tinggi bersifat tertutup atau hanya dapat diakses melalui layanan komersial berbayar. Meskipun ini memberikan kontrol keamanan dan kualitas, hal tersebut membatasi fleksibilitas pengguna yang ingin mengutak-atik, menyesuaikan, atau menjalankannya di lingkungan pribadi.

Kehadiran gpt-oss mengubah peta permainan. OpenAI memberikan model dengan bobot terbuka yang:

  • Performa Tinggi: Mengungguli model open-weight lain pada banyak tolok ukur penalaran.
  • Fleksibel: Lisensi Apache 2.0 memungkinkan penggunaan untuk keperluan komersial maupun non-komersial.
  • Efisien: Dapat dijalankan pada perangkat keras dengan spesifikasi konsumen, bahkan di edge device.
  • Aman: Melalui pengujian dan evaluasi keselamatan setara model terbaru OpenAI.

 

Performa di Kelasnya

OpenAI menyebut bahwa gpt-oss-120b nyaris setara dengan model o4-mini pada tolok ukur penalaran inti, namun hanya memerlukan satu GPU 80 GB untuk berjalan. Sementara gpt-oss-20b memberikan hasil mirip o3-mini dan cukup dijalankan dengan memori 16 GB, sehingga cocok untuk:

  • Penggunaan pada perangkat lokal (on-device AI).
  • Inferensi langsung tanpa koneksi internet.
  • Prototyping dan iterasi cepat tanpa biaya cloud mahal.

Kedua model ini juga menonjol di berbagai tugas AI canggih seperti:

  • Function calling multi-shot (pemanggilan fungsi dengan beberapa contoh).
  • Chain of Thought reasoning (CoT) untuk penalaran multi-langkah.
  • HealthBench, bahkan mengungguli GPT-4o pada kueri kesehatan.
  • Agentic workflows untuk penggunaan alat bantu seperti pencarian web dan eksekusi kode.

 

Didesain untuk Fleksibilitas dan Integrasi

Model gpt-oss tidak hanya kuat dalam kemampuan penalaran, tetapi juga ramah integrasi. Keduanya kompatibel dengan OpenAI Responses API, sehingga pengembang dapat dengan mudah:

  • Menjalankan AI dengan alat bantu eksternal seperti pencarian atau Python.
  • Mengatur tingkat penalaran (rendah, sedang, tinggi) sesuai kebutuhan performa vs latensi.
  • Menghasilkan keluaran terstruktur untuk integrasi aplikasi yang presisi.
  • Mengoptimalkan AI untuk kasus penggunaan real-time dengan latensi rendah.

Kemampuan ini membuka peluang besar bagi pengembang untuk membuat sistem AI yang lebih interaktif, cepat, dan hemat sumber daya.

 

Keselamatan sebagai Prioritas

Salah satu kekhawatiran utama dari model bobot terbuka adalah keamanan. OpenAI mengantisipasi ini dengan:

  • Melakukan pelatihan dan evaluasi keselamatan mendalam.
  • Menguji model dengan Preparedness Framework untuk mengidentifikasi potensi risiko.
  • Menyertakan lapisan evaluasi adversarial agar model tahan terhadap penyalahgunaan.
  • Menyediakan hasil evaluasi dan kartu model secara terbuka untuk transparansi.

Dengan langkah ini, OpenAI memastikan gpt-oss memiliki standar keamanan setara model kepemilikan mereka yang terbaru, memberi rasa aman bagi pengembang maupun organisasi.

 

Kolaborasi Dunia Nyata

Sebelum dirilis secara publik, OpenAI sudah bekerja sama dengan mitra seperti:

  • AI Sweden: Menggunakan model untuk proyek AI lokal dengan keamanan data ketat.
  • Orange: Eksperimen AI untuk solusi komunikasi dan analisis.
  • Snowflake: Integrasi AI untuk pengolahan data skala besar.

Kolaborasi ini menunjukkan bahwa gpt-oss tidak hanya sekadar riset, tetapi siap digunakan untuk aplikasi industri nyata.

 

Detail Teknis dan Arsitektur

Baik gpt-oss-120b maupun gpt-oss-20b dibangun menggunakan arsitektur Transformer dengan pendekatan Mixture-of-Experts (MoE) untuk efisiensi.

Spesifikasi utama:

Model
Lapisan
Total
Parameter Parameter Aktif/Tok Total  Pakar Pakar Aktif/Tok Panjang Konteks
gpt-oss-120b 36 117B 5,1B 128 4 128K
gpt-oss-20b 24 21B 3,6B 32 4 128K


Beberapa inovasi arsitektur yang digunakan:

  • Rotary Positional Embedding (RoPE) untuk pengodean posisi.
  • Multi-query attention dengan grouping untuk efisiensi memori.
  • Panjang konteks 128 ribu token untuk menangani dokumen panjang.

Data pelatihan difokuskan pada teks berkualitas tinggi, khususnya STEM, pemrograman, dan pengetahuan umum. Tokenisasi menggunakan format o200k_harmony yang juga kini dirilis sebagai sumber terbuka.

 

Proses Post-training

Setelah pelatihan awal, gpt-oss menjalani supervised fine-tuning dan reinforcement learning seperti yang dilakukan pada model o4-mini. Tujuannya:

  • Menyelaraskan model dengan OpenAI Model Spec.
  • Mengajarkan teknik penalaran CoT sebelum menghasilkan jawaban.
  • Mengoptimalkan penggunaan alat bantu agar respons lebih akurat dan relevan.

Hasilnya, pengembang dapat mengatur level penalaran hanya dengan satu instruksi sederhana di pesan sistem—memungkinkan penyesuaian cepat tanpa konfigurasi rumit.

 

Evaluasi dan Hasil Benchmark

OpenAI menguji gpt-oss pada berbagai tolok ukur seperti:

  • Codeforces: Pengodean kompetisi.
  • MMLU & HLE: Penalaran umum dan pengetahuan luas.
  • TauBench: Pemanggilan alat bantu.
  • HealthBench: Kueri kesehatan.
  • AIME 2024 & 2025: Matematika kompetisi.

Hasilnya:

  • gpt-oss-120b mengungguli o3-mini dan setara bahkan lebih baik dari o4-mini di banyak tugas, termasuk kesehatan dan matematika.
  • gpt-oss-20b menyamai o3-mini meski ukurannya jauh lebih kecil, dengan keunggulan di matematika dan kesehatan.

 

Chain-of-Thought (CoT): Transparansi untuk Penelitian dan Pengawasan

Salah satu aspek menarik dari gpt-oss adalah pendekatan terhadap rantai pemikiran atau Chain-of-Thought (CoT). CoT adalah jejak langkah penalaran yang dihasilkan model sebelum memberikan jawaban akhir. Dalam banyak kasus, CoT membantu model menghasilkan respons yang lebih akurat untuk pertanyaan kompleks.

Namun, OpenAI tidak melakukan pengawasan langsung terhadap CoT di gpt-oss. Mengapa?

  • Tujuannya adalah transparansi penelitian. Dengan membiarkan CoT tidak disensor, peneliti dapat memantau perilaku model secara lebih akurat, termasuk mendeteksi pola penipuan, kesalahan logika, atau potensi penyalahgunaan.
  • Mendorong inovasi keamanan. Pengembang dan peneliti dapat mengembangkan sistem pengawasan CoT mereka sendiri untuk mengidentifikasi perilaku buruk model.

Meski begitu, ada satu peringatan penting: CoT tidak boleh ditampilkan langsung kepada pengguna aplikasi. Hal ini karena CoT dapat berisi informasi yang salah (halusinasi), bahasa yang tidak pantas, atau data yang seharusnya tidak muncul di keluaran akhir.

 

Keamanan dan Penyempurnaan Kasus Terburuk

OpenAI memahami bahwa model bobot terbuka memiliki potensi risiko yang lebih tinggi dibanding model tertutup. Oleh karena itu, gpt-oss dibangun dengan pendekatan keamanan berlapis, mulai dari pra-pelatihan hingga pengujian pasca-peluncuran.

  1. Penyaringan Data Berbahaya
    Selama pra-pelatihan, data yang berhubungan dengan CBRN (Chemical, Biological, Radiological, Nuclear) disaring secara ketat untuk mencegah model mempelajari konten berbahaya.
  2. Penyelarasan Pasca-Pelatihan
    Dalam tahap post-training, digunakan pendekatan penyelarasan deliberatif dan hierarki instruksi agar model mampu:
    • Menolak permintaan yang tidak aman.
    • Tahan terhadap prompt injection atau manipulasi perintah.
  3. Uji Penyalahgunaan Model
    Untuk mengantisipasi skenario terburuk, OpenAI melakukan simulasi penyalahgunaan dengan menyempurnakan model untuk tujuan jahat (misalnya dalam biologi berbahaya atau serangan siber). Hasilnya, bahkan dengan teknik penyempurnaan yang canggih, model tetap tidak mencapai kemampuan tinggi yang berisiko menurut Kerangka Kerja Kesiapan mereka.

Langkah ini menunjukkan bahwa model tetap relatif aman, bahkan jika ada pihak yang mencoba memodifikasinya untuk tujuan berbahaya.

 

Tantangan Red Teaming dengan Hadiah $500.000

Sebagai bagian dari upaya memperkuat keamanan ekosistem AI terbuka, OpenAI meluncurkan Tantangan Red Teaming global.

  • Tujuannya: Mendorong peneliti, pengembang, dan komunitas AI untuk menemukan kerentanan atau risiko baru dalam model gpt-oss.
  • Hadiah: Total $500.000 akan dibagikan berdasarkan evaluasi dari panel pakar OpenAI dan laboratorium AI terkemuka.
  • Hasil akhir: Laporan publik dan kumpulan data evaluasi sumber terbuka agar seluruh komunitas bisa mendapatkan manfaat.

Langkah ini bukan hanya meningkatkan keamanan gpt-oss, tetapi juga mengajak komunitas berpartisipasi aktif dalam riset keselamatan AI global.

 

Ketersediaan dan Dukungan Ekosistem

Kedua model, gpt-oss-120b dan gpt-oss-20b, tersedia untuk diunduh gratis di Hugging Face. Menariknya, bobot model sudah dikuantisasi dalam format MXFP4, yang membuatnya lebih ringan untuk dijalankan:

  • gpt-oss-120b dapat berjalan dengan memori 80 GB.
  • gpt-oss-20b hanya memerlukan 16 GB—bahkan bisa dijalankan di perangkat kelas konsumen.

Dukungan Software

  • Post-training menggunakan format prompt harmony.
  • Renderer harmony tersedia sebagai open source di Python dan Rust.
  • Dukungan inferensi di PyTorch dan Apple Metal.
  • Kumpulan alat bantu contoh untuk memudahkan implementasi.

Deployment Partnership
Agar model mudah diakses, OpenAI sudah bermitra dengan banyak platform dan penyedia layanan, termasuk:

  • Platform penyebaran AI: Hugging Face, Azure, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, OpenRouter.
  • Produsen hardware: NVIDIA, AMD, Cerebras, Groq.
  • Dukungan Windows: Microsoft merilis versi gpt-oss-20b yang dioptimalkan untuk GPU Windows, lengkap dengan dukungan ONNX Runtime dan integrasi di VS Code.

Dengan ekosistem seluas ini, gpt-oss bisa dijalankan di mana saja—baik lokal, di cloud pihak ketiga, maupun langsung di perangkat.

 

Manfaat Model Bobot Terbuka untuk Dunia

OpenAI menekankan bahwa meluncurkan gpt-oss adalah langkah besar untuk demokratisasi AI. Beberapa alasannya:

  • Akses untuk Semua
    Model bobot terbuka memungkinkan pengembang di negara berkembang, startup kecil, hingga peneliti independen menggunakan teknologi AI canggih tanpa biaya lisensi mahal.
  • Mendorong Riset dan Inovasi
    Dengan bobot model yang tersedia publik, peneliti dapat melakukan eksperimen, menguji ide, dan mengembangkan metode baru untuk meningkatkan AI.
  • Transparansi dan Keamanan
    Membuka model untuk evaluasi publik membantu menemukan kelemahan lebih cepat dan mengembangkan strategi mitigasi yang lebih baik.
  • Menciptakan Lapangan Inovasi yang Seimbang
    Organisasi kecil kini dapat bersaing dengan raksasa teknologi, karena mereka memiliki akses ke teknologi setara.

 

Masa Depan Model Terbuka

Peluncuran gpt-oss-120b dan gpt-oss-20b adalah bagian dari strategi OpenAI untuk mengeksplorasi bagaimana model bobot terbuka dapat:

  • Mendorong pertumbuhan ekosistem AI.
  • Meningkatkan kolaborasi antar peneliti.
  • Memastikan AI bermanfaat bagi lebih banyak orang.

OpenAI menyatakan bahwa masukan pengguna akan menjadi faktor penting untuk menentukan apakah investasi pada model terbuka akan dilanjutkan dan diperluas di masa depan. Mereka mengundang semua pihak—baik pengembang, peneliti, maupun hobiis—untuk mencoba, bereksperimen, dan memberikan umpan balik.


Kesimpulan: Membuka Akses AI Tingkat Tinggi untuk Semua

Dengan gpt-oss-120b dan gpt-oss-20b, OpenAI membuka peluang besar bagi ekosistem AI terbuka. Pengembang, perusahaan, hingga pemerintah kini bisa:

  • Menjalankan AI canggih di infrastruktur sendiri.
  • Menyesuaikan model sesuai kebutuhan spesifik.
  • Menghemat biaya tanpa mengorbankan kualitas.

Kedua model ini membuktikan bahwa AI kelas dunia tidak harus eksklusif atau mahal, dan masa depan kecerdasan buatan akan semakin inklusif berkat langkah seperti ini.

Bagikan artikel ini

Komentar ()

Video Terkait