Nvidia Rilis Model AI Open-Source Super Nvidia Nemotron 3 untuk Sistem AI Agentic

Memperkenalkan Nvidia Nemotron 3 Super, sebuah model AI berbasis open-source terbaru dari Nvidia yang dirancang khusus untuk mengatur alur kerja agen yang kompleks. Model ini menghadirkan pendekatan hybrid mixture-of-experts (MoE) yang menonjolkan kemampuan penalaran yang canggih dan diklaim mampu menyelesaikan tugas-tugas dengan tingkat akurasi yang sangat tinggi untuk agen otonom.
Selanjutnya, model inovatif ini telah digunakan oleh berbagai perusahaan AI, termasuk Perplexity, yang mengintegrasikannya ke dalam platform komputer agen terbaru mereka. Model ini juga tersedia di repositori publik sehingga siapa saja yang tertarik dapat mengunduh dan menjalankannya secara lokal.
Peluncuran Model AI Nvidia Nemotron 3 Super Open-Source
Sebagaimana diungkap dalam tulisan blog, raksasa teknologi ini merinci model AI open-source terbaru mereka. Sebagai bagian dari keluarga Nemotron 3, saat ini Nemotron 3 Super di-host di situs web Nvidia, platform Hugging Face, Perplexity, dan OpenRouter. Di sisi lain, model ini juga dihadirkan di Dell Enterprise Hub dan dioptimalkan untuk penyebaran di premis pada Dell AI Factory.
Model terbaru ini mengatasi masalah konteks dan peningkatan biaya penalaran. Model AI yang dikembangkan untuk alur kerja agen cenderung menghasilkan sejumlah token yang lebih banyak, karena interaksi setiap agen atau sub-agen membutuhkan pengiriman konteks penuh. Sama halnya, mengeksekusi tugas-tugas yang kompleks memerlukan pemikiran multi-level, yang dapat meningkatkan biaya menjalankan model secara signifikan.
Bagian berikutnya, dengan arsitektur hybrid-nya, Nemotron 3 Super dilengkapi dengan total 120 miliar parameter dan 12 miliar parameter aktif. Model ini juga memiliki jendela konteks sebanyak satu juta token, yang memungkinkan agen untuk mempertahankan memori alur kerja secara penuh. Tak hanya itu, pengembangannya juga memanfaatkan teknik yang dikenal sebagai Latent MoE, yang meningkatkan akurasi dengan mengaktifkan empat pakar untuk biaya satu dalam menghasilkan token berikutnya pada inferensi.
Sebagai penutup, raksasa teknologi ini mengumumkan bahwa mereka merilis model open-source dengan bobot terbuka di bawah lisensi yang permissive. Mengenai dataset dan pelatihan, perusahaan mengklaim bahwa Nemotron 3 Super dilatih menggunakan data sintetis yang dihasilkan menggunakan model penalaran terdepan. Nvidia mengatakan bahwa mereka menerbitkan metodologi lengkap, termasuk lebih dari 10 triliun token atau dataset pra dan pasca pelatihan, 15 lingkungan pelatihan untuk reinforcement learning dan resep evaluasi.




