Rilis Terbaru GPT-5.4 AI Models oleh OpenAI dengan Kemampuan Penggunaan Komputer Agentic

Perkembangan terbaru dalam dunia kecerdasan buatan (AI) datang dalam bentuk GPT-5.4 AI Models, yang diluncurkan oleh OpenAI. Model AI yang inovatif ini merupakan update terbaru dari seri GPT-5, menawarkan peningkatan signifikan di berbagai parameter dan kemampuan baru dalam penggunaan komputer. Berbeda dengan pendahulunya, GPT-5.3-Codex yang secara eksklusif dirancang untuk platform Codex, model bahasa besar (LLM) yang baru ini dirilis untuk ChatGPT dan antarmuka pemrograman aplikasi (API).
Selanjutnya, penyempurnaan tidak berhenti di sana. OpenAI juga memperkenalkan versi yang lebih canggih dari model ini, yang dikenal sebagai GPT-5.4 Pro. Rilis terbaru ini membuktikan komitmen OpenAI dalam mendorong batas kemampuan dan kapabilitas teknologi AI, menghadirkan solusi AI yang semakin canggih dan responsif untuk berbagai aplikasi dan platform.
OpenAI Memperkenalkan Model AI GPT-5.4 dengan Kemampuan Luar Biasa
Di dalam sebuah pengumuman, raksasa AI ini memperkenalkan dan menjelaskan rilis model AI baru mereka. GPT-5.4 kini tersedia baik pada Codex dan API, serta pada ChatGPT sebagai GPT-5.4 Thinking. Saat peluncuran, model ini hanya tersedia untuk pelanggan Plus, Team, dan Pro, menggantikan GPT-5.2 Thinking. Sementara itu, GPT-5.4 Pro saat ini hanya tersedia untuk pelanggan Pro dan Enterprise.
OpenAI menyatakan bahwa model GPT-5.4 membawa peningkatan dalam penalaran, pemrograman, dan alur kerja agen. Model ini menggabungkan kemampuan pemrograman dari 5.3-Codex, serta meningkatkan perilaku umum ketika bekerja dengan alat dan melaksanakan tugas yang melibatkan spreadsheet, presentasi, dan dokumen.
Namun, kemampuan baru yang paling menarik adalah penggunaan komputer. Hal ini merujuk pada kemampuan LLM untuk menerapkan agen AI yang dapat mengakses mesin virtual dan melaksanakan tugas kompleks yang melibatkan penelusuran web, pemesanan, dan lainnya. OpenAI mengklaim GPT-5.4 dapat menulis kode untuk mengoperasikan komputer, mengeluarkan perintah mouse dan keyboard, dan memiliki perilaku yang dapat diarahkan.
Berdasarkan evaluasi internal, raksasa AI ini mengklaim bahwa model ini meraih tingkat keberhasilan 75 persen pada tes benchmark OSWorld-Verified, yang mengukur kemampuan model untuk menavigasi lingkungan desktop melalui screenshot dan aksi mouse dan keyboard.
Di sisi lain, OpenAI mengatakan bahwa kemampuan penggunaan komputer model ini ditingkatkan oleh kemampuan persepsi visualnya yang ditingkatkan. Pada benchmark MMMU-Pro, yang mengukur penalaran visual model AI, GPT-5.4 mencetak tingkat keberhasilan sebesar 81.2 persen.
Mengenai keamanan, perusahaan menyatakan bahwa GPT-5.4 diklasifikasikan sebagai High cyber capability, dan diterapkan dengan tumpukan keamanan siber yang diperluas yang mencakup sistem pemantauan, kontrol akses yang terpercaya, dan pemblokiran asinkron. OpenAI juga memperkenalkan chain-of-thought (CoT) controllability sebagai evaluasi open-source baru. Ini mengukur apakah model dapat dengan sengaja menyamarkan penalarannya untuk menghindari pemantauan.




