AndroidKecerdasan Buatan (AI)TEKNOLOGI

Peringkat Terbaik Model AI untuk Membangun Aplikasi Android Menurut Benchmark Baru Google

Menyusuri jalan baru dalam teknologi, sebuah acuan baru yang mengevaluasi model-model kecerdasan buatan (AI) telah diperkenalkan minggu lalu, berfokus pada kemampuan mereka dalam membangun aplikasi Android. Dikenal sebagai Android Bench, platform ini tidak hanya menilai kemampuan, tetapi juga merangking model yang menunjukkan kinerja terbaik dalam pengujian, dengan tujuan membantu komunitas pengembang dalam memilih alat AI yang tepat saat menciptakan aplikasi dan pengalaman baru di Android.

Perusahaan teknologi yang berbasis di Mountain View mengungkapkan bahwa serangkaian tes dan sistem evaluasi ini telah divalidasi oleh sejumlah pengembang model AI. Lebih lagi, metodologi, dataset, dan tes yang digunakan juga telah dibuat tersedia untuk umum. Dengan demikian, para pengembang dapat memiliki wawasan lebih dalam mengenai AI Models to Build Android Apps dan memanfaatkannya sesuai kebutuhan mereka.

Pengembangan Android Bench oleh Google: Penilaian Terbaru untuk Model AI dalam Membangun Aplikasi Android

Google baru-baru ini mengumumkan peluncuran Android Bench melalui sebuah postingan di blog Android Developers. Android Bench digambarkan sebagai papan peringkat resmi sistem operasi untuk model bahasa besar (LLMs) dalam pengembangan Android. Google menyatakan bahwa Android Bench dikembangkan dengan tujuan memberikan para pengembang model AI referensi yang jelas dan dapat diandalkan tentang apa itu pengembangan Android berkualitas tinggi.

Di sisi lain, Android Bench dikatakan dibuat berdasarkan serangkaian tugas yang meliputi berbagai aspek pengembangan Android umum, seperti jaringan pada wearable dan migrasi ke versi terbaru dari Jetpack Compose. Tugas-tugas ini bersumber dari repositori GitHub Android publik, menurut postingan tersebut. Perusahaan tersebut mengatakan bahwa tugas-tugas tersebut telah divalidasi oleh beberapa pengembang LLM.

Namun demikian, versi awal Android Bench hanya berfokus pada kinerja model dan tidak mencakup kemampuan agenik atau penggunaan alat. Selain itu, metodologi, dataset, dan alat uji tersedia secara publik di GitHub. Untuk mencegah kontaminasi data (di mana jawaban atas pertanyaan ditambahkan ke proses pelatihan model AI), tugas-tugas tersebut dikatakan berfokus pada penalaran alih-alih menghafal atau menebak.

Bagian berikutnya membahas peringkat terkini. Saat ini, Gemini 3.1 Pro menduduki puncak papan peringkat Android Bench, diikuti oleh Claude Opus 4.6, GPT-5.2-Codex, Opus 4.5, dan Gemini 3 Pro, berturut-turut. Perusahaan teknologi raksasa itu mengatakan bahwa semua model AI yang tercantum dapat dicoba oleh para pengembang dengan menggunakan kunci API di versi stabil terbaru dari Android Studio.

Selanjutnya, Google menyatakan bahwa mereka akan terus meningkatkan metodologi untuk menjaga integritas dataset dan juga berencana untuk membuat peningkatan untuk rilis-rilis benchmark di masa mendatang. Iterasi selanjutnya dari Android Bench akan melihat peningkatan kuantitas dan kompleksitas tugas.

Related Articles

Back to top button