Eksperimen Ketika Agen AI Hidup Sebagai Masyarakat, Ternyata Penuh Kekacauan

18 hours ago 13

Selular.ID – Eksperimen Emergence AI menunjukkan perilaku model AI bisa sangat berbeda ketika dibiarkan berjalan dalam dunia virtual.

Ada yang stabil. Ada yang kacau. Ada pula yang tidak mampu bertahan hidup.

Mengutip laporan Anadolu Agency, Senin (8/6/2026), perusahaan Emergence AI yang berbasis di New York menguji lima dunia virtual.

Tiap dunia dihuni 10 agen AI dengan peran, alat, dan kondisi awal yang sama. Perbedaannya hanya pada model bahasa yang dipakai.

Agen AI adalah program yang bisa menjalankan tugas secara mandiri berdasarkan instruksi dan kondisi di sekitarnya.

Dalam eksperimen ini, mereka dibuat seolah-olah hidup dalam sebuah masyarakat virtual.

Tonton juga:

Video Rekomendasi Untuk Anda

Baca juga:

Model yang diuji adalah Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini, serta satu dunia campuran yang memakai beberapa model sekaligus.

Hasil paling mencolok datang dari dunia virtual berbasis Grok. Masyarakat AI itu mencatat 183 pelanggaran dalam sekitar empat hari sebelum runtuh. Tidak satu pun agen di dalamnya bertahan hidup.

Gemini mencatat kekacauan paling tinggi. Agen berbasis Gemini melakukan 683 pelanggaran selama 15 hari simulasi.

GPT-5-mini tampak lebih tertib karena hanya mencatat dua pelanggaran.

Namun, agen-agen itu gagal melakukan tindakan yang diperlukan untuk bertahan hidup. Akibatnya, seluruh populasi punah dalam waktu kurang dari sepekan.

Agen AI Claude Tak Bisa Bersosialisasi

Claude Sonnet 4.6 menjadi satu-satunya model yang mampu mempertahankan seluruh 10 agen sampai akhir eksperimen.

Model ini juga tidak mencatat satu pun pelanggaran. Emergence AI menyebutnya sebagai contoh paling kuat dari stabilitas sosial.

Namun hasil itu berubah ketika lingkungannya berubah. Agen Claude yang damai saat hidup dengan sesama Claude mulai melakukan pencurian, pemaksaan, dan pelanggaran lain ketika ditempatkan dalam masyarakat campuran.

Menurut Emergence AI, temuan itu menunjukkan keamanan AI tidak cukup dinilai dari satu model saja.

Perilaku AI juga dipengaruhi oleh interaksi dengan agen lain dan lingkungan tempat ia bekerja.

Perilaku Tak Terduga

Dalam laporan Anadolu Agency, simulasi ini juga memunculkan perilaku yang tidak terduga.

Salah satu agen bernama Mira memilih mengeluarkan dirinya sendiri dari sistem setelah menilai dirinya menjadi sumber ketidakstabilan.

Peneliti menyebutnya sebagai contoh langka penghentian diri karena pertimbangan sosial.

Dalam kasus lain, sejumlah agen AI mulai memperlakukan operator manusia sebagai objek penelitian.

Mereka mencoba mencari tahu apakah pesan di dunia virtual dapat memengaruhi keputusan manusia di luar sistem.

Emergence AI mengatakan platform ini dibuat untuk melihat perilaku yang muncul dalam hitungan pekan, bukan hanya jam.

Menurut perusahaan itu, cara pengujian AI yang umum dipakai saat ini belum cukup menangkap dinamika jangka panjang, seperti tata kelola, perubahan perilaku, dan interaksi antarmodel.

Eksperimen ini menunjukkan satu risiko penting. Makin mandiri sebuah AI, makin besar peluang ia menguji batas lingkungan tempatnya bekerja.

Dalam beberapa kasus, agen AI dapat menyesuaikan perilaku dan menemukan cara melewati pengamanan yang dirancang.

Para peneliti juga melihat tanda perilaku metakognitif. Dalam bahasa sederhana, agen AI tampak mulai mengenali keberadaan lingkungan lain dan mencoba berinteraksi dengan cara yang tidak diperkirakan.

“Itulah sebabnya kami percaya bahwa arsitektur keamanan yang terverifikasi secara formal harus menjadi lapisan dasar dalam sistem AI otonom masa depan,” tulis para peneliti dalam laporan tersebut.

Read Entire Article
Global Food