Bagaimana “agen AI” Yang Menjelajahi Internet Suatu Hari Nanti Bisa Menggantikan Karyawan
Chatbot ChatGPT yang populer dirancang untuk menghasilkan teks digital, mulai dari puisi, makalah penelitian, hingga program komputer. Namun ketika tim peneliti kecerdasan buatan di perusahaan chip komputer Nvidia mendapatkan teknologi yang mendasari chatbots, mereka menyadari bahwa mereka bisa berbuat lebih banyak.
Dalam beberapa minggu, mereka mengajarinya cara bermain Minecraft, salah satu video game paling populer di dunia. Di dunia digital Minecraft, AI dapat belajar berenang, mengumpulkan tanaman, berburu babi, menambang emas, dan membangun rumah.
“Dia bisa memasuki dunia Minecraft dan menjelajah sendiri, mengumpulkan material sendiri, dan meningkatkan semua jenis keterampilan,” kata Linxi Fan, peneliti senior di Nvidia yang dikenal sebagai Jim.
Proyek ini merupakan tanda awal bahwa para peneliti AI terkemuka di dunia mengubah chatbot menjadi sistem otonom jenis baru yang disebut agen AI. Agen-agen ini dapat melakukan lebih dari sekedar chatting. Mereka mungkin menggunakan aplikasi perangkat lunak, situs web, dan alat online lainnya, termasuk spreadsheet, kalender online, situs web perjalanan, dan banyak lagi.
Banyak peneliti mengatakan bahwa seiring berjalannya waktu, agen AI akan menjadi jauh lebih canggih dan dapat menggantikan pekerja kantoran serta mengotomatiskan hampir semua fungsi manajemen.
“Ini adalah peluang bisnis yang sangat besar, berpotensi bernilai triliunan dolar,” kata Jeff Clune, profesor ilmu komputer di Universitas British Columbia yang sebelumnya bekerja dengan teknologi sejenis sebagai seorang peneliti di OpenAI, yaitu sebuah startup yang membuat ChatGPT. “Hal ini mempunyai manfaat yang sangat besar dan konsekuensi serius bagi masyarakat imbuhnya.”
Saat staff Nvidia sedang memainkan permainannya. Staff tersebut juga dapat dapat menjadwalkan rapat, mengedit file, menganalisis data, dan membuat diagram batang berwarna. Idenya adalah bahwa sistem otomatis ini pada akhirnya akan berfungsi sebagai asisten pribadi yang mampu menangani berbagai tugas online.
Agen saat ini terbatas dan tidak dapat mengatur hidup Anda secara akurat. ChatGPT dapat mencari penerbangan ke New York di situs perjalanan Expedia, tetapi Anda tetap harus memesan langsung.
Ketika para peneliti meningkatkan teknologi ini, hal ini dapat membuat pekerja kantor dan konsumen menjadi lebih efisien. Hal ini juga dapat mengubah sifat video game dengan menawarkan bot baru untuk dimainkan dan diajak ngobrol oleh pemain.
GPT-4, teknologi yang mendukung ChatGPT, inilah yang oleh para peneliti disebut sebagai model bahasa besar. Ini adalah sistem kecerdasan buatan yang mempelajari teknologi dengan menganalisis data dalam jumlah besar.
Selama beberapa bulan terakhir, teknologi ini telah membuat kagum ratusan juta orang dengan kemampuannya menulis email, menulis pidato, dan menyanyikan lagu tentang hampir semua topik. Namun mungkin keahliannya yang paling penting adalah bakatnya menulis program komputer.
Dia bisa langsung menggambar unicorn di layar laptopnya atau membuat program untuk menjatuhkan kepingan salju secara digital. Pengembang perangkat lunak profesional dapat meminta kode yang dapat diintegrasikan ke dalam program yang lebih besar, termasuk segala sesuatu mulai dari aplikasi media sosial hingga mesin pencari. Namun ini hanyalah gambaran sekilas tentang apa yang dapat dilakukan oleh teknologi ini. Mereka juga dapat menghasilkan kode komputer yang dapat digunakan dalam aplikasi perangkat lunak dan situs web lain.
Seperti inilah cara Dr. Fan dan peneliti Nvidia lainnya mengajari GPT-4 cara bermain Minecraft. “Kata yang paling penting di sini adalah kode,” kata Dr. Fan. “Kode dapat mengambil tindakan”
Orang-orang menggunakan aplikasi perangkat lunak dan situs web dengan menyentuh tombol, menu, dan alat grafis lainnya. Agen AI menggunakan aplikasi dan situs web dengan mengakses antarmuka pemrograman aplikasi (API), kode perangkat lunak dasar yang memungkinkan mereka berkomunikasi dengan layanan online lainnya.
Misalnya, jika Anda meminta agen untuk mengunggah video ke Internet, agen tersebut dapat menghasilkan kode yang disebut antarmuka pemrograman aplikasi (API) yang disediakan oleh YouTube. “API hanyalah teks yang digunakan untuk berbicara dengan mesin,” kata Selin Nayhin, peneliti yang membantu menjalankan proyek agen AI otonom AutoGPT.
Secara teori, chatbot dapat menulis kode untuk mengakses API apa pun di internet. Namun, chatbot saat ini tidak cukup terampil untuk melakukan lebih dari sekadar tugas sederhana. Bahkan jika itu masalahnya, membiarkan mereka berkeliaran secara online dengan bebas akan menimbulkan risiko keamanan yang sangat besar. Jadi perusahaan itu dimulai dari yang kecil.
Beberapa bulan setelah peluncuran ChatGPT, OpenAI diam-diam merilis cara bagi chatbot untuk melakukan lebih dari sekadar menghasilkan teks. Setelah menginstal sejumlah plug-in, perangkat lunak yang meningkatkan fungsi bot, Anda dapat memintanya untuk mencari penerbangan yang tersedia di situs perjalanan seperti Expedia, mengimpor peta kota dari Google Earth, atau bahkan mengonversi spreadsheet yang merinci pengeluaran tahunan Anda. ..bagan batang multiwarna.
ChatGPT menyertakan plugin yang disebut kompiler kode, sehingga Anda tidak hanya dapat menulis kode tetapi juga menjalankannya. Hal ini memungkinkan Anda melakukan hal-hal yang sebelumnya tidak dapat Anda lakukan, seperti mengedit spreadsheet atau mengonversi gambar diam menjadi video. Google, Microsoft, dan perusahaan lain sedang menjajaki teknologi serupa.
“Ini adalah proyek yang membayangkan AI berkolaborasi dengan AI lain atas nama pengguna,” kata Ashley Lawrence, wakil presiden Microsoft.
Proyek independen seperti AutoGPT mencoba melakukan pekerjaan semacam ini beberapa langkah lebih jauh. Idenya adalah untuk memberikan tujuan sistem seperti “memulai perusahaan” atau “menghasilkan uang”. Kemudian tanyakan pada diri Anda pertanyaan dan temukan cara untuk terhubung ke layanan Internet lain untuk mencapai tujuan tersebut.
Ini tidak bekerja dengan baik hari ini. Sistem seperti AutoGPT cenderung terjebak dalam putaran tak terbatas. Tapi para peneliti seperti Dr. Fan terus berupaya membuat teknologi jenis ini lebih berguna dan dapat diandalkan.
Peneliti lain sedang membangun agen kecerdasan buatan jenis baru yang dirancang untuk menggunakan perangkat lunak. Pada musim panas tahun 2022, Dr. Clune adalah bagian dari tim peneliti OpenAI yang membangun agen yang dapat menggunakan program komputer seperti manusia – klik mouse demi klik mouse, penekanan tombol demi penekanan tombol.
Dr. Clune dan rekan-rekannya memberi jam sistem video online yang menunjukkan orang-orang bermain Minecraft. Dengan menganalisis bagaimana orang menggunakan mouse dan keyboard mereka untuk menavigasi dunia digital Minecraft, sistem mempelajari cara menjalankan game itu sendiri.
Perusahaan lain, termasuk startup bernama Adept, sedang membangun agen serupa yang menggunakan situs web seperti Wikipedia, Redfin, Craigslist, dan aplikasi perkantoran populer dari perusahaan seperti Salesforce.
Dr. Clune mengatakan jenis agen ini pada akhirnya akan memungkinkan AI untuk menggunakan lebih banyak aplikasi perangkat lunak dan situs web. Setiap orang akan memiliki akses ke asisten digital yang memungkinkan mereka melakukan hampir semua hal di Internet, katanya. Hal ini tidak hanya membuat hidup lebih mudah, tetapi juga dapat menggantikan banyak pekerjaan.
“Jika kecerdasan buatan dapat melakukan semua yang kita bisa lakukan, maka itu tidak hanya akan menggantikan tugas-tugas yang membosankan,” katanya. “Itu akan mengganti semua pekerjaan.”