OpenAI Luncurkan ChatGPT Agent: AI yang Bisa Mengontrol Browser Sendiri!










2025-07-17T20:41:52Z

Pernahkah Anda membayangkan sebuah AI yang tidak hanya menjawab pertanyaan, tetapi juga dapat melakukan tugas multi-langkah secara mandiri? Pada hari Kamis, OpenAI memperkenalkan ChatGPT Agent, fitur baru yang memungkinkan asisten AI perusahaan ini untuk menyelesaikan tugas dengan mengontrol browser webnya sendiri.
Update ini menggabungkan kemampuan dari alat Operator sebelumnya dan fitur Deep Research, memungkinkan ChatGPT untuk menavigasi situs web, menjalankan kode, dan membuat dokumen saat pengguna tetap mengendalikan proses tersebut. Bayangkan Anda meminta AI untuk merencanakan makan malam, atau bahkan membeli pakaian baru untuk acara tertentu — dengan ChatGPT Agent, semua itu menjadi mungkin!
Fitur ini menandai langkah terbaru OpenAI dalam apa yang disebut industri teknologi sebagai “AI agentic” — sistem yang dapat mengambil tindakan multi-langkah secara otonom atas nama pengguna. OpenAI menyatakan bahwa pengguna dapat meminta Agent untuk menangani permintaan seperti merakit dan membeli pakaian untuk suatu acara, membuat presentasi PowerPoint, merencanakan menu, atau memperbarui spreadsheet keuangan dengan data terbaru.
Sistem ini menggunakan kombinasi browser web, akses terminal, dan koneksi API untuk menyelesaikan tugas ini, termasuk “ChatGPT Connectors” yang terintegrasi dengan aplikasi seperti Gmail dan GitHub. Menggunakan Agent, pengguna akan melihat jendela di dalam antarmuka ChatGPT yang menunjukkan semua tindakan AI yang terjadi di dalam sandbox-nya sendiri. Sandbox ini memiliki sistem operasi virtual dan browser web dengan akses ke Internet yang nyata; ia tidak mengontrol perangkat pribadi Anda.
“ChatGPT melaksanakan tugas ini menggunakan komputernya sendiri, berpindah dengan lancar antara penalaran dan tindakan untuk menangani alur kerja kompleks dari awal hingga akhir, semua berdasarkan instruksi Anda,” tulis OpenAI.
Seperti halnya Operator sebelumnya, fitur agent ini memerlukan izin pengguna sebelum mengambil tindakan tertentu yang memiliki konsekuensi di dunia nyata, seperti melakukan pembelian. Pengguna dapat menginterupsi tugas kapan saja, mengambil alih browser, atau menghentikan operasi sepenuhnya. Sistem ini juga menyertakan “Mode Pengawasan” untuk tugas seperti mengirim email yang memerlukan pengawasan aktif dari pengguna.
Karena Agent melebihi kapasitas Operator, OpenAI menyatakan bahwa situs pratinjau Operator sebelumnya akan tetap berfungsi selama beberapa minggu ke depan sebelum ditutup.
Tapi, klaim performa OpenAI adalah satu hal, dan seberapa baik agen AI baru ini benar-benar menyelesaikan tugas multi-langkah akan sangat bervariasi tergantung pada situasinya. Ini karena model AI ini bukanlah bentuk kecerdasan pemecahan masalah yang lengkap, melainkan peniru yang kompleks. Meskipun memiliki fleksibilitas dalam merangkai skenario, ia juga memiliki banyak titik buta. OpenAI melatih agen ini (dan komponen-komponennya) menggunakan contoh penggunaan komputer dan penggunaan alat; apa pun yang di luar contoh yang diserap dari data pelatihan kemungkinan besar masih akan sulit untuk dicapai.
Lars Andersen
Source of the news: Ars Technica