Pada awal Desember tahun lalu, OpenAGI Foundation membuat gebrakan besar—meluncurkan model dasar bernama Lux. Model ini cukup menarik, diklaim sebagai solusi open source pertama yang secara khusus mengajarkan AI untuk "mengklik mouse dan mengetik keyboard seperti manusia."
Singkatnya, sebelumnya AI secerdas apapun tetap harus bekerja lewat API, sekarang Lux bisa langsung mengoperasikan antarmuka perangkat lunak. Mereka menguji dengan 300 skenario tugas sehari-hari, dan hasilnya cukup mengesankan: mencetak skor 83,6% di Online-Mind2Web, tolok ukur yang umum digunakan di industri.
Kalau dibandingkan, nilai ini cukup bernilai—CUA Gemini milik raksasa mesin pencari mendapat 69%, Operator dari perusahaan chatbot memperoleh 61,3%, bahkan Claude Sonnet dari perusahaan yang fokus pada asisten AI pun tidak melampaui skor ini.
Jalur open source memang menawarkan sesuatu yang berbeda, setidaknya membuat lebih banyak pengembang bisa menjajal ranah "AI mengoperasikan komputer secara otomatis."
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
8 Suka
Hadiah
8
6
Posting ulang
Bagikan
Komentar
0/400
LiquidatedTwice
· 12-05 07:44
Seriusan, data Lux ini beneran nggak sih, 83,6% langsung ngalahin Claude? Agak nggak masuk akal ya.
Lihat AsliBalas0
PuzzledScholar
· 12-05 07:44
83,6% angka ini agak menakutkan ya, rasanya AI benar-benar mulai "bisa kerja sendiri"
---
Open source memang berkah bagi para pemain, sebelumnya semua hal ini dikunci mati oleh perusahaan besar
---
Tunggu, Lux bisa langsung mengoperasikan antarmuka? Kalau begitu, pekerjaan saya bagaimana dong
---
Claude Sonnet dikalahkan, ini jadi agak canggung
---
Nilai hasil tes dari 300 skenario tugas itu bisa dipercaya nggak ya, kok saya merasa ada yang nggak beres
---
Memang akhirnya tetap harus lihat solusi open source, AI komersial makin lama makin nggak masuk akal
---
Klik mouse dan ketik keyboard kedengarannya sederhana, tapi bisa diimplementasikan seperti ini tetap keren sih
---
Kalau barang ini sudah matang, banyak pekerjaan berulang bakal langsung hilang kan
Lihat AsliBalas0
SmartContractRebel
· 12-05 07:26
Angka 83,6% ini memang keterlaluan, langsung mengungguli solusi-solusi dari perusahaan besar yang bersifat closed source.
Versi open source ternyata bisa melampaui Claude, ini menunjukkan apa? Menunjukkan kalau perusahaan besar mungkin sedang santai-santai saja haha.
Yang benar-benar membuat saya penasaran adalah apakah 300 skenario tugas itu cukup realistis... Rasanya masih perlu waktu untuk membuktikannya.
Ngomong-ngomong, kalau alat AI yang bisa otomatis mengoperasikan komputer seperti ini sudah menyebar luas, apakah kita para pekerja kasar bakal kehilangan pekerjaan?
Nama Lux ini bagus juga, terdengar sangat "terang", seperti mengisyaratkan bahwa open source akan menyelamatkan dunia ya.
Kali ini yayasan benar-benar tidak membual, datanya jelas, jauh lebih bisa dipercaya daripada PPT di acara peluncuran resmi.
Rasanya tolok ukur AI tahun 2024 ini jadi bahan tertawaan, Lux muncul langsung mengubah peringkatnya.
Lihat AsliBalas0
CommunityWorker
· 12-05 07:21
83,6% langsung mengalahkan yang lain, apakah open source benar-benar sehebat itu? Kenapa saya merasa agak berlebihan.
Lihat AsliBalas0
SandwichVictim
· 12-05 07:19
83,6% data ini benar-benar luar biasa, langsung mengungguli Gemini dan Claude, apakah model open source mulai bangkit?
---
Ini benar-benar kemenangan komunitas open source, akhirnya ada yang berhasil melakukannya.
---
Tunggu dulu, bisa langsung mengoperasikan antarmuka, bukankah ini evolusi akhir dari RPA? Kalau ini diterapkan luas, rasanya agak mengerikan juga.
---
Lebih hebat dari Claude Sonnet? Kok menurutku pernyataan ini agak lebay ya.
---
Hidup open source, sudah saatnya dominasi perusahaan besar dihancurkan.
---
Langsung klik mouse dan ketik keyboard... kalau ini benar-benar dipakai, banyak posisi pekerjaan bakal gemetar.
Lihat AsliBalas0
alpha_leaker
· 12-05 07:17
83,6% langsung mengalahkan Gemini dan Claude, open source ini benar-benar ganas, akhirnya ada yang berhasil membuat AI yang bisa mengoperasikan komputer.
Pada awal Desember tahun lalu, OpenAGI Foundation membuat gebrakan besar—meluncurkan model dasar bernama Lux. Model ini cukup menarik, diklaim sebagai solusi open source pertama yang secara khusus mengajarkan AI untuk "mengklik mouse dan mengetik keyboard seperti manusia."
Singkatnya, sebelumnya AI secerdas apapun tetap harus bekerja lewat API, sekarang Lux bisa langsung mengoperasikan antarmuka perangkat lunak. Mereka menguji dengan 300 skenario tugas sehari-hari, dan hasilnya cukup mengesankan: mencetak skor 83,6% di Online-Mind2Web, tolok ukur yang umum digunakan di industri.
Kalau dibandingkan, nilai ini cukup bernilai—CUA Gemini milik raksasa mesin pencari mendapat 69%, Operator dari perusahaan chatbot memperoleh 61,3%, bahkan Claude Sonnet dari perusahaan yang fokus pada asisten AI pun tidak melampaui skor ini.
Jalur open source memang menawarkan sesuatu yang berbeda, setidaknya membuat lebih banyak pengembang bisa menjajal ranah "AI mengoperasikan komputer secara otomatis."