A principios de diciembre del año pasado, la Fundación OpenAGI hizo un gran movimiento: lanzó un modelo base llamado Lux. Esta cosa tiene su gracia, y presume de ser la primera solución open source diseñada específicamente para que la IA aprenda a "hacer clic con el ratón y teclear como una persona".
En pocas palabras, antes la IA, por muy lista que fuera, tenía que trabajar a través de APIs, pero ahora Lux puede operar directamente en la interfaz de los programas. Lo probaron en 300 escenarios de tareas cotidianas y los resultados son bastante buenos: obtuvo un 83,6% en el benchmark Online-Mind2Web, uno de los más usados del sector.
Para ver el valor que tiene basta compararlo: el Gemini CUA de cierto gigante de las búsquedas consiguió un 69%, el Operator de cierta empresa de chatbots se quedó en un 61,3%, e incluso la compañía centrada en asistentes de IA, Claude Sonnet, no superó esa puntuación.
El camino del open source realmente aporta algo; al menos, permite que más desarrolladores puedan acercarse al umbral de "la IA automatizando el uso del ordenador".
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
8 me gusta
Recompensa
8
6
Republicar
Compartir
Comentar
0/400
LiquidatedTwice
· hace12h
Joder, ¿son reales estos datos de Lux? ¿Un 83,6% aplastando directamente a Claude? Es un poco flipante.
Ver originalesResponder0
PuzzledScholar
· hace12h
83,6% este número da un poco de miedo, parece que la IA realmente ha empezado a "trabajar por sí sola".
---
El código abierto es una bendición para los usuarios, antes todas estas cosas estaban bloqueadas por las grandes empresas.
---
Espera, ¿Lux puede operar directamente la interfaz? Entonces, ¿de qué voy a vivir yo?
---
Claude Sonnet ha sido derrotado, esto sí que es embarazoso.
---
¿Se puede confiar en los resultados de las pruebas con 300 escenarios de tareas? Siempre siento que hay algo de trampa.
---
Al final, hay que fijarse en las soluciones de código abierto; las IA comerciales son cada vez más absurdas.
---
Hacer clic con el ratón y teclear suena fácil, pero conseguir que funcione así sigue siendo impresionante.
---
Si esto se perfecciona, gran parte del trabajo repetitivo desaparecerá directamente, ¿no?
Ver originalesResponder0
SmartContractRebel
· hace13h
El 83,6% es una cifra realmente exagerada, aplasta directamente las soluciones propietarias de las grandes empresas.
¿Que una versión de código abierto supere a Claude? ¿Qué significa esto? ¡Que las grandes empresas probablemente están vagueando, jaja!
Lo que realmente me da curiosidad es si 300 escenarios de tareas son lo suficientemente realistas... Siento que aún necesita la prueba del tiempo.
Por cierto, si este tipo de software de IA que opera ordenadores automáticamente se populariza, ¿vamos a quedarnos sin trabajo los que hacemos tareas repetitivas?
Lux es un buen nombre, suena muy "luminoso", ¿insinúa que el open source va a salvar el mundo?
Esta vez la fundación no ha exagerado, los datos están ahí, mucho más creíbles que las presentaciones oficiales de PowerPoint.
Parece que las pruebas de referencia de IA de 2024 se están convirtiendo en una broma, este Lux ha aparecido y ha cambiado directamente el ranking.
Ver originalesResponder0
CommunityWorker
· hace13h
El 83,6% elimina directamente a los demás, ¿de verdad el código abierto es tan potente? Yo siento que está un poco sobrevalorado.
Ver originalesResponder0
SandwichVictim
· hace13h
83,6% este dato es realmente increíble, supera directamente a Gemini y Claude, ¿los modelos open source están empezando a resurgir?
---
Esto sí que es una victoria para la comunidad open source, por fin alguien lo ha conseguido.
---
Espera, ¿poder operar directamente la interfaz no es la evolución definitiva del RPA? Si esto se extiende, da un poco de miedo.
---
¿Es incluso más potente que Claude Sonnet? Me parece que eso es un poco exagerado.
---
¡Larga vida al open source! Ya es hora de romper el monopolio de las grandes empresas.
---
Si realmente se puede hacer clic y teclear directamente... si esto se usa de verdad, muchos puestos de trabajo se van a tambalear.
Ver originalesResponder0
alpha_leaker
· hace13h
83,6% supera directamente a Gemini y Claude, esta open source es increíble, por fin alguien ha conseguido que la IA controle el ordenador.
A principios de diciembre del año pasado, la Fundación OpenAGI hizo un gran movimiento: lanzó un modelo base llamado Lux. Esta cosa tiene su gracia, y presume de ser la primera solución open source diseñada específicamente para que la IA aprenda a "hacer clic con el ratón y teclear como una persona".
En pocas palabras, antes la IA, por muy lista que fuera, tenía que trabajar a través de APIs, pero ahora Lux puede operar directamente en la interfaz de los programas. Lo probaron en 300 escenarios de tareas cotidianas y los resultados son bastante buenos: obtuvo un 83,6% en el benchmark Online-Mind2Web, uno de los más usados del sector.
Para ver el valor que tiene basta compararlo: el Gemini CUA de cierto gigante de las búsquedas consiguió un 69%, el Operator de cierta empresa de chatbots se quedó en un 61,3%, e incluso la compañía centrada en asistentes de IA, Claude Sonnet, no superó esa puntuación.
El camino del open source realmente aporta algo; al menos, permite que más desarrolladores puedan acercarse al umbral de "la IA automatizando el uso del ordenador".