Análisis de OpenRouter sobre 100 billones de tokens: ¿Para qué usan los humanos la IA, el auge de los modelos chinos y el secreto de la retención de usuarios?

robot
Generación de resúmenes en curso

El informe de OpenRouter revela que la IA está entrando en la era del razonamiento de agentes, que los modelos open source chinos están emergiendo con fuerza en el mercado global gracias a sus capacidades de roleplay y programación, y comparte escenarios reales de uso por parte de los usuarios.

(Resumen anterior: Cathie Wood declara que “la IA no es una burbuja”: Está replicando el momento de explosión de riqueza de Internet) (Contexto adicional: ¡Google lanza oficialmente “Gemini 3”! Se corona como el modelo de IA más inteligente del mundo, ¿cuáles son sus puntos destacados?)

La plataforma de agregación de modelos de IA OpenRouter ha publicado esta semana su informe anual de referencia, el «Informe sobre el Estado de la IA 2025». Este informe no se basa en encuestas ni en el sensacionalismo mediático, sino en un análisis empírico de los datos de 100 billones (100 Trillion) de tokens generados en la plataforma OpenRouter.

Estos datos abarcan más de 300 modelos de lenguaje de gran tamaño (LLM) y más de 60 proveedores, ofreciéndonos una nueva perspectiva para vislumbrar “cómo se está utilizando realmente la IA” en el mundo real.

Cambio de paradigma: de “predecir la siguiente palabra” al “razonamiento de agentes” Si hasta 2024 la competencia en IA consistía en ver quién podía escribir de forma más fluida en juegos de cadena de palabras, el tema central de 2025 será “pensar”. El informe señala que el año pasado marcó un verdadero punto de inflexión en la evolución de los LLM.

o1: el inicio de la era de los modelos de razonamiento El informe define el 5 de diciembre de 2024 como el punto de inflexión clave de la industria, día en que OpenAI lanzó el primer modelo de razonamiento ampliamente adoptado: o1. Hasta ese momento, incluso los modelos más potentes (como Claude 3.5 Sonnet o GPT-4) eran esencialmente predictores probabilísticos de una sola pasada hacia adelante. Se basaban en patrones de los datos de entrenamiento para imitar el razonamiento, en lugar de realizar cálculos internos reales.

La aparición de o1 lo cambió todo. Introdujo procesos de cálculo durante la inferencia; el modelo, antes de proporcionar una respuesta final, realiza deliberaciones internas en varios pasos, planificación latente y autocorrección.

Datos como evidencia: Según las estadísticas de OpenRouter, desde principios de 2025, la proporción de tokens destinados a “modelos optimizados para el razonamiento” ha crecido exponencialmente. A finales de 2025, más del 50% del uso de tokens ya está involucrando este tipo de modelos capaces de pensar. Esto significa que los usuarios ya no ven la IA solo como un chatbot, sino como un “cerebro” capaz de resolver problemas lógicos complejos.

El auge de los workflows de agentes Paralelamente al aumento de las capacidades de razonamiento, “los workflows de agentes” se han convertido en otra palabra clave. Los usuarios han comenzado a construir sistemas de automatización complejos en los que el modelo no solo responde preguntas, sino que “toma acciones”.

El informe analiza especialmente los datos sobre “invocación de herramientas”. Esto se refiere a la capacidad de los modelos de IA para utilizar herramientas externas (como buscar en Internet, ejecutar programas o consultar bases de datos).

Tendencia: El uso de la invocación de herramientas muestra una tendencia de aumento estable y significativa durante todo 2025.

Panorama de modelos: Inicialmente, este campo estuvo dominado por gpt-4o-mini de OpenAI y la serie Claude 3.5 de Anthropic. Pero en la segunda mitad del año, el mercado se diversificó rápidamente, y modelos como Gemini Flash de Google, Grok Code Fast de xAI y GLM 4.5 de China se pusieron al día rápidamente en capacidades de uso de herramientas, impulsando la adopción de la automatización a nivel empresarial.

La guerra entre open source y propietarios: el auge de los modelos chinos En cuanto al ecosistema de modelos, el informe revela un mundo dual en el que, aunque los modelos propietarios siguen liderando en ingresos, los modelos open source (OSS) ocupan posiciones clave en innovación y dominios específicos.

Los modelos propietarios aún dominan, pero el open source gana terreno Aunque los modelos propietarios (como GPT-5, Claude 4.5) aún representan cerca del 70% del consumo total de tokens, la cuota de mercado de los modelos open source ha crecido de forma muy pronunciada en el último año, acercándose ya al 30%.

Esto indica que cada vez más desarrolladores y empresas buscan un equilibrio entre control, privacidad y coste, y los modelos open source de alta calidad ofrecen esa opción.

El dominio de los modelos open source chinos Un hallazgo destacado del informe: los modelos open source desarrollados en China ya se han convertido en la columna vertebral del ecosistema global de código abierto.

Jugadores clave: Las series Qwen (通义千问) de Alibaba, DeepSeek (深度求索) y Kimi de Moonshot AI, entre otros, ocupan una proporción muy significativa de las llamadas globales en OpenRouter.

Ventajas competitivas: El informe destaca que el rápido auge de los modelos chinos se debe principalmente a sus “ciclos de iteración intensivos” y a la “alta calidad competitiva de los modelos”. Por ejemplo, el rendimiento de Qwen 2.5 Coder en el ámbito de la programación desafía directamente la posición de muchos modelos propietarios.

Posicionamiento diferencial: Los datos muestran que los modelos open source chinos aplican relativamente menos “filtros de contenido” (en comparación con los estrictos cortafuegos de seguridad de algunos modelos occidentales), lo que los hace más populares entre los usuarios globales en escenarios de escritura creativa, roleplay y continuación de historias.

Evolución “en M” del tamaño de modelos Dentro del mercado open source también se observan cambios estructurales interesantes:

Declive de los modelos pequeños: A pesar de que Google lanzó modelos pequeños como Gemma, el uso general está en descenso. Los usuarios encuentran que el techo intelectual de los modelos pequeños limita su aplicación en tareas complejas.

La era dorada de los modelos medianos: Modelos en torno a los 32B (32.000 millones de parámetros) se han convertido en el “punto dulce”. Ejemplificado por Qwen 2.5 Coder 32B, este tipo de modelos ha encontrado un equilibrio perfecto entre rendimiento y coste de razonamiento, logrando un ajuste ideal modelo-mercado (Model-Market Fit).

Diversificación de los modelos grandes: En el rango de 70B a 200B+ parámetros, el mercado no está monopolizado por un solo modelo, sino que muestra una competencia diversificada (por ejemplo, la serie Llama 3, Qwen 72B, etc.), con los usuarios cambiando entre grandes modelos según la tarea específica.

Escenarios reales: ¿para qué usan los humanos la IA? Quizá esta sea la parte más reveladora del informe. Mediante el sistema de clasificación GoogleTagClassifier de OpenRouter, el equipo de investigación clasificó el contenido de miles de millones de solicitudes. Los resultados rompen muchos estereotipos sobre que “la IA se usa principalmente para productividad empresarial”.

Roleplay Los datos muestran que los juegos de rol (roleplay) constituyen la mayor categoría de uso para modelos open source, superando el 60% del total.

Fenómeno: Un gran número de usuarios utiliza la IA para diálogos con personajes virtuales, creación de novelas interactivas y experiencias de juego inmersivas. No se trata solo de un nicho, sino de un mercado de demanda masiva.

Factores impulsores: Los usuarios prefieren los modelos open source para roleplay, principalmente porque estos modelos (especialmente los desarrollados fuera de EE. UU.) suelen tener menos restricciones de censura y pueden ofrecer experiencias más ricas y libres.

Valor comercial: Estos usuarios muestran una asombrosa fidelidad, estableciendo profundos lazos emocionales y hábitos de uso en torno a modelos específicos.

Programación La siguiente categoría más relevante es la de programación, que también es una de las que crecen más rápidamente…

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)