QVAC Genesis II Desbloqueia 148 Mil milhões de Tokens de IA para Pesquisa Aberta de IA

Dados do Tether mudaram fundamentalmente a forma como o mundo acessa recursos de treino para inteligência artificial. Ao expandir seu conjunto de dados QVAC Genesis II para 148 bilhões de tokens de IA em 19 domínios acadêmicos, a iniciativa preenche uma lacuna estrutural no ecossistema de IA: a maior parte dos dados avançados de treino permanece bloqueada em sistemas proprietários controlados por poucas grandes corporações. Este lançamento posiciona o QVAC Genesis II como o maior recurso educacional sintético de acesso gratuito do planeta, adicionando 107 bilhões de tokens ao Genesis I anterior e democratizando o acesso a fundamentos de treino de alta qualidade.

O momento é importante. À medida que os sistemas de IA moldam cada vez mais decisões em educação, finanças, saúde e pesquisa, a capacidade de treinar modelos de forma independente de plataformas de nuvem centralizadas tornou-se crítica. O Tether Data aproveitou esse momento para lançar o que equivale a um bem público — um enorme corpus projetado não apenas para fluência, mas para raciocínio e explicação.

Base de Treino Massiva: Como 148 Bilhões de Tokens de IA Mudam o Jogo

A escala do QVAC Genesis II redefine o que é possível para pesquisadores que atuam fora de ecossistemas fechados. O conjunto de dados de 148 bilhões de tokens de IA abrange 19 áreas acadêmicas estruturadas, cada uma cuidadosamente construída para apoiar modelos que precisam explicar seu raciocínio, em vez de simplesmente prever a próxima palavra. Essa distinção é fundamental.

Conjuntos de dados tradicionais focam na fluência — a capacidade de gerar textos plausíveis. O QVAC Genesis II inverte essa prioridade. Cada um dos 148 bilhões de tokens contribui para uma pipeline de treino projetada para desenvolver clareza de raciocínio e compreensão causal. Isso significa que os pesquisadores podem construir sistemas de IA que mostram seu trabalho, justificam conclusões e reconhecem incertezas, em vez de falar com confiança injustificada.

A expansão do Genesis I representa um avanço de 107 bilhões de tokens. Essa escala importa não apenas pelo volume, mas pela consistência. Modelos treinados com repositórios maiores e cuidadosamente curados de tokens de IA alcançam maior precisão no raciocínio e fornecem resultados mais confiáveis em diversos domínios.

O conjunto de dados permanece totalmente aberto via Hugging Face, com documentação e ferramentas de acesso. O Tether Data lançou-o sob licença Creative Commons Atribuição–Não Comercial 4.0, preservando o uso acadêmico e de pesquisa, ao mesmo tempo que mantém os requisitos de atribuição.

Além da Correspondência de Padrões: Raciocínio em Nível de Opção Revoluciona a Qualidade do Treino

No coração do Genesis II está um método inovador de geração de dados chamado Raciocínio em Nível de Opção. Em vez de tratar uma questão de múltipla escolha como tendo uma única resposta correta, a abordagem avalia todas as opções — respostas corretas e equívocos comuns. Cada escolha errada é examinada para entender por que ela falha; cada resposta correta, para entender por que ela funciona.

Essa metodologia baseia-se diretamente nas técnicas de análise de falhas introduzidas no Genesis I. Juntas, criam uma arquitetura de pipeline duplo que garante que cada item de treino gerado ofereça valor instrucional. A técnica força os modelos a envolver-se com a lógica por trás das decisões, não apenas memorizar padrões.

Avaliações independentes demonstram os benefícios. Modelos treinados com dados do Genesis II produzem respostas mais claras, mantêm maior precisão de raciocínio e apresentam desempenho mais consistente em tarefas variadas. Ao reorientar o treino para uma compreensão estruturada, em vez de apenas fluência, o Raciocínio em Nível de Opção muda o que os sistemas de IA podem fazer de forma confiável.

Quebrando a Centralização: Como Tokens de IA Abertos Permitem Pesquisa Distribuída

A missão mais ampla do Tether Data alinha-se com uma convicção crescente: o desenvolvimento descentralizado de IA representa o futuro do setor. A maior parte do treino de modelos hoje depende de infraestrutura de nuvem centralizada controlada por poucos gigantes tecnológicos. Isso cria barreiras estruturais para grupos de pesquisa menores, instituições acadêmicas e desenvolvedores independentes.

Ao expandir o acesso para 148 bilhões de tokens de IA abertos, o Tether Data elimina um obstáculo importante. Pesquisadores agora podem treinar e implementar modelos sofisticados sem depender de plataformas proprietárias ou sistemas centralizados. Pesquisadores locais em mercados emergentes, laboratórios universitários com recursos limitados e equipes independentes podem competir em pé de igualdade.

Paolo Ardoino, CEO do Tether, afirmou de forma direta: “A maior parte do treino de IA hoje otimiza a fluência, não a compreensão. Com este lançamento, estamos indo além do volume, rumo à estrutura, raciocínio e clareza.” O acesso aberto, destacou ele, fornece à comunidade de pesquisa ferramentas para desenvolver sistemas de IA que permaneçam explicáveis e confiáveis.

O artigo técnico — QVAC Genesis II: Expansão do Maior e de Melhor Qualidade Conjunto de Dados Educacionais Sintéticos Multi-domínio para Pré-treinamento — está disponível no blog de pesquisa do QVAC, acompanhado de FAQs detalhados e orientações de implementação.

À medida que a inteligência artificial se aprofunda na educação, descoberta científica, serviços financeiros e além, conjuntos de dados como este provavelmente determinarão se os sistemas de IA servem ao poder concentrado ou ao conhecimento distribuído. A decisão do Tether Data de liberar 148 bilhões de tokens de IA abertamente sinaliza onde um grande ator se posiciona nessa questão.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)