Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A Gemini Lança Trading Agentivo para Negociação Automatizada com Tecnologia de IA
A exchange de criptomoedas Gemini lançou o Agentic Trading, marcando a primeira vez que uma exchange regulada dos EUA ofereceu integração direta de agentes de IA para negociação automatizada. A plataforma permite que os usuários conectem Claude, ChatGPT e outros modelos de IA para automatizar estratégias de negociação que vão desde ordens simples até
CryptoFrontier6h atrás
Consensys, Joseph Lubin Contribuem 30.000 ETH para a DeFi United
Consensys e o cofundador do Ethereum Joseph Lubin confirmaram que irão contribuir com 30.000 ETH para a DeFi United, um esforço coordenado de alívio que aborda perdas do exploit do Kelp DAO. De acordo com o anúncio de segunda-feira da Aave, isso representa uma das maiores ofertas na iniciativa em andamento, o que
CryptoFrontier8h atrás
Alphea Lança Blockchain Layer 1 Nativo de IA com Execução Autônoma por Agentes
Mensagem do Gate News, 27 de abril — Alphea, uma recém-revelada plataforma blockchain Layer 1 projetada para infraestrutura de IA, apresentou oficialmente seu ambiente de execução descentralizado no Hong Kong Web3 Festival 2026. A plataforma integra execução, memória persistente e computação verificável como recursos fundamentais no nível do blockchain, e não como componentes opcionais da camada de aplicação, permitindo que agentes autônomos de IA operem de forma independente como
GateNews8h atrás
Gate vai sediar um Roundtable em Space de AI Trading em 28 de abril: Explorando a IA como a próxima força motriz do ciclo de Web3
Mensagem de Notícias da Gate, 27 de abril — A Gate vai sediar uma discussão ao vivo em formato de Space sobre AI Trading em 28 de abril às 8 p.m., reunindo especialistas do setor para explorar se a integração profunda da IA nos fluxos de trabalho de negociação marca o verdadeiro ponto de partida do próximo ciclo de Web3.
A discussão vai examinar A
GateNews12h atrás
Ant Group Lança Ling-2.6-1T: Modelo com Trilhão de Parâmetros Otimizado para Execução Eficiente em Tokens
Mensagem do Gate News, 27 de abril — O Ant Group, inclusãoAI, lançou o Ling-2.6-1T, um novo modelo de instrução carro-chefe da série Ling com um trilhão de parâmetros. Diferente dos modelos de raciocínio de longas cadeias, o Ling-2.6-1T emprega um mecanismo de "Fast-Thinking" projetado para a execução precisa de tarefas com o mínimo de tokens
GateNews13h atrás
A API da Nansen agora oferece suporte ao Protocolo MPP da Tempo, permitindo que agentes de IA paguem por chamada
Mensagem da Gate News, 27 de abril — A API da Nansen agora suporta o Protocolo de Pagamentos por Máquina (MPP), um padrão para pagamentos autônomos máquina-a-máquina respaldados pela Tempo e pela Stripe. A integração permite que agentes de IA paguem diretamente a partir das suas carteiras em uma base de chamada por chamada.
O recurso funciona em conjunto com
GateNews13h atrás