Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

A Gemini Lança Trading Agentivo para Negociação Automatizada com Tecnologia de IA

Agente de IA Notícias do setor de IA

A exchange de criptomoedas Gemini lançou o Agentic Trading, marcando a primeira vez que uma exchange regulada dos EUA ofereceu integração direta de agentes de IA para negociação automatizada. A plataforma permite que os usuários conectem Claude, ChatGPT e outros modelos de IA para automatizar estratégias de negociação que vão desde ordens simples até

CryptoFrontier6h atrás

Consensys, Joseph Lubin Contribuem 30.000 ETH para a DeFi United

bitcoin news ethereum news solana news USDC news Parcerias e ecossistema Agente de IA Notícias do setor de IA

Consensys e o cofundador do Ethereum Joseph Lubin confirmaram que irão contribuir com 30.000 ETH para a DeFi United, um esforço coordenado de alívio que aborda perdas do exploit do Kelp DAO. De acordo com o anúncio de segunda-feira da Aave, isso representa uma das maiores ofertas na iniciativa em andamento, o que

CryptoFrontier8h atrás

Alphea Lança Blockchain Layer 1 Nativo de IA com Execução Autônoma por Agentes

Progresso do projeto Agente de IA Notícias do setor de IA

Mensagem do Gate News, 27 de abril — Alphea, uma recém-revelada plataforma blockchain Layer 1 projetada para infraestrutura de IA, apresentou oficialmente seu ambiente de execução descentralizado no Hong Kong Web3 Festival 2026. A plataforma integra execução, memória persistente e computação verificável como recursos fundamentais no nível do blockchain, e não como componentes opcionais da camada de aplicação, permitindo que agentes autônomos de IA operem de forma independente como

GateNews8h atrás

Gate vai sediar um Roundtable em Space de AI Trading em 28 de abril: Explorando a IA como a próxima força motriz do ciclo de Web3

Agente de IA Notícias do setor de IA

Mensagem de Notícias da Gate, 27 de abril — A Gate vai sediar uma discussão ao vivo em formato de Space sobre AI Trading em 28 de abril às 8 p.m., reunindo especialistas do setor para explorar se a integração profunda da IA nos fluxos de trabalho de negociação marca o verdadeiro ponto de partida do próximo ciclo de Web3. A discussão vai examinar A

GateNews12h atrás

Ant Group Lança Ling-2.6-1T: Modelo com Trilhão de Parâmetros Otimizado para Execução Eficiente em Tokens

Agente de IA Notícias do setor de IA

Mensagem do Gate News, 27 de abril — O Ant Group, inclusãoAI, lançou o Ling-2.6-1T, um novo modelo de instrução carro-chefe da série Ling com um trilhão de parâmetros. Diferente dos modelos de raciocínio de longas cadeias, o Ling-2.6-1T emprega um mecanismo de "Fast-Thinking" projetado para a execução precisa de tarefas com o mínimo de tokens

GateNews13h atrás

A API da Nansen agora oferece suporte ao Protocolo MPP da Tempo, permitindo que agentes de IA paguem por chamada

Parcerias e ecossistema Agente de IA

Mensagem da Gate News, 27 de abril — A API da Nansen agora suporta o Protocolo de Pagamentos por Máquina (MPP), um padrão para pagamentos autônomos máquina-a-máquina respaldados pela Tempo e pela Stripe. A integração permite que agentes de IA paguem diretamente a partir das suas carteiras em uma base de chamada por chamada. O recurso funciona em conjunto com

GateNews13h atrás

Comentário

0/400

Sem comentários