Ramp Labs выдвигает новое решение для совместного использования памяти мультиагентами, при этом расход токенов снижается максимум на 65%

Новости Gate News: 11 апреля компания по инфраструктуре ИИ Ramp Labs опубликовала результаты исследования «Latent Briefing». Они достигаются за счет прямого сжатия KV-кэша больших языковых моделей для эффективного обмена памятью между многоагентными системами — при этом точность не снижается, а потребление токенов существенно уменьшается. В большинстве распространенных архитектур многоагентных систем оркестратор (Orchestrator) разбивает задачу и многократно вызывает модели рабочих (Worker). По мере того как цепочка рассуждений постоянно удлиняется, количество токенов растет экспоненциально. Ключевая идея Latent Briefing — использовать механизм внимания, чтобы выявлять в контексте действительно важные части, а на уровне представлений напрямую отбрасывать избыточную информацию, а не полагаться на LLM-сводки, которые работают медленно, или на RAG-поиск, который отличается нестабильностью. На бенчмарке LongBench v2 этот подход показал впечатляющие результаты: потребление токенов у модели Worker снизилось на 65%, для документов средней длины (от 32k до 100k) медианный объем сэкономленных токенов составил 49%, общая точность относительно базовой линии выросла примерно на 3 процентных пункта, при этом дополнительное время на каждое сжатие — лишь около 1,7 секунды, что ускоряет исходный алгоритм примерно в 20 раз. Эксперименты проводились с Claude Sonnet 4 в роли оркестратора и Qwen3-14B в роли модели рабочего, охватывая разнообразные сценарии документов, включая научные статьи, юридические документы, романы и правительственные отчеты. Исследование также выявило, что оптимальные пороги сжатия зависят от сложности задачи и длины документа: для сложных задач подходит более агрессивное сжатие, чтобы отфильтровать спекулятивный шум рассуждений, а для длинных документов лучше применять более легкое сжатие, чтобы сохранить разрозненные ключевые сведения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Gemini запускает агентский трейдинг для автоматизированной торговли, управляемой ИИ

Криптовалютная биржа Gemini запустила агентную торговлю (Agentic Trading), что стало первым случаем, когда регулируемая биржа в США предложила прямую интеграцию ИИ-агентов для автоматизированной торговли. Платформа позволяет пользователям подключать Claude, ChatGPT и другие модели ИИ для автоматизации торговых стратегий — от простых ордеров до

CryptoFrontier1ч назад

ConsenSys, Джозеф Любин передают 30,000 ETH в DeFi United

Сооснователь ConsenSys и Ethereum Джозеф Любин подтвердил, что они внесут 30,000 ETH в DeFi United — скоординированную инициативу по оказанию помощи, направленную на покрытие потерь, понесённых в результате эксплойта Kelp DAO. Согласно объявлению Aave от понедельника, это представляет собой одно из крупнейших предложений в продолжающейся инициативе, которая

CryptoFrontier3ч назад

Alphea запускает AI-native блокчейн уровня 1 с автономным исполнением агентов

Gate News-сообщение, 27 апреля — Alphea, недавно представленная платформа уровня 1 (Layer 1) для инфраструктуры ИИ, официально представила свою децентрализованную среду выполнения на Гонконгском Web3-фестивале 2026. Платформа объединяет выполнение, долговременную память и проверяемые вычисления в качестве базовых функций уровня блокчейна, а не опциональных компонентов уровня приложений, позволяя автономным ИИ-агентам работать независимо, как

GateNews3ч назад

Gate проведет Space-раундстол по AI Trading 28 апреля: изучаем ИИ как драйвер следующего цикла Web3

Новостное сообщение Gate, 27 апреля — Gate проведет прямой Space-раундстол по AI Trading 28 апреля в 20:00, собрав экспертов отрасли, чтобы обсудить, означает ли глубокая интеграция ИИ в торговые рабочие процессы истинное начало следующего цикла Web3. В ходе обсуждения будут рассмотрены эволюция AI-инфраструктуры

GateNews7ч назад

Ant Group запускает Ling-2.6-1T: модель с триллионом параметров, оптимизированная для экономичного по токенам выполнения задач

Сообщение Gate News, 27 апреля — Ant Group включениеAI выпустила Ling-2.6-1T, новый флагманский инструкционный модельный ряд с триллионом параметров в серии Ling. В отличие от моделей рассуждений с длинными цепочками, Ling-2.6-1T использует механизм "Fast-Thinking", предназначенный для точного выполнения задач с минимальным потреблением токенов

GateNews7ч назад

API Nansen теперь поддерживает протокол Tempo MPP, позволяя агентам ИИ платить за один вызов

Сообщение Gate News, 27 апреля — теперь API Nansen поддерживает протокол Machine Payments Protocol (MPP), стандарт для автономных платежей машина-машина, обеспеченный Tempo и Stripe. Интеграция позволяет агентам ИИ оплачивать напрямую из своих кошельков в расчете на один вызов. Функция работает наряду

GateNews8ч назад
комментарий
0/400
Нет комментариев