Ramp Labs 提出多智能体记忆共享新方案,Token 消耗最高降低 65%

GateNews

Gate News 消息,4 月 11 日,AI 基础设施公司 Ramp Labs 发布研究成果「Latent Briefing」,通过直接压缩大模型 KV 缓存实现多智能体系统间的高效记忆共享,在不损失准确率的前提下大幅降低 Token 消耗。在主流多智能体架构中,编排者(Orchestrator)将任务拆解并反复调用工作者(Worker)模型,随着推理链路不断延伸,Token 用量呈指数级膨胀。Latent Briefing 的核心思路是借助注意力机制识别上下文中真正关键的部分,在表示层直接丢弃冗余信息,而非依赖速度慢的 LLM 摘要或稳定性差的 RAG 检索。在 LongBench v2 基准测试中,该方法表现亮眼:Worker 模型 Token 消耗降低 65%,中等长度文档(32k 至 100k)的 Token 节省中位数达 49%,整体准确率较基线提升约 3 个百分点,而每次压缩的额外耗时仅约 1.7 秒,较原始算法提速约 20 倍。实验以 Claude Sonnet 4 作为编排者、Qwen3-14B 作为工作者模型,覆盖学术论文、法律文书、小说及政府报告等多类文档场景。研究还发现,最优压缩阈值因任务难度和文档长度而异——难题适合激进压缩以过滤投机性推理噪声,长文档则更适合轻度压缩以保留分散的关键信息。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Gemini 推出用于 AI 驱动自动化交易的代理式交易

加密交易所 Gemini 已推出 Agentic Trading(代理式交易),标志着首家受监管的美国交易所首次提供用于自动化交易的直接 AI 代理集成。该平台使用户能够连接 Claude、ChatGPT 和其他 AI 模型,以自动化交易策略,从简单挂单到

Crypto Frontier5小时前

ConsenSys,Joseph Lubin 向 DeFi United 贡献 30,000 ETH

Consensys 和以太坊联合创始人 Joseph Lubin 已确认他们将向 DeFi United 贡献 30,000 ETH,这是一项有组织的救助行动,用于应对 Kelp DAO 被利用事件造成的损失。根据 Aave 于周一发布的公告,这代表了正在进行的这项行动中规模最大的募款之一,whic

Crypto Frontier7小时前

Alphea 推出面向 AI 的原生第 1 层区块链,支持自主代理执行

Gate News 消息,4月27日——Alphea,这一款为 AI 基础设施打造、近日发布的第 1 层区块链平台,已于 2026 年香港 Web3 论坛上正式展示其去中心化执行环境。该平台将执行、持久化内存和可验证计算作为基础的链上特性集成,而非可选的应用层组件,使自主 AI 代理能够独立运行。

GateNews7小时前

Gate 将于 4 月 28 日举办 AI 交易 Space 圆桌:探索 AI 作为下一轮 Web3 周期驱动力

Gate 新闻消息,4 月 27 日——Gate 将于 4 月 28 日晚 8 点举办一场关于 AI 交易的直播 Space 圆桌讨论,汇聚行业专家,探讨 AI 是否深度融入交易工作流程,是否标志着下一轮 Web3 周期的真正起点。 本次讨论将探讨 AI 基础设施的演进、交易结构的转型,以及金融范式的变化。嘉宾将分析 AI 如何从一款独立的分析工具过渡为核心交易枢纽,从根本上重塑金融市场的博弈动态。 参与方式:用户需关注 @sunpumpmeme 和 @Agent_SunGenX,转发活动帖,并@三位朋友。将随机抽取 5 位幸运参与者,每人获得 10 USDT。

GateNews11小时前

蚂蚁集团推出 Ling-2.6-1T:万亿参数模型,针对词元高效的任务执行进行了优化

Gate 新闻消息,4月27日——蚂蚁集团的 inclusionAI 已发布 Ling-2.6-1T,这是一款 Ling 系列中的新一代万亿参数旗舰指令模型。与长链推理模型不同,Ling-2.6-1T 采用“快速思考”机制,旨在以最少的 词元消耗实现对任务的精确执行

GateNews11小时前

Nansen API 现在支持 Tempo 的 MPP 协议,使 AI 代理可按次调用付费

Gate 新闻消息,4月27日——Nansen API 现在支持机器支付协议 (MPP)。该协议是一种用于由自动化机器进行机器到机器支付的标准,并由 Tempo 与 Stripe 提供支持。该集成使 AI 代理能够按次调用,在每次请求的基础上直接从其钱包发起支付。 该功能与

GateNews12小时前
评论
0/400
暂无评论