Ramp Labs เสนอแนวทางใหม่สำหรับการแชร์หน่วยความจำแบบหลายเอเจนต์ โดยการใช้โทเคนสูงสุดลดลง 65%

GateNews

ข่าว Gate News วันที่ 11 เมษายน บริษัทโครงสร้างพื้นฐานด้าน AI Ramp Labs เปิดเผยผลการวิจัย “Latent Briefing” โดยบีบอัดแคช KV ของโมเดลขนาดใหญ่โดยตรงเพื่อทำให้เกิดการแชร์ความจำอย่างมีประสิทธิภาพระหว่างระบบหลายเอเจนต์ (multi-agent) ภายใต้เงื่อนไขที่ไม่ทำให้ความแม่นยกลดลง และลดการใช้ Token ได้อย่างมาก ในสถาปัตยกรรมหลายเอเจนต์ที่เป็นกระแสหลัก ผู้ประสานงาน (Orchestrator)จะแยกงานออกและเรียกใช้โมเดลผู้ปฏิบัติงาน (Worker)ซ้ำ ๆ เมื่อระยะเส้นทางการอนุมาน (inference) ยาวขึ้น ปริมาณ Token ก็จะเพิ่มขึ้นแบบทวีคูณ Latent Briefing มีแนวคิดหลักคือใช้กลไกความสนใจ (attention) เพื่อระบุส่วนที่สำคัญจริง ๆ ในบริบท จากนั้นจึงทิ้งข้อมูลที่ซ้ำซ้อนทันทีในชั้นการแทนค่า (representation) ไม่ใช่พึ่งพาสรุปด้วย LLM ที่ช้ากว่า หรือการค้นคืน RAG ที่เสถียรภาพต่ำ ในการทดสอบเกณฑ์มาตรฐาน LongBench v2 วิธีนี้ทำผลงานได้เด่น: การใช้ Token ของโมเดล Worker ลดลง 65% การประหยัด Token สำหรับเอกสารความยาวปานกลาง (32k ถึง 100k) มีค่ามัธยฐานอยู่ที่ 49% ความแม่นยำโดยรวมสูงขึ้นประมาณ 3 จุดเปอร์เซ็นต์เมื่อเทียบกับฐาน (baseline) และเวลาเพิ่มเติมที่ใช้สำหรับการบีบอัดแต่ละครั้งอยู่ที่ราว 1.7 วินาทีเท่านั้น ทำให้เร็วขึ้นประมาณ 20 เท่าจากอัลกอริทึมเดิม การทดลองใช้ Claude Sonnet 4 เป็นผู้ประสานงาน และ Qwen3-14B เป็นโมเดลผู้ปฏิบัติงาน ครอบคลุมสถานการณ์เอกสารหลายประเภท เช่น บทความวิชาการ เอกสารทางกฎหมาย นวนิยาย และรายงานของรัฐบาล งานวิจัยยังพบว่า “ขีดจำกัดการบีบอัดที่เหมาะสมที่สุด” จะแตกต่างกันตามความยากของงานและความยาวของเอกสาร—งานที่ยากเหมาะกับการบีบอัดแบบก้าวร้าวเพื่อกรองสัญญาณรบกวนจากการอนุมานเชิงคาดเดา (speculative) ขณะที่เอกสารยาวเหมาะกับการบีบอัดแบบเบาเพื่อคงรักษาข้อมูลสำคัญที่กระจายอยู่

news.article.disclaimer

btc.bar.articles

Gate เตรียมจัด Space Roundtable เรื่อง AI Trading ในวันที่ 28 เมษายน: สำรวจ AI ในฐานะตัวขับเคลื่อนวัฏจักร Web3 รอบถัดไป

ข้อความข่าว Gate ประจำวันที่ 27 เมษายน — Gate จะจัดการอภิปรายแบบไลฟ์ผ่าน Space หัวข้อ AI Trading ในวันที่ 28 เมษายน เวลา 20:00 น. โดยเชิญผู้เชี่ยวชาญจากวงการมาร่วมสำรวจว่า “การที่ AI ถูกบูรณาการอย่างลึกซึ้งเข้ากับกระบวนการทำงานด้านการเทรด” ถือเป็นจุดเริ่มต้นที่แท้จริงของวัฏจักร Web3 รอบถัดไปหรือไม่ การอภิปรายจะพิจารณาเรื่องวิวัฒนาการของโครงสร้างพื้นฐานของ AI การเปลี่ยนแปลงโครงสร้างการเทรด และการเปลี่ยนผ่านในกระบวนทัศน์ด้านการเงิน ผู้ร่วมเสวนาจะวิเคราะห์ว่า AI กำลังเปลี่ยนจากเครื่องมือวิเคราะห์แบบแยกเดี่ยวไปสู่ศูนย์กลางการเทรดหลักอย่างไร ซึ่งจะปรับเปลี่ยนพลวัตของเกมในตลาดการเงินอย่างมีนัยสำคัญ เพื่อเข้าร่วม ผู้ใช้ควรติดตาม @sunpumpmeme และ @Agent_SunGenX รีทวีตโพสต์กิจกรรม และแท็กเพื่อนสามคน ผู้เข้าร่วมที่โชคดีห้าคนจะถูกคัดเลือกแบบสุ่มเพื่อรับ 10 USDT คนละ 1 ราย

GateNews19 นาที ที่แล้ว

Ant Group เปิดตัว Ling-2.6-1T: โมเดลระดับล้านล้านพารามิเตอร์ที่ปรับให้เหมาะกับการประมวลผลงานอย่างประหยัดโทเคน

ข้อความจาก Gate News วันที่ 27 เมษายน — Ant Group 的 inclusionAI ได้เปิดตัว Ling-2.6-1T ซึ่งเป็นโมเดลคำสั่งเรือธงรุ่นใหม่ที่มีพารามิเตอร์ระดับล้านล้านในซีรีส์ Ling โดยแตกต่างจากโมเดลการให้เหตุผลแบบสายยาว Ling-2.6-1T ใช้กลไก "Fast-Thinking" ที่ออกแบบมาเพื่อการทำงานตามงานได้อย่างแม่นยำด้วยการใช้โทเคนน้อยที่สุด

GateNews46 นาที ที่แล้ว

Nansen API ตอนนี้รองรับโปรโตคอล MPP ของ Tempo แล้ว ทำให้เอเจนต์ AI สามารถชำระเงินได้ต่อการเรียกใช้งาน

ข้อความข่าว Gate ประจำวันที่ 27 เมษายน — ขณะนี้ Nansen API รองรับโปรโตคอล Machine Payments Protocol (MPP) ซึ่งเป็นมาตรฐานสำหรับการชำระเงินแบบเครื่องต่อเครื่องแบบอัตโนมัติที่ได้รับการสนับสนุนโดย Tempo และ Stripe การผสานรวมนี้ทำให้เอเจนต์ AI สามารถชำระเงินได้โดยตรงจากวอลเล็ตของตนเองในแต่ละครั้งตามการเรียกใช้งาน ฟีเจอร์นี้ทำงานควบคู่กับ

GateNews1 ชั่วโมง ที่แล้ว

เกร็ก บร็อกแมน ของ OpenAI: AI กำลังเปลี่ยนจากการแชทสู่การปฏิบัติงานแบบอัตโนมัติ

ข่าวจาก Gate ประจำวันที่ 27 เมษายน — เกร็ก บร็อกแมน ประธานและผู้ร่วมก่อตั้งของ OpenAI กล่าวว่า คลื่นลูกถัดไปของปัญญาประดิษฐ์จะพาผู้ใช้จากการคุยกับบอท AI ไปสู่การมอบหมายงานในโลกความจริง แง่มุมนี้ทำให้หน่วยงานองค์กรต้องทบทวนกระบวนการปฏิบัติงานใหม่ และกำหนดโปรโตคอลใหม่สำหรับความปลอดภัย การจัดการ และค่าใช้จ่ายสำหรับ

GateNews2 ชั่วโมง ที่แล้ว

CEX รายใหญ่เปิดตัวชุดสัญญาณสมาร์ทมันนี่ด้วยข้อมูลเทรดเดอร์กว่า 1,000 ราย

ข้อความจาก Gate News ประจำวันที่ 27 เมษายน — การแลกเปลี่ยนแบบรวมศูนย์รายใหญ่มากได้เปิดตัว "ชุดสัญญาณสมาร์ทมันนี่ (Smart Money Signal Suite)" ที่รวมการถือครองแบบเรียลไทม์ อัตราการชนะ และข้อมูลกำไร/ขาดทุนจากเทรดเดอร์ยอดนิยมมากกว่า 1,000 รายเข้าด้วยกัน ชุดเครื่องมือนี้ เข้าถึงได้ผ่าน Agent Trade Kit ของแพลตฟอร์ม และได้ห่อหุ้มสัญญาณของเทรดเดอร์ไว้เป็น

GateNews2 ชั่วโมง ที่แล้ว

B.AI ยกระดับโครงสร้างพื้นฐาน และเปิดตัวฟีเจอร์ทักษะสำคัญ

อัปเดต Gate ข่าว วันที่ 27 เมษายน — B.AI ได้ประกาศความก้าวหน้าหลายด้านทั้งด้านผลิตภัณฑ์และระบบนิเวศในสัปดาห์นี้ หน้า Landing Page ของ BAIclaw ได้รับการปรับโฉมภาพลักษณ์และประสบการณ์การโต้ตอบครั้งใหญ่ โดยการรองรับหลายภาษาของเว็บไซต์ได้ขยายเพิ่มเป็น 10 ภาษา ซึ่งช่วยเสริมความสามารถในการใช้งานในระดับสากลได้อย่างแข็งแกร่งขึ้น ด้านโครงสร้างพื้นฐาน

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น