عاجل: كشفت جوجل عن TurboQuant، تقنية تهدف إلى ضغط الذاكرة العاملة لنماذج اللغة بدون فقدان.


إذا تم اعتمادها في الإنتاج كما تشير الأبحاث، فقد تساهم في تخفيف أحد العقبات الرئيسية في الذكاء الاصطناعي الحالي: تكلفة وندرة الذاكرة اللازمة لمعالجة السياقات الطويلة، والوكيلات، وأعباء الاستنتاج الضخمة.
يهدف TurboQuant إلى تقليل استخدام ذاكرة التخزين المؤقت للقيم بمقدار ست مرات وزيادة سرعة المعالجة على الشريحة بمقدار ثماني مرات بدون فقدان البيانات.
شاهد النسخة الأصلية
post-image
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت