Я только что заметил интересную тенденцию в развитии инфраструктуры ИИ за последнее время. В конце прошлого года крупные компании приобрели Groq — компанию, которая занимается чипами с низкой задержкой, за 20 миллиардов долларов США. А на мероприятии GTC на прошлой неделе они только что представили чип Groq 3 LPU, произведённый с использованием 4-нм технологии Samsung.



Меня особенно заинтересовало, что стоит за этим движением. Кажется, рынок предоставления услуг ИИ меняется. Это уже не только о повышении вычислительной мощности традиционным способом, но и о расширении вариантов для пользователей. Некоторые требуют скорости, некоторые — быстрой реакции, а некоторые — и того, и другого, при этом платя разную цену.

На самом деле, это похоже на расширение границ рынка, а не просто на его рост. Появились новые ниши с низкой задержкой и высокой ценой за единицу. В отличие от старых методов, ориентированных на объем и высокую скорость, одна и та же модель может иметь разные ценовые уровни в зависимости от скорости реакции. Хотя объём обработки может быть ниже, цена за единицу может компенсировать это.

Интересно, что архитектура LPU от Groq славится своей гарантированной низкой задержкой. В сочетании с подходом GPU, ориентированным на очень высокую скорость, используемым крупными игроками на рынке, это похоже на заполнение пробелов в их продуктовой линейке. Это не просто прямое соревнование, а дополнение и расширение возможностей — очень умный ход.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить