前不久,NVIDIA 在推理市场上完成了一次有趣的布局。它以 2000 亿美元收购了 Groq 的芯片业务,带来了由 Jonathan Ross 领导的核心团队。奇怪的是,Groq 仍作为独立公司运营,所以这并不是完全的收购。



让我注意到的是黄仁勋关于为何这样做的解释。结果显示,推理市场并不是单一的。以前,一切都围绕着提升性能而转,但现在情况发生了变化。用户愿意根据响应速度支付不同的价格。如果工程师能更快地处理令牌并提高生产力,他们就愿意为此投资。

这就是 Groq 的切入点。它的 LPU 架构以低确定性延迟著称,正好与 NVIDIA 高性能 GPU 所做的不同。这就像是在完成一个光谱:一端是最大性能,另一端是最高响应速度。市场的两个细分,两个不同的价格,同样的模型。

在三月的 GTC 会议上,他们推出了采用三星 4 纳米工艺的 Groq 3 LPU。数字令人印象深刻:每兆瓦推理效率比 Blackwell NVL72 高出 35 倍。这种差异化开辟了新的市场,而不是仅仅在现有市场中竞争。

Groq 这里的布局很清楚:当 NVIDIA 主导高性能时,他们专注于满足那些最看重速度的用户。两种策略,一个更完整的生态系统。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论