最近才看到这个消息,NVIDIA去年底收购了Groq的芯片推理业务,这笔交易的逻辑其实挺有意思的。



Huang Renxun在今年GTC大会上首次详细解释了为什么要拿下Groq。说白了,就是看到了推理市场正在分化。之前大家优化推理芯片就只有一个目标:堆吞吐量。但现在情况变了,不同的用户愿意为不同的响应速度付出不同的价格。

这里的逻辑很关键——如果我能给开发者提供更快的token响应速度,让他们的工作效率提升,他们就愿意为此买单。这个高价值、低延迟的市场其实是最近才出现的机会。Huang把这叫做推理市场的帕累托前沿扩展:原来是高吞吐量的方案,现在加上一个新的赛道,就是低延迟、高单价的解决方案。

而Groq恰好就是这个领域的专家。他们的LPU架构以确定性低延迟著称,这和NVIDIA GPU的高吞吐量方向完全互补。3月发布的Groq 3 LPU用的是三星4nm工艺,在万亿参数模型上的推理能力比Blackwell NVL72高35倍,这性能差异确实很猛。

从产品线角度看,这次收购填补了NVIDIA在推理市场的一个空白。你想啊,同一个模型,根据响应时间不同就能有不同的定价策略——吞吐量虽然小一点,但单价能补回来。Groq的加入让NVIDIA在推理市场有了更完整的覆盖。这买卖从战略上看还是很清楚的。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン