Je viens de voir cette nouvelle récemment, NVIDIA a acquis fin l'année dernière l'activité d'inférence de puces de Groq, cette transaction est en fait assez intéressante dans sa logique.



Huang Renxun a expliqué en détail pour la première fois lors du GTC de cette année pourquoi ils ont décidé d'acquérir Groq. En gros, ils ont vu que le marché de l'inférence se divisait. Avant, tout le monde optimisait les puces d'inférence avec un seul objectif : maximiser le débit. Mais la situation a changé, différents utilisateurs sont prêts à payer des prix différents pour des réponses plus rapides.

La logique ici est cruciale — si je peux offrir aux développeurs une réponse en tokens plus rapide, améliorer leur efficacité, ils seront prêts à payer pour cela. Ce marché à haute valeur et faible latence est en fait une opportunité qui n’est apparue que récemment. Huang appelle cela l’expansion de la frontière de Pareto du marché de l’inférence : auparavant, c’était une solution à haut débit, maintenant une nouvelle voie s’ajoute, celle de solutions à faible latence et à prix élevé.

Et Groq est justement un expert dans ce domaine. Leur architecture LPU est réputée pour sa faible latence déterministe, ce qui est complètement complémentaire à l’approche de NVIDIA avec ses GPU à haut débit. La version Groq 3 LPU, sortie en mars, utilise la technologie Samsung 4nm, et sa capacité d’inférence sur des modèles de milliards de paramètres dépasse de 35 fois celle du Blackwell NVL72, ce qui est vraiment impressionnant en termes de performance.

Du point de vue de la gamme de produits, cette acquisition comble une lacune de NVIDIA sur le marché de l’inférence. Imaginez, avec le même modèle, on peut avoir différentes stratégies de tarification selon le temps de réponse — même si le débit est un peu plus faible, le prix unitaire peut compenser. L’intégration de Groq permet à NVIDIA d’avoir une couverture plus complète sur le marché de l’inférence. Cette opération, d’un point de vue stratégique, est vraiment claire.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler