Est-ce que $NBIS dispose actuellement de la déduction la plus rapide au monde sur le matériel $NVDA ?


Nebius a acquis Eigen AI pour $643M en numéraire et en actions, intégrant directement l'inférence et l'optimisation post-formation d'Eigen dans la Token Factory de Nebius
Lors du discours principal de GTC 2026 de NVIDIA, Eigen AI s'est classée #1 en vitesse de sortie pour Kimi K2.5 Reasoning, tandis que Nebius Fast était presque à égalité avec elle
Nebius Fast se classe également premier en vitesse d'inférence sur le matériel $NVDA pour le modèle open-source de ChatGPT, gpt-oss-120B
De plus, Eigen s'est classée comme le fournisseur basé sur GPU n°1 sur 25 modèles open-source sur Artificial Analysis, excluant les fournisseurs ASIC, sous des paramètres d'entrée par défaut de 10K. C'est aussi le fournisseur le plus rapide pour Qwen3 Coder 480B, avec 255,8 t/s, devant Google Vertex à 169,2 t/s et Amazon à 121,3 t/s
Cela signifie qu'Eigen est environ 51 % plus rapide que Google Vertex et plus de 2 fois plus rapide qu'Amazon sur ce benchmark
━━━━━━━━━━━━━━━━━━━━
Bien que le coût de l'acquisition semble élevé, si Eigen peut vraiment améliorer la performance d'inférence $NBIS , même légèrement, cela aura un effet composé à long terme sur les revenus et la position concurrentielle, qui dépassera probablement le coût de l'acquisition
━━━━━━━━━━━━━━━━━━━━
Nebius possède le cloud GPU, tandis qu'Eigen améliore l'efficacité avec laquelle ces GPU génèrent des tokens. Sur le même matériel NVIDIA, la performance ne concerne pas seulement le capex. Il s'agit de l'utilisation du GPU, de l'optimisation du modèle, du batching, de la latence, de la gestion de la mémoire et des kernels personnalisés
La stack d'Eigen se concentre sur des domaines comme la quantification, l'optimisation du cache KV, la sparsité, le décodage spéculatif, les kernels CUDA et Triton personnalisés, le batching continu et l'optimisation à l'exécution
Si Nebius peut générer plus de débit d'inférence avec le même matériel NVIDIA, cela améliore la capacité de revenus, le coût par token et la marge brute sans nécessiter d'augmentation proportionnelle du capex
$NBIS est en passe de devenir une entreprise générant plusieurs dizaines de milliards de dollars de revenus annuels, ce qui signifie que même quelques points de pourcentage d'amélioration de l'inférence peuvent se traduire par des centaines de millions d'économies
━━━━━━━━━━━━━━━━━━━━
Les modèles open-source évoluent rapidement. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax et d'autres modèles nécessitent une optimisation constante pour rester compétitifs
En intégrant Eigen, Nebius peut également publier des versions optimisées plus rapidement et rendre la Token Factory plus attrayante pour les développeurs et les clients d'entreprise
EIGEN-1,44%
Voir l'original
post-image
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 1
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Saidur48
· Il y a 2h
2026 GOGOGO 👊
Répondre0
  • Épingler