D’après l’analyse la plus récente du blog de Nvidia, les GPU Blackwell coûtent près du double par heure par rapport à la génération Hopper, tout en affichant des coûts d’inférence par jeton 35 fois plus faibles. En utilisant DeepSeek-R1 comme modèle de test, Blackwell (GB300 NVL72) est loué à 2,65 dollars par GPU et par heure contre 1,41 pour Hopper, mais le débit par GPU passe de 90 à 6 000 tokens par seconde. Ce gain de débit de 65x réduit les coûts par million de tokens de 4,20 dollars à 0,12.
Le chiffre de 0,12 suppose une optimisation logicielle complète, incluant l’inférence en FP4 à faible précision et la prédiction multi-token (MTP). Sans activer MTP, les coûts par million de tokens atteignent environ 2,35 dollars, puis retombent à 0,11 avec elle activée, ce qui met en évidence un impact d’optimisation de 21x rien que grâce à cette fonctionnalité.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Forefront Tech termine la tarification de son $100M IPO, pour être cotée au Nasdaq
D’après ChainCatcher, Forefront Tech Holdings Acquisition Corp a finalisé le prix de son introduction en bourse (IPO) de 100 millions de dollars le 30 avril, avec une cotation au Nasdaq sous le ticker FTHAU. Les fonds serviront à explorer des opportunités de fusions et acquisitions dans la blockchain, l’intelligence artificielle, la fintech et autres
GateNewsIl y a 24m
Ancien cadre de Meta lève des fonds pour une start-up d’IA Flourish avec une valorisation de 2,5 milliards de dollars
D’après Bloomberg, Thomas Reardon, ancien dirigeant de Meta qui a mené les travaux sur le Neural Band de Meta, lève des fonds pour Flourish, une nouvelle startup d’IA axée sur des systèmes d’IA à faible consommation. Lux Capital et Google Ventures ont accepté d’être des investisseurs majeurs, des financeurs ayant déjà promis 500 millions de dollars à une valorisation de 2,5
GateNewsIl y a 26m
OpenAI retrace le problème des Gobelins jusqu’à un signal de récompense de personnalité « nerdy », les mentions de Gobelins augmentent de 175 % dans GPT-5.1
D’après OpenAI, la société a identifié la cause première du problème « goblin » qui a touché les modèles GPT à partir de GPT-5,1. Un signal de récompense utilisé pour renforcer la caractéristique de personnalité « Nerdy » encourageait des sorties comportant des références à des créatures de fantasy, avec 76,2 % de l’ensemble de données d’entraînement montrant
GateNewsIl y a 1h
Parallel Web Systems lève $100M série B à une valorisation $2B , menée par Sequoia
D’après TechCrunch, Parallel Web Systems, une startup d’IA fondée par l’ancien PDG de Twitter Parag Agrawal, a levé 100 millions de dollars lors d’une série B menée par Sequoia, pour une valorisation de 2 milliards de dollars. Cette levée porte le financement total de l’entreprise à 230 millions de dollars, cinq mois après sa série A de 100 millions de dollars. Parallel
GateNewsIl y a 1h
Dîner de célébration du 8e anniversaire de BitMart : introduction d’un trading automatisé par IA et de services localisés pour les utilisateurs à Taiwan
BitMart organise un banquet de gala à l’occasion de son 8e anniversaire à Taipei, au palais de la recherche (Junpin), avec la présence de plus de 150 invités. La cérémonie a permis de revenir sur huit années de développement et d’annoncer une stratégie d’implantation locale ainsi que des stratégies d’auto-trading basées sur l’IA. BitMart Skill, combiné à Blave, permet aux utilisateurs d’effectuer du trading automatisé via l’IA et d’obtenir des informations d’actualité en temps réel sans avoir besoin de programmer. Les utilisateurs mondiaux dépassent 13 millions, les projets lancés plus de 4 800, et le volume de transactions dépasse 1 000 milliards de dollars. Le dîner comprenait un “vrai dieu de la fortune” et de nombreux cadeaux, témoignant de la volonté de s’engager durablement en Taiwan.
ChainNewsAbmediaIl y a 1h
SoftBank prévoit une introduction en bourse de Roze en 2026, avec une valorisation cible de 100 milliards de dollars
D’après une information exclusive du Financial Times (FT) du 30 avril, SoftBank prévoit de créer aux États-Unis une toute nouvelle société indépendante, baptisée Roze, dont les activités couvriront des robots dotés d’IA et des infrastructures de centres de données. L’objectif est de réaliser un IPO dès 2026, avec une valorisation visée à 100 milliards de dollars. Le Financial Times indique également que, en interne, SoftBank nourrit des doutes quant à la valorisation visée et au calendrier de l’IPO.
MarketWhisperIl y a 1h