in

Google détrône Nvidia dans l’ombre en puissance de calcul

Puissance de calcul TPU IA Google

Google est officiellement le monarque absolu du calcul IA mondial. Alors que le reste de la Silicon Valley se bat pour obtenir les miettes de Nvidia, la firme de Mountain View a bâti son empire sur son propre silicium : les TPU. Avec un quart de la puissance de calcul planétaire entre ses mains, Google ne se contente plus de suivre la révolution, il possède la machine qui la fait tourner. 

L’étude d’Epoch AI est formelle : 60 % de la puissance de calcul IA mondiale est concentrée chez les hyperscalers américains. Dans ce club très fermé, Google règne en maître, possédant environ 25 % de la capacité totale.

Le plus surprenant ? Contrairement à Microsoft ou Oracle, Google s’est largement émancipé de la dépendance à Nvidia

Sur ses 5 millions d’unités équivalentes H100 (H100e), près de 80 % (4 millions) sont fournis par ses propres puces personnalisées : les TPU (Tensor Processing Units).

Classement mondial de la puissance de calcul IA (en H100e)

Voici comment se répartissent les forces en présence en ce mois d’avril 2026 :

RangEntrepriseCapacité (H100e)Infrastructure dominante
1Google5 MillionsTPU (80%) / Nvidia (20%)
2Microsoft3,5 MillionsNvidia (Majorité) / AMD
3Amazon2,5 MillionsAMD / Trainium (Équilibre)
4Meta2,25 MillionsNvidia / AMD
5Oracle1 MillionNvidia (Forte dépendance)

Le « On-Premise » chute et lee Cloud dévore tout

Le mouvement vers le cloud est devenu une lame de fond irrésistible. En 2018, plus de la moitié (56 %) de la capacité des datacenters était détenue en propre par les entreprises. Aujourd’hui, ce chiffre a fondu comme neige au soleil :

  • 2018 : 56 % de capacité sur site (On-premise).
  • 2026 : 32 % de capacité sur site.
  • 2031 (prévision) : seulement 19 %.

Les hyperscalers possèdent désormais la moitié du parc mondial et devraient en détenir les deux tiers d’ici 2031

Youtube video

Pour les entreprises, l’économie d’échelle offerte par ces géants est un chant des sirènes auquel il est difficile de résister, malgré les risques de « lock-in » (dépendance contractuelle et technique).

L’inférence est-elle le futur champ de bataille ?

Si Nvidia a dominé l’ère de l’entraînement (le « training ») grâce à son framework CUDA, le marché bascule désormais vers l’inférence (l’exécution des modèles par les utilisateurs).

C’est ici que le monopole de Nvidia pourrait vaciller. L’inférence est plus flexible et dépend de facteurs variés (taille des modèles, latence, coût). 

Des acteurs comme AMD, Cerebras, ou les puces maison des clouds (Trainium d’AWS, Maia de Microsoft, MTIA de Meta) commencent à offrir des rapports performance/prix extrêmement compétitifs.

“Il ne faut pas être prisonnier d’une seule pile logicielle ou d’une seule puce. L’IA doit être abordée comme un projet ‘zéro défaut’, sans héritage des centres de données actuels”, ajoute Matt Kimball, Moor Insights & Strategy.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !