Google est officiellement le monarque absolu du calcul IA mondial. Alors que le reste de la Silicon Valley se bat pour obtenir les miettes de Nvidia, la firme de Mountain View a bâti son empire sur son propre silicium : les TPU. Avec un quart de la puissance de calcul planétaire entre ses mains, Google ne se contente plus de suivre la révolution, il possède la machine qui la fait tourner.
L’étude d’Epoch AI est formelle : 60 % de la puissance de calcul IA mondiale est concentrée chez les hyperscalers américains. Dans ce club très fermé, Google règne en maître, possédant environ 25 % de la capacité totale.
Le plus surprenant ? Contrairement à Microsoft ou Oracle, Google s’est largement émancipé de la dépendance à Nvidia.
Sur ses 5 millions d’unités équivalentes H100 (H100e), près de 80 % (4 millions) sont fournis par ses propres puces personnalisées : les TPU (Tensor Processing Units).
Classement mondial de la puissance de calcul IA (en H100e)
Voici comment se répartissent les forces en présence en ce mois d’avril 2026 :
| Rang | Entreprise | Capacité (H100e) | Infrastructure dominante |
| 1 | 5 Millions | TPU (80%) / Nvidia (20%) | |
| 2 | Microsoft | 3,5 Millions | Nvidia (Majorité) / AMD |
| 3 | Amazon | 2,5 Millions | AMD / Trainium (Équilibre) |
| 4 | Meta | 2,25 Millions | Nvidia / AMD |
| 5 | Oracle | 1 Million | Nvidia (Forte dépendance) |
Le « On-Premise » chute et lee Cloud dévore tout
Le mouvement vers le cloud est devenu une lame de fond irrésistible. En 2018, plus de la moitié (56 %) de la capacité des datacenters était détenue en propre par les entreprises. Aujourd’hui, ce chiffre a fondu comme neige au soleil :
- 2018 : 56 % de capacité sur site (On-premise).
- 2026 : 32 % de capacité sur site.
- 2031 (prévision) : seulement 19 %.
Les hyperscalers possèdent désormais la moitié du parc mondial et devraient en détenir les deux tiers d’ici 2031.
Pour les entreprises, l’économie d’échelle offerte par ces géants est un chant des sirènes auquel il est difficile de résister, malgré les risques de « lock-in » (dépendance contractuelle et technique).
L’inférence est-elle le futur champ de bataille ?
Si Nvidia a dominé l’ère de l’entraînement (le « training ») grâce à son framework CUDA, le marché bascule désormais vers l’inférence (l’exécution des modèles par les utilisateurs).
C’est ici que le monopole de Nvidia pourrait vaciller. L’inférence est plus flexible et dépend de facteurs variés (taille des modèles, latence, coût).
We estimate that over 60% of global AI compute is owned by the top US hyperscalers, led by Google with the equivalent of roughly 5 million Nvidia H100 GPUs!
Unlike the other hyperscalers, which rely primarily on Nvidia, Google’s fleet is dominated by its custom TPU chips. pic.twitter.com/8gCykdmXVZ— Epoch AI (@EpochAIResearch) April 6, 2026
Des acteurs comme AMD, Cerebras, ou les puces maison des clouds (Trainium d’AWS, Maia de Microsoft, MTIA de Meta) commencent à offrir des rapports performance/prix extrêmement compétitifs.
“Il ne faut pas être prisonnier d’une seule pile logicielle ou d’une seule puce. L’IA doit être abordée comme un projet ‘zéro défaut’, sans héritage des centres de données actuels”, ajoute Matt Kimball, Moor Insights & Strategy.
- Partager l'article :
