Face à l’explosion de la demande en calcul IA à grande échelle, NVIDIA ouvre son infrastructure et mobilise ses partenaires cloud pour bâtir des usines dédiées à travers le monde.
L’industrie de l’intelligence artificielle bascule désormais de l’entraînement des modèles vers la production d’inférences à grande échelle. Cette transition exige des capacités de calcul puissantes et disponibles en permanence. NVIDIA répond à cette demande avec le déploiement d’ un nouveau modèle économique. Cela permet d’accélérer l’accès aux infrastructures de traitement de données.
Un partenariat stratégique basé sur le partage de revenus
Le géant des puces IA s’allie désormais à des fournisseurs de cloud IA pour construire des usines partagées entre plusieurs clients. Ce dispositif repose sur un partage des revenus combiné à un appui financier selon l’entreprise. Les acteurs du cloud commercialisent ainsi des services bâtis sur la technologie NVIDIA.
AI is shifting from model training to always-on token production, and that shift demands a new business model.
— NVIDIA (@nvidia) July 2, 2026
NVIDIA is partnering with AI clouds to deploy large‑scale, multi‑tenant AI factories through revenue-sharing and credit-support. This opens up compute access to the… pic.twitter.com/PSQdTQJTga
Le fabricant conserve de son côté ses revenus classiques et profite aussi d’une partie des profits générés. Ce système répond à une contrainte de longue date. Jusqu’ici, les jeunes entreprises peinaient en effet à obtenir des infrastructures lourdes. Leurs engagements à long terme ne suffisaient pas à convaincre les banques. Cette approche renforce alors l’adoption des technologies NVIDIA dans un marché marqué par les courses à l’IA que se livrent les grands acteurs du secteur.
Quels sont les avantages directs pour les développeurs d’applications ?
Les concepteurs de modèles et les fournisseurs de services d’inférence accèdent immédiatement à une infrastructure complète. Ils n’ont plus besoin de gérer eux-mêmes le choix des sites ni l’approvisionnement énergétique. Des sociétés telles que Baseten, Fireworks AI et Together AI utilisent déjà ces ressources pour traiter l’inférence à fort volume.
Ces plateformes ont besoin du calcul IA à grande échelle pour absorber la croissance rapide du trafic utilisateur. Cette souplesse devient déterminante au moment où les produits passent du stade pilote à un déploiement à grande échelle. Cette dynamique pousse d’autres grands groupes à s’associer pour concevoir un supercalculateur IA de nouvelle génération.
Comment se matérialise ce déploiement d’usines sur le terrain ?
Le projet prend forme à travers la construction d’infrastructures de calcul DSX dans plusieurs zones géographiques. Sharon AI déploie par exemple un parc de 40 000 processeurs graphiques NVIDIA Grace Blackwell GB300. James Manning, PDG de Sharon AI, y voit un partenariat clé pour garantir une infrastructure souveraine. De son côté, Firmus Technologies construit un campus d’usines d’IA à Batam, en Indonésie. Le partenariat prévoit une puissance totale de 360 mégawatts et une capacité 170 000 processeurs graphiques. Cela permet de répondre aux besoins mondiaux d’inférence.
Des investissements mondiaux pour soutenir la croissance de l’infrastructure
Ces annonces confirment la montée en puissance du fabricant de puces IA, Cela multiplie les projets d’envergure face à des besoins en calcul toujours croissants. Les investissements réalisés à Taïwan illustrent d’ailleurs l’enjeu stratégique de sécuriser les chaînes d’approvisionnement pour l’avenir de l’IA.
Tim Rosenfield, co-PDG de Firmus Technologies, rappelle que les acteurs du secteur doivent disposer d’une infrastructure à la fois évolutive et rentable pour rester compétitifs mondialement. Cette architecture partagée permet ainsi d’ajuster l’offre matérielle à la demande croissante de jetons numériques.
- Partager l'article :