L’intelligence artificielle coûte cher, très cher. C’est l’idée reçue qui a longtemps collé à la peau du secteur. Pourtant, une petite révolution silencieuse s’est opérée en 2025. OpenAI, le fer de lance du domaine, affiche désormais des chiffres qui feraient pâlir d’envie n’importe quel géant de la tech. Mais derrière cet arbre qui cache la forêt, la réalité est nettement moins rose pour les jeunes pousses du B2B.
Le bond prodigieux des marges d’OpenAI
C’est le chiffre qui a secoué la Silicon Valley : en octobre 2025, la « marge de calcul » (ou compute margin) d’OpenAI a atteint les 70 %. Pour bien mesurer l’exploit, il faut se rappeler qu’en janvier 2024, cette même marge plafonnait péniblement à 35 %. En l’espace de 22 mois, l’entreprise de Sam Altman a tout simplement doublé son efficacité opérationnelle.
Comment un tel virage a-t-il été possible ? Ce n’est pas de la magie, c’est de l’optimisation pure. D’abord, le coût de l’inférence s’est effondré de 99 % en deux ans. Ajoutez à cela l’utilisation massive de processeurs personnalisés et une architecture logicielle plus sobre, et vous obtenez une machine à cash. Le message est clair : faire tourner de l’IA à grande échelle est devenu, pour les leaders, une activité hautement rentable.
New!! Have AI Gross Margins Really Turned the Corner? The Real Math Behind OpenAI’s 70% Compute Margin — And Why B2B Startups Are Still Running on a Treadmill https://t.co/eocjpaMx5Q
— SaaStr.ai (@saastr) December 24, 2025
Le « tapis roulant » : le piège des startups B2B
Si OpenAI semble avoir trouvé la clé du coffre-fort, de nombreuses startups applicatives ont l’impression de courir sur un tapis roulant qui va de plus en plus vite. Pourquoi ? Parce que la concurrence est féroce. Pour ne pas se faire distancer, ces entreprises doivent intégrer les derniers modèles de « raisonnement » (comme OpenAI o1), qui sont beaucoup plus gourmands en ressources.
Dès que le coût d’un token baisse, la consommation explose car les fonctionnalités deviennent plus complexes. C’est un cercle vicieux. Résultat, alors que le fournisseur du modèle optimise ses coûts, la startup qui utilise ces outils voit ses marges stagner, voire s’effriter. Elles se retrouvent coincées entre la nécessité d’offrir une puissance toujours plus grande et l’exigence de rentabilité des investisseurs.
Cursor : l’exception qui confirme la règle
Tout n’est pas noir pour autant. L’exemple de Cursor, l’outil de développement assisté par IA, montre qu’une stratégie hybride porte ses fruits. Fin 2025, la startup a atteint une valorisation historique de 29,3 milliards de dollars après une levée de fonds record. Ce succès s’appuie sur une croissance insolente, avec un revenu récurrent annuel (ARR) qui franchit désormais la barre du milliard de dollars.
Sa force ? Une gestion au millimètre de ses modèles. En mixant intelligemment l’open-source pour les tâches simples et les modèles propriétaires pour les plus complexes, Cursor projette de faire passer ses marges brutes de 74 % à 85 %. C’est la preuve qu’en étant malin sur l’architecture technique, on peut échapper au piège du coût total.
Vers un nouveau modèle de tarification ?
L’année 2026 marquera sans doute la fin de l’insouciance. Pour protéger leurs marges, les entreprises n’ont plus le choix. Elles doivent adopter le « routage intelligent« : envoyer les requêtes basiques vers des modèles légers (type GPT-4o mini) et réserver les modèles premium aux tâches à haute valeur ajoutée.
Le modèle de l’abonnement « illimité » semble avoir vécu. Pour rester viables, de plus en plus de startups se tournent vers une facturation basée sur l’usage réel. L’enjeu est de taille : transformer l’IA d’un centre de coût massif en un levier de croissance durable. Le défi est autant technologique que comptable.
- Partager l'article :
