DeepSeek, une startup financée par un fonds quantitatif chinois, a dévoilé DeepSeek-R1. Ce modèle d’intelligence artificielle se positionne comme un concurrent direct du célèbre modèle o1 d’OpenAI.
En adoptant une approche axée sur le raisonnement, DeepSeek-R1 marque une étape clé dans l’évolution des capacités des IA modernes. Contrairement à d’autres modèles, il analyse chaque requête en profondeur avant d’exécuter ses réponses.
DeepSeek-R1 repose sur une technique innovante appelée « calcul au moment des tests ». Cette méthode permet à l’IA de prendre le temps de réfléchir pour résoudre des tâches complexes. Par exemple, elle divise le processus en plusieurs étapes, ce qui améliore la précision des réponses. Cependant, cette réflexion plus lente peut faire patienter l’utilisateur plusieurs dizaines de secondes selon la complexité de la question.
Des performances solides, mais des limites notables
DeepSeek affirme que son modèle surpasse plusieurs IA sur des benchmarks comme AIME et MATH. Ces tests évaluent des compétences complexes, comme la résolution de problèmes mathématiques ou l’interprétation avancée de données. Malgré cela, certaines lacunes subsistent. L’IA échoue parfois sur des tâches logiques simples, comme le morpion.
Les problèmes de sécurité représentent aussi un défi majeur. Par exemple, des utilisateurs ont réussi à contourner ses mesures de protection pour obtenir des informations sensibles. Un cas marquant a été la fourniture d’une recette de méthamphétamine.
Une IA sous influence politique
Les IA chinoises, comme DeepSeek-R1, doivent se conformer à des règles strictes imposées par le gouvernement. Ces modèles sont programmés pour respecter les valeurs socialistes. En conséquence, ils refusent de répondre à certaines questions sensibles, notamment sur la place Tiananmen ou la politique chinoise. Ces restrictions soulignent une différence majeure avec leurs homologues occidentales, qui jouissent d’une plus grande liberté.
DeepSeek n’en est pas à son premier succès. Avec le modèle DeepSeek-V2, elle a contraint des géants comme ByteDance ou Alibaba à baisser leurs tarifs. Cette stratégie agressive a renforcé sa position sur le marché.
Pour entraîner ses modèles, High-Flyer Capital Management, le fonds derrière DeepSeek, a investi massivement dans des infrastructures technologiques. Ses clusters de 10 000 GPU Nvidia A100 lui permettent de rivaliser avec les laboratoires occidentaux.
Une stratégie open source pour l’avenir
DeepSeek prévoit de rendre le code source de DeepSeek-R1 accessible en open source et de proposer une API. Cette approche vise à démocratiser son IA tout en consolidant sa place sur la scène mondiale. Selon les ambitions de DeepSeek, l’objectif ultime reste la création d’une IA « superintelligente » capable de rivaliser avec les meilleurs modèles actuels.
- Partager l'article :