Après l’incident qu’a fait objet DeepSeek la semaine dernière, les chercheurs affirment avoir trouvé un moyen de contourner les mesures de protection mis en place par la start-up chinoise en ce qui concerne son modèle d’IA. Des analystes de Wallarm ont cependant réussi à jailbreaker le système de DeepSeek, c’est-à-dire à accéder aux instructions secrètes qui régissent son fonctionnement. Cette intrusion leur a permis de mettre au jour l’ensemble des directives qui encadrent le comportement de l’IA. Mais aussi d’obtenir des aveux concernant l’utilisation présumée des technologies OpenAI dans son développement.
Cela dit, ces mêmes chercheurs ont révélé l’ensemble du système d’invite. Soit une série d’instructions internes en langage clair définissant le comportement et les limites de l’IA.
Ils sont également parvenus à pousser DeepSeek à reconnaître certaines rumeurs selon lesquelles sa formation aurait impliqué une technologie mise au point par OpenAI.
DeepSeek jailbreaké, les chercheurs gardent le silence pour protéger les autres LLM
Après avoir été averti par Wallarm de la vulnérabilité exploitée, DeepSeek a rapidement corrigé la faille.
Néanmoins, afin d’éviter que des attaques similaires ne ciblent d’autres modèles de langage (LLM) largement utilisés, les chercheurs ont choisi de ne pas révéler les aspects techniques de l’opération.
« Cela demandait un peu de développement, mais ce n’est pas comparable à un piratage classique où l’on injecte un code malveillant pour prendre le contrôle », précise Ivan Novikov, PDG de Wallarm.
« Ici, il s’agissait plutôt d’amener le modèle à répondre d’une certaine manière, ce qui a permis de contourner certains mécanismes de sécurité internes », a-t-il ajouté.
L’hypothèse de jailbreak de DeepSeek expliquée
En contournant les mécanismes de sécurité, les chercheurs ont pu accéder au message système complet de DeepSeek.
Pour évaluer ses spécificités, ils ont soumis ce texte à GPT-4o d’OpenAI afin d’obtenir une analyse comparative.
Il en ressort que GPT-4o adopte une approche plus souple et créative, notamment lorsqu’il traite des sujets sensibles.
Au cours de leur exploration approfondie, les chercheurs de Wallarm ont relevé un autre élément intéressant.
En mode jailbreak, DeepSeek semblait suggérer une possible transmission de connaissances issues des modèles d’OpenAI.

Toutefois, ils se sont gardés de tirer des conclusions hâtives ou d’affirmer qu’il s’agissait d’une violation de propriété intellectuelle.
DeepSeek sous le Feu des Attaques DDoS après avoir provoqué un séisme à Wall Street
Depuis son lancement mondial le 15 janvier, DeepSeek a connu une montée en flèche. En seulement deux semaines, l’application a dépassé les 2 millions de téléchargements.
Sa popularité grandissante, ses performances impressionnantes et son faible coût de développement ont provoqué un véritable séisme dans la Silicon Valley et semé l’inquiétude à Wall Street.
Le 27 janvier, l’impact a été tel qu’il a contribué à une baisse de 3,4 % du Nasdaq Composite, entraînant une perte de 600 milliards de dollars pour Nvidia. Et c’est un record historique pour une seule journée.
Parallèlement à cette ascension fulgurante, DeepSeek a été ciblé par une attaque massive par déni de service distribué (DDoS).
Selon l’entreprise chinoise de cybersécurité XLab, les attaques auraient débuté dès le 3 janvier.
Ces dernières impliquaient des milliers d’adresses IP situées aux États-Unis, à Singapour, aux Pays-Bas, en Allemagne et même en Chine.
- Partager l'article :