Sécurité accrue : la mise à échelle d’Anthropic à l'œuvre

Verrouillage des IA : l’insubordination stoppée net par la mise à jour d’Anthropic

Par Ismael R. Publié le 17 octobre 2024 | 2 minutes de lecture

Anthropic, à l’origine du chatbot Claude, met à jour sa politique de mise à l’échelle responsable. Cette initiative vise à prévenir les abus de l’IA tout en fixant de nouvelles normes de sécurité pour le secteur.

Introduit en 2023, le cadre de mise à l’échelle responsable d’Anthropic a été révisé afin d’anticiper les menaces potentielles des systèmes d’IA avancés. Avec cette mise à jour, l’entreprise réaffirme son engagement à garantir que l’innovation technologique ne compromettra jamais la sécurité. Les nouveaux protocoles définissent des niveaux de capacité critiques. Une fois ces seuils atteints, des mesures de protection renforcées doivent être activées pour éviter tout usage malveillant de la technologie.

En outre, Anthropic cible des domaines critiques comme la fabrication d’armes biologiques et la recherche autonome. Ces seuils de capacité agissent comme des signaux d’alerte et déclenchent des audits obligatoires avant toute poursuite du développement des modèles.

L’entreprise adopte également des pratiques similaires à celles de la biosécurité. Son système de sécurité à plusieurs niveaux (ASL) pousse les modèles présentant des risques significatifs à passer sous une surveillance renforcée. Ces étapes garantissent un contrôle strict des IA aux performances avancées.

Un modèle pour encourager la sécurité dans toute l’industrie

Anthropic souhaite que sa politique serve de modèle pour le secteur de l’intelligence artificielle. La mise en place de niveaux de sécurité, de l’ASL-2 (normes actuelles) à l’ASL-3 (mesures strictes), crée un standard pour développer l’IA en toute transparence. Ces étapes pourraient engendrer une « course vers le sommet » de la sécurité.

L’entreprise continue de s’appuyer sur un responsable de la mise à l’échelle (RSO) pour superviser la conformité avec sa politique. Ce poste, déjà introduit en 2023, voit ses responsabilités élargies. Le RSO peut suspendre tout déploiement de modèles si les protections nécessaires ne sont pas en place. Le contrôle exercé pourrait inspirer d’autres entreprises à adopter des pratiques similaires, notamment dans la gestion des IA autonomes.

mise à échelle Anthropic
Sécurité IA
Modèles d’intelligence artificielle
Claude chatbot

La mise à jour d’Anthropic intervient dans un contexte où les régulateurs des États-Unis et de l’Europe cherchent à encadrer les IA puissantes. Les seuils de capacité introduits pourraient servir de base pour des régulations futures, en offrant un cadre clair aux autorités. Anthropic s’engage également à partager ses rapports et évaluations. Cette transparence pourrait ainsi renforcer la confiance entre les développeurs d’IA et les régulateurs.

Anticiper l’évolution rapide des technologies IA

Avec cette mise à jour, Anthropic ne se limite pas à répondre aux menaces actuelles, mais prépare aussi l’avenir. La politique prévoit des ajustements réguliers pour faire face aux nouveaux défis que posent les IA en constante évolution.

Cette nouvelle politique d’Anthropic s’inscrit dans une démarche ambitieuse de sécurisation de l’IA. En équilibrant innovation et protection, l’entreprise espère poser les fondations d’une industrie où la performance technologique va de pair avec des standards de sécurité élevés.