Google teste actuellement un modèle d’IA capable de traduire la langue des signes en texte parlé. L’outil en question répond au nom de SignGemma qui n’est autre qu’une famille de la gamme Gemma de Google. Mais le modèle n’est pas encore disponible puisque le géant de Mountain View est encore en train de le tester.
Par ailleurs, SignGemma sera déployé en open source dans les mois à venir. Et il sera accessible aussi bien pour les particuliers que pour les entreprises.
À titre d’information, Google a présenté le projet SignGemma lors de la conférence I/O 2025 du 20 et 21 mai dernier.
Mais la question que je me pose, c’est : est-ce que cette IA peut vraiment suivre les mouvements des mains, ainsi que les expressions faciales pour les traduire en texte ?
Une IA de traduction de langue de signe en temps réel
J’ai donc parcouru le web et heureusement, je suis tombé sur une publication de Google DeepMind sur X qui affiche une vidéo de démonstration de SignGemma.
Le chef de produit Gemma chez DeepMind, Gus Martins affirme dans la vidéo que cette IA de traduction peut traduire en temps réel la langue des signes. Cela même dans une discussion en face à face.
Le modèle a d’ailleurs été entraîné sur des données issues de différents styles de langues des signes. Mais il semble mieux performer avec l’ASL, la langue des signes américaine.
Notre confrère MultiLingual ajoute également que SignGemma peut fonctionner localement sans connexion internet. Ce qui est un réel avantage puisqu’on peut l’utiliser même dans des zones à faible connectivité.
We're thrilled to announce SignGemma, our most capable model for translating sign language into spoken text. 🧏
— Google DeepMind (@GoogleDeepMind) May 27, 2025
This open model is coming to the Gemma model family later this year, opening up new possibilities for inclusive tech.
Share your feedback and interest in early… pic.twitter.com/NhL9G5Y8tA
Petit aperçu du fonctionnement de SignGemma
Concrètement, SignGemma va suivre, analyser et traduire les expressions faciales, les formes et les mouvements des mains en se basant sur Gemini Nano et en utilisant un transformateur de vision.
Et une fois déployé, Google envisage aussi d’intégrer cette IA de traduction de langue de signe dans ses précédents outils. Notamment Gemini Live qui est désormais gratuit pour les utilisateurs Android.
Avec toutes ces capacités, DeepMing souligne que ce sera le modèle d’IA de traduction de langue de signe le plus performant.
On attend donc sa sortie qui est prévue cette année pour voir ce qu’il vaut réellement. En attendant, Google a publié un formulaire pour ceux qui souhaitent le tester et donner leur avis.
Le formulaire est accessible via ce lien, alors n’hésitez pas. Peut-être que vous en aurez besoin, même pour aider vos proches malentendants.
- Partager l'article :
