Google lance Gemma 4 12B son IA multimodale et locale sur PC

Google DeepMind publie le modèle Gemma 4 12B pour les ordinateurs portables

Par Mirana Publié le 6 juin 2026 & Mis à jour le 6 juin 2026 | 3 minutes de lecture

Google DeepMind lance Gemma 4 12B, un modèle d’intelligence artificielle ouvert qui comprend 12 milliards de paramètres. Ce modèle fonctionne en local sur des ordinateurs portables équipés de 16 Go de mémoire vive. Il peut prendre en charge plusieurs types de données simultanés.

L’exécution en local des modèles transforme la gestion des données numériques. Le nouveau modèle d’IA de Google permet désormais d’effectuer les calculs directement sur un ordinateur sans envoyer des requêtes vers les serveurs cloud. Cette méthode modifie le stockage et le traitement des informations au sein des terminaux a indiqué Google DeepMind sur son blog.

Une architecture unifiée sans encodeurs séparés

Ce modèle traite les données sans recourir à des encodeurs spécifiques pour chaque média. Les détails de l’architecture Gemma 4 montrent que le système projette le signal audio directement dans l’espace des jetons de texte. Le modèle emploie un module intégré au cœur du système pour le visuel. Selon le rapport technique de Google, cette méthode supprime les composants intermédiaires. Cela diminue l’utilisation de la mémoire vive et réduit la latence pendant l’inférence.

Le modèle traite le texte, l’image, la vidéo et le son dans une seule structure. Sa fenêtre de contexte s’élève à 256 000 jetons selon les explications de la plateforme Hugging. L’outil facilite ainsi l’analyse de fichiers de code. Google distribue ce modèle sous licence Apache 2.0 pour une utilisation commerciale.

Quelles sont les performances mesurées de Gemma 4 12B ?

Gemma 4 12B obtient un score de 78,8 % sur le test de raisonnement scientifique GPQA Diamond. Les données techniques publiées par le site InfoQ révèlent que la version précédente, Gemma 3 27B, atteignait un score de 42,4 % l’année dernière. Les tests de vision par ordinateur affichent un taux de réussite de 94,9 % d’après les tableaux de scores fournis par Google.

Le guide du développeur de Google indique qu’une démonstration montre le traitement d’un extrait vidéo de cinq minutes composé de 313 images et d’un signal audio. Le PDG Sundar Pichai indique dans sa communication officielle que le modèle arrive à établir un équilibre entre la taille du fichier et la capacité de calcul. Ces résultats s’inscrivent dans la continuité des recherches menées sur l’IA de DeepMind.

Pourquoi le modèle Gemma 4 12B fonctionne-t-il sur un ordinateur portable ?

Le modèle nécessite 16 Go de mémoire vive ou de mémoire vidéo (VRAM) pour s’exécuter. Les fiches techniques des constructeurs Apple et Nvidia indiquent que les ordinateurs MacBook Pro ou les machines équipées de cartes RTX disposent de ces capacités matérielles. Sur les ordinateurs Mac, l’utilisation de la mémoire unifiée partage les ressources directement avec le modèle informatique.

Meet Gemma 4 12B!

A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to your laptop, and released under an Apache 2.0 license.

Bridging the gap between edge efficiency and advanced reasoning. Here is what’s new with Gemma 4 12B: 👇 pic.twitter.com/gf4FZv0WZb
— Google Gemma (@googlegemma) June 3, 2026

De plus, des outils comme Ollama, LM Studio ou UnslothAI peuvent accueillir ce modèle afin de permettre à l’utilisateur de le configurer indiquent leurs documentations officielles. Ainsi, l’utilisateur effectue des transcriptions vocales ou des générations de code sans envoyer ses données sur un réseau externe.

Les contraintes matérielles et les risques en entreprise

Le déploiement de ces outils se heurte toutefois à des limites matérielles au sein des infrastructures professionnelles. Rishi Padhi, analyste chez Gartner, indique que les ordinateurs de bureau standard ne possèdent pas les puces NPU ou la mémoire nécessaire pour permettre à l’agent de s’exécuter en continu..

Le traitement local engendre des questionnements sur la gouvernance de l’IA et de la sécurité informatique. Anand Joshi, analyste pour TechInsights, explique que le traitement hors ligne empêche la collecte centralisée des journaux d’activité. Les entreprises peuvent rencontrer des difficultés pour vérifier la conformité des flux d’informations d’après les conclusions de Gartner.