NVIDIA dévoile un modèle IA ultraléger, prêt pour votre ordinateur !

NVIDIA a récemment créé un nouveau modèle d’intelligence artificielle, plus petit et plus léger. Il s’agit du fruit de la collaboration entre le géant des cartes graphiques et de Mistral AI, une société française spécialisée dans l’IA. Le nouveau modènle, baptisé Mistral NeMo Minitro 8B, n’est autre qu’une version réduite du modèle Mistral Nemo 12B. Mais son avantage, c’est qu’il peut fonctionner sur des ordinateurs normaux, à condition qu’ils aient une carte graphique NVIDIA RTX.

Bryan Catanzaro, un haut responsable chez NVIDIA, nous explique comment son équipe a amélioré leur modèle d’intelligence artificielle.

Ils ont utilisé deux techniques principales pour rendre le modèle plus efficace : l’élagage et la distillation.

« C’est un peu comme tailler un arbre. On a réduit le nombre de paramètres, qui sont les éléments de base du modèle, de 12 milliards à 8 milliards », a-t-il ajouté.

Pourquoi les LLM ne peuvent pas fonctionner sur nos appareils ?

La popularité des LLM n’ont cessé d’augmenter ces dernières années. On les utilise d’ailleurs pour beaucoup de choses, comme créer des histoires interactives ou des assistants IA sur nos téléphones.

Mais ils ont tous un problème commun. Ils ont une taille monumentale et ont besoin d’ordinateurs très puissants pour fonctionner. C’est pourquoi on ne peut pas les utiliser directement sur nos appareils personnels.

C’est là que les petits modèles de langage entrent en jeu. Les modèles comme Mistral NeMo Minitron sont conçus spécialement pour fonctionner sur nos appareils.

🌟 The best 8B Base model via pruning and distillation!

🚀 Introducing Mistral-NeMo-Minitron-8B-Base model we derived from the recent Mistral-NeMo-12B.
Our recipe: finetune teacher on 100B tokens, prune to 8B params, run teacher-student distillation on <400B tokens.
Result: the… pic.twitter.com/DWrXJEd3tY
— Pavlo Molchanov (@PavloMolchanov) August 21, 2024

On n’a donc pas à nous connecter à de gros serveurs pour avoir accès un modèle plus précis et pkus fiable.

Et le Mistral-NeMo-Minitron 8B dont on parle est justement un bon exemple de petit modèle, même s’il reste assez gros avec ses huit milliards de paramètres.

Pour l’utiliser, il faut quand même des ordinateurs assez puissants, qu’on appelle des stations de travail haut de gamme.

Ces ordinateurs doivent d’ailleurs être équipés de cartes graphiques spéciales de NVIDIA, les RTX, qui sont très performantes pour ce genre de tâches.

Enfin un modèle qui peut fonctionner sur un ordinateur personnel

Cette version plus petite de Mistral NeMo est vraiment impressionnante. Même si elle est plus légère, elle fonctionne aussi bien que la version originale. Mais comment ont-ils fait ?

En gros, Nvidia et Mistral ont fait le tri dans leur modèle en gardant seulement les parties les plus importantes pour la précision.

Imaginez que vous rangiez votre placard. Vous allez sûrement garder les vêtements que vous portez souvent et vous vous débarrassez de ceux que vous n’utilisez jamais.

C’est un peu ce qu’ils ont fait avec le modèle Mistral Nemo 12B. Par ailleurs, ils ont également réduit la quantité de données nécessaires pour entraîner le modèle.

Nvidia just dropped Mistral NeMo Minitron 8B – Distilled + pruned from 12B, commercially permissive license, and beats the teacher (12B) on multiple benchmarks!

> Achieves similar benchmarks as Mistral NeMo 12B, beats Llama 3.1 8B
> MMLU – L3.1 8B (65), NeMo Minitron 8B (69.5),… pic.twitter.com/4GqyF3U1jT
— Vaibhav (VB) Srivastav (@reach_vb) August 21, 2024

En d’autres termes, au lieu d’apprendre avec une bibliothèque entière, Mistral NeMo Minitron 8B apprenait avec seulement quelques livres bien choisis.

Résultat : le modèle n’a besoin que d’un quarantième du temps de calcul par rapport à l’original pour être entraîné.

Mais ils ne se sont pas arrêtés là. NVIDIA a aussi utilisé les mêmes techniques pour créer un modèle encore plus petit, appelé Nemotron-4 4B Instruct.

Celui-ci est spécialement conçu pour fonctionner sur des ordinateurs personnels et des ordinateurs portables ordinaires.

NVIDIA veut l’utiliser pour apporter ce qu’ils appellent la technologie humaine numérique de pointe dans les jeux vidéo.

Cela pourrait signifier des personnages de jeux plus intelligents ou, pourquoi pas, des interactions plus naturelles dans les jeux.

Partager l'article :

Facebook
Twitter
LinkedIn

Restez à la pointe de l'information avec
INTELLIGENCE-ARTIFICIELLE.COM !

Abonnez-vous à notre chaîne YouTube et rejoignez-nous sur Actualités

ChatGPT et la recommandation par l’IA : comment OpenAI personnalise le divertissement

Un soir, un internaute ouvre ChatGPT pour préparer un week-end. En quelques échanges, l’assistant ne se contente plus de répondre : il anticipe, suggère un

16 juin 2026

Business Industrie

L’AI Engineer transforme les modèles d’IA en solutions opérationnelles pour les entreprises

L’AI Engineer incarne la nouvelle génération de professionnels capables de transformer les promesses de l’intelligence artificielle en usages concrets. Ce métier hybride allie expertise technique

1 juin 2026

Industrie

28 géants français s’allient pour bâtir une giga-usine de l’IA à 10 milliards d’euros

Face à l’hégémonie écrasante des superpuissances américaines et chinoises, la réplique technologique européenne s’organise enfin depuis Paris. Un consortium inédit de 28 grandes entreprises tricolores

26 mai 2026

Industrie

Coup d’éclat : l’acquisition de Fractional AI par Anthropic et Blackstone est officielle

Le secteur de la technologie franchit un nouveau cap. Ce 21 mai 2026, la nouvelle entreprise de services d’IA, propulsée par Anthropic, Blackstone et Hellman

24 mai 2026

Industrie

En rachetant Emmi AI, Mistral AI serait la première start-up à pouvoir modéliser le monde physique

Le mardi 19 mai 2026, le fleuron français Mistral AI a officialisé l’acquisition stratégique de la pépite autrichienne Emmi AI. Son objectif serait en effet

20 mai 2026

Industrie

Un coup de boost pour les robots humanoïdes avec l’IA

Le prochain Robotics Summit de Boston va dévoiler des technologies incroyables. Les robots humanoïdes intègrent désormais notre réalité. La robotique moderne progresse vers des sommets

19 mai 2026

1 réflexion au sujet de « NVIDIA dévoile un modèle IA ultraléger, prêt pour votre ordinateur ! »

Euh …. Des llms sur pc individuel ca existe depuis un moment … Lama , mistral , orca…et qui tourne sur CPU ou GPU. Pas besoin spécifiquement de NVIDIA pour . Gpt4all est une bonne UI pour faire tourner tout cela d’ailleurs .Vous êtes vous un minimum renseigné avant de publié ce billet d’info trompeur ?

Répondre

NVIDIA dévoile un modèle IA ultraléger, prêt pour votre ordinateur !

Pourquoi les LLM ne peuvent pas fonctionner sur nos appareils ?

Enfin un modèle qui peut fonctionner sur un ordinateur personnel

ChatGPT et la recommandation par l’IA : comment OpenAI personnalise le divertissement

L’AI Engineer transforme les modèles d’IA en solutions opérationnelles pour les entreprises

28 géants français s’allient pour bâtir une giga-usine de l’IA à 10 milliards d’euros

Coup d’éclat : l’acquisition de Fractional AI par Anthropic et Blackstone est officielle

En rachetant Emmi AI, Mistral AI serait la première start-up à pouvoir modéliser le monde physique

Un coup de boost pour les robots humanoïdes avec l’IA

1 réflexion au sujet de « NVIDIA dévoile un modèle IA ultraléger, prêt pour votre ordinateur ! »

Laisser un commentaire Annuler la réponse

IA, conformité et souveraineté : l’open source européen pour la protection des données publiques

L’IA sur-mesure, un impératif légal face à l’urgence de la conformité

Pourquoi les femmes sont au cœur de l’urgence légale et éthique de l’IA ?

Pourquoi les LLM ne peuvent pas fonctionner sur nos appareils ?

Enfin un modèle qui peut fonctionner sur un ordinateur personnel

ARTICLES SIMILAIRES

1 réflexion au sujet de « NVIDIA dévoile un modèle IA ultraléger, prêt pour votre ordinateur ! »

Laisser un commentaire Annuler la réponse

Tendances

La newsletter IA du futur

Interviews

Pourquoi les LLM ne peuvent pas fonctionner sur nos appareils ?