in

Computer Use, cette IA de Google exécute les tâches à votre place sur Chrome

Google Chrome IA

Savez-vous que Google a lui aussi lancé une IA qui peut naviguer sur Chrome à notre place ? Eh oui, ce n’est autre que Gemini 2.5 Computer Use qui a la capacité de taper du texte, de faire défiler un onglet et même de remplir des formulaires sans intervention de notre part.

C’est d’ailleurs la réponse de Google face à ChatGPT Agent qui nous a fait peur avec ses premiers bugs au mois de juillet.

Une IA qui comprend le web comme un humain

Jusqu’ici, les IA se contentaient de générer du texte ou de répondre à des questions. Mais Gemini 2.5 va beaucoup plus loin avec le lancement de Gemini 2.5 Computer Use Model.

Elle interagit directement avec l’interface du navigateur. Grâce à un système de vision et de raisonnement, elle analyse les captures d’écran, comprend les éléments affichés (boutons, champs, menus), puis décide quelle action entreprendre.

En clair, comme on le fait d’habitude sur Chrome, cette IA voit tout ce qui se passe sur les pages web que l’on consulte.

Elle réfléchit, clique au bon endroit, vérifie le résultat… et recommence.

YouTube video

Mais que peut faire cette nouvelle IA de Google Chrome exactement ?

Google a défini 13 actions standardisées pour encadrer le comportement de son agent intelligent. 

Comme mentionné plus haut, l’IA de Google Chrome peut cliquer, écrire, faire défiler, glisser-déposer, cocher, soumettre des formulaires, etc.

Ces gestes simples lui permettent pourtant d’accomplir des tâches complexes. Comme réserver un hôtel sur un site de voyage, comparer des produits en ligne, envoyer un message via un formulaire de contact ou même jouer au jeu 2048 sans aucune aide humaine.

Une autonomie encadrée pour la sécurité

Google a toutefois choisi de limiter la portée de son IA. Gemini 2.5 ne contrôle donc que le navigateur Chrome, et non l’ensemble du système d’exploitation.

Un choix assumé par le géant californien, qui met en avant des raisons de sécurité, de fiabilité et de transparence.

Et d’ailleurs, on peut tracer et vérifier chaque action que l’IA effectue. On évite ainsi toutes tentatives d’utilisation abusives.

Mais est-ce suffisant pour rivaliser avec OpenAI et Anthropic ? En tout cas, ce lancement n’arrive pas par hasard.

OpenAI travaille déjà sur des agents capables d’interagir avec des applications, et Anthropic avance sur des assistants contextuels puissants.

Avec Gemini 2.5, Google veut reprendre la main dans la course à l’automatisation intelligente, en proposant une IA qui agit dans l’environnement qu’il maîtrise le mieux : Chrome.

Selon les premiers retours, Gemini 2.5 afficherait d’excellentes performances sur des benchmarks web, avec une latence réduite et une compréhension visuelle améliorée. 

Certes, ce sont des chiffres qui sont encore à confirmer, mais ils laissent entrevoir un énorme potentiel.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !