ProGen, c’est le nom du programme qui a servi à la création d’enzymes artificielles grâce à l’IA. Les chercheurs ont trouvé un moyen de créer des séquences d’acides aminés grâce à l’intelligence artificielle.
En effet, cette nouvelle étude a abouti à la création d’un outil qui serait capable de créer des enzymes artificielles en partant de zéro. Bien entendu, leurs séquences d’acides aminés s’opposent aux protéines naturelles. Mais ces enzymes artificielles créées artificiellement sont bel et bien fonctionnelles.
Traitement de langage naturel : base de la formation de ProGen
Selon les scientifiques en charge du développement du programme ProGen, le traitement du langage naturel serait la base de cette étude. Et bien qu’il soit généralement utilisé pour générer des textes, le NLP peut aussi servir à la formation d’un modèle d’apprentissage automatique dans la biologie. Pour le cas de Salesforce Research, le programme ProGen utilise la technique de prédiction pour créer des protéines artificielles. Et donc d’assembler des séquences d’acides aminés.
Le professeur en bio-ingénierie et en sciences thérapeutique, James Fraser, ne tarde pas à donner son avis sur le programme ProGen. « Si l’on compare la conception artificielle de la conception inspirée, la première approche est plus efficace », ajoute-t-il. Et toujours selon le Fraser, le NLP se différencie du processus évolutif habituel. Il s’agit d’un modèle linguistique ayant la capacité d’apprendre et de comprendre les aspects de l’évolution.
« Avec l’intelligence artificielle et le NLP, nous pouvons maintenant générer des protéines artificielles. Cette technologie nous permet également d’ajuster les résultats pour que les enzymes puissent offrir des effets spécifiques. Et à ce stade, il nous est possible de créer des enzymes qui ne vont pas interagir avec les autres protéines », a-t-il ajouté.
280 millions de protéines et 56 000 séquences pour former le programme
Pour arriver à créer le programme ProGen, les scientifiques l’ont amorcé avec pas moins de 56 000 séquences d’acides aminés. Ils ont également ajouté certaines informations contextuelles sur les protéines. Mais avant, il fallait former le modèle sur les séquences de 280 millions de protéines différentes.
Suite à cela, le programme ProGen a généré jusqu’à 1 million de séquences. Mais James Fraser et son équipe en ont sélectionné une centaine pour réaliser des tests. Le choix reposait alors sur les caractéristiques similaires de ces protéines aux protéines naturelles. Mais aussi sur le caractère naturaliste de la sémantique et de la grammaire des acides aminés sous-jacents des protéines AI.
5 enzymes artificielles ont alors été créées sur ce lot de 100 protéines et servaient de base pour la comparaison. Deux d’entre elles avaient la capacité de décomposer les parois cellulaires des bactéries. Et cela malgré un taux de 18 % de similitude au niveau des deux séquences. À titre d’information, une seule mutation peut provoquer un dysfonctionnement de la protéine artificielle. Mais l’équipe du professeur Fraser a démontré dans une autre recherche que même à taux de ressemblance de 31 %, les enzymes artificielles générées par l’IA présentent toujours une activité.
- Partager l'article :