in ,

Textes générés par ChatGPT : les signes qui ne trompent pas

L’IA devient un outil incontournable, mais elle laisse encore des indices derrière elle. , développé par , produit des textes généralement reconnaissables grâce à un style distinctif et des expressions récurrentes. Alors, comment savoir si un texte a été rédigé par une IA ?

Une caractéristique des textes générés par ChatGPT réside dans leur ton souvent formel et pompeux. Selon la newsletter TechnoPreneurship, l’IA utilise fréquemment des formulations lourdes comme « il est important de noter », « comme nous l’avons vu » ou encore « plonger dans les détails ».

Les textes sont aussi truffés de connecteurs logiques tels que « donc », « cependant » et « en outre », parfois en trop grande quantité. Cette structure très organisée, bien que fluide, peut trahir un contenu généré par IA, surtout lorsqu’elle semble artificielle.

ChatGPT emploie certains mots beaucoup plus souvent que le langage humain classique. Jordan Gibbs, un spécialiste de l’IA, a mené une en comparant les réponses de l’IA avec les fréquences de mots utilisés sur Internet.

Les résultats sont surprenants. L’IA utilise le mot « réinventé » 1 033 fois plus souvent que la moyenne, « bioluminescent » 650 fois plus souvent et « verdoyant » 600 fois plus souvent. D’autres termes comme « plonger », « vital », « embarquer » et « exceller » apparaissent également de manière disproportionnée.

Ces choix lexicaux s’expliquent par l’entraînement du modèle, qui privilégie des tournures marquantes et parfois exagérées pour structurer ses réponses.

YouTube video

L’influence du renforcement humain

Si ChatGPT est censé reproduire le langage humain, pourquoi affiche-t-il ces différences ? La réponse réside dans l’étape de renforcement par feedback humain. Cette phase consiste à faire tester l’IA par des humains qui évaluent la qualité de ses réponses.

D’après The Guardian, ces évaluateurs sont généralement basés au Nigeria, Kenya ou Madagascar. Ce sont des régions anglophones où certaines tournures de phrases sont plus courantes. C’est notamment le cas de « delve into » (plonger dans), une expression largement utilisée dans ces pays et qui figure aujourd’hui parmi les plus fréquentes dans les textes générés par ChatGPT.

Une méthode de détection qui pourrait devenir obsolète

Si ces indices permettent d’identifier un texte produit par l’IA, ils risquent de devenir moins pertinents à mesure que les utilisateurs affinent leurs requêtes. En ajustant les prompts, il est possible de demander à l’IA d’éviter certaines expressions ou d’adopter un style spécifique.

Ainsi, la frontière entre un texte humain et un texte généré par IA devient de plus en plus floue. Alors que les modèles d’IA s’améliorent, la détection ne repose plus uniquement sur des schémas , mais sur une analyse plus fine du contenu et du contexte.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *