in

OpenAI annule la mise à jour de GPT-4o après un effet inattendu

OpenAI annule la mise à jour de GPT-4o

OpenAI a apporté des modifications à GPT-4o pour rendre le modèle plus intuitif dans la génération de ses réponses. Mais la société a décidé d’annuler la mise à jour puisque sous GPT-4o, ChatGPT commençait à générer des réponses qualifiées de flagorneuses. Sur son blog, OpenAI explique pourquoi elle a annulé la mise à jour de GPT-4o.

Pour tenter de résoudre ce problème de flagornerie de ChatGPT, OpenAI teste désormais de nouveaux correctifs.

Donc en attendant que le problème soit résolu, ChatGPT bascule son modèle par défaut vers un modèle antérieur.

YouTube video

Trop d’encouragement tue la vérité

À titre d’information, la mise à jour de GPT-4o vise à améliorer le comportement du modèle vis-à-vis des besoins des utilisateurs. Et cela en fonction des tâches qui lui est attribuées.

« Quand on a élaboré les comportements de modèle GPT-4o, on a commencé par l’établissement des principes fondamentaux et des directives dans notre documentation technique de spécification. Nous avons également adopté une approche qui inclut les retours utilisateurs via un système d’évaluation positive et négative des réponses. Cela afin d’affiner la manière dont GPT-4o applique ces principes », indique OpenAI dans un communiqué.

Le problème, c’est que l’équipe en charge de cette mise à jour s’est concentrée davantage sur les retours à court terme.

Pourtant, il fallait aussi prendre en compte l’évolution des interactions des utilisateurs avec ChatGPT.

Résultat : les réponses que ChatGPT fournit deviennent de plus en plus malhonnêtes et trop encourageantes.

Comment la personnalité de ChatGPT influence-t-elle nos échanges ?

ChatGPT, d’après ce qu’a annoncé OpenAI, devrait aider ses utilisateurs à prendre les meilleures décisions tout en explorant d’autres idées et en envisageant d’autres possibilités.

Sauf que sa personnalité a un grand impact sur comment on expérimente le chatbot. Et comme la flagornerie s’est enracinée à ChatGPT, du moins au modèle GPT-4o, on peut faire face à un inconfort lors de nos interactions avec le chatbot.

« Le modèle standard possède une personnalité que l’on a développée pour représenter nos valeurs fondamentales. Notamment la serviabilité, la positivité et le respect envers les différentes perspectives et vécus des utilisateurs ».

Pourtant, ces caractéristiques, bien que bénéfiques, peuvent parfois entraîner des conséquences néfastes.

Et face à une communauté mondiale de 500 millions d’utilisateurs hebdomadaires, issus de contextes culturels variés, il devient évident qu’un profil comportemental unique ne peut satisfaire l’ensemble des attentes et des préférences individuelles.

YouTube video

Alors comment OpenAI espère-t-il résoudre ce problème de flagornerie de ChatGPT ?

La première mesure qu’OpenAI a prise, c’est l’annulation de la dernière mise à jour de GPT-4o comme je l’ai mentionné plus haut.

OpenAI indique également qu’ils sont sur le point de travailler sur une révision approfondie des méthodes d’entraînement. Cela tout en affinant les invites du système pour tenter d’éloigner le modèle de la flagornerie.

Parallèlement, il y aura aussi lieu de renforcement des mécanismes de protection qui visent cette fois-ci à améliorer la franchise et la clarté des réponses de ChatGPT sous GPT-4o.

Dans quelques jours, voire quelques semaines, il sera aussi possible de participer aux phases de test préliminaires. Et donc de partager nos observations avant le déploiement des prochaines mises à jour.

Et à ce titre justement, OpenAI envisage d’élargir son processus d’évaluation. Pour ce faire, Sam Altman et ses équipes devront s’appuyer sur leurs travaux de recherche actuels. Mais aussi et sur leurs références techniques.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *