Les horizons de ChatGPT s’élargissent puisque OpenAI a ajouté des capacités reconnaissance d’image son IA déjà révolutionnaire, en plus d’une voix. Alors que nous vivons dans un monde dans lequel la concurrence technologique s’accroît, ces innovations placent ChatGPT au rang d’un outil encore plus interactif et polyvalent.
Depuis le lancement de ChatGPT, il est devenu un assistant IA génératif ultra efficace et célèbre, et cela ne cesse de s’accroître. Actuellement, OpenAI franchit une nouvelle ère en donnant à cette application IA de fonctionnalités de conversation vocale et de reconnaissance d’image. Il s’agit d’une révolution qui fait de ce chatbot textuel un compagnon interactif et multimodal. Le timing de cette avancée entre parfaitement dans le cadre des batailles existant entre les grands géants technologiques dans le domaine de l’IA générative.
Une voix à ChatGPT pour une interaction plus humaine
Vous ne rêvez pas, OpenAI est sur le point de bouleverser le domaine de l’IA générative. ChatGPT peut désormais produire des voix de type humain grâce à un nouveau modèle de synthèse vocale. Pour ce faire, il a besoin de texte et de quelques secondes de parole échantillonnée.
Les avantages ? Les utilisateurs peuvent dialoguer vocalement avec ChatGPT. Comme toujours, cette application peut répondre à plusieurs requêtes. Les utilisateurs peuvent éventuellement demander de créer des histoires. ChatGPT peut très bien aussi répondre à des questions de façon orale.
Cette nouvelle technologie d’OpenAI n’est pas qu’un simple développement. L’IA avec une faculté de conversation est le début d’une évolution notable qui associe les assistants vocaux familiers à des modèles de langage étendu puissants. Par ailleurs, elle ouvre la porte à de nombreuses applications créatives et axées sur l’accessibilité.
Conversation IA: Une innovation au cœur d’un partenariat
Pour révolutionner le domaine de l’IA, OpenAI avait besoin d’un allié et Spotify a été présente. Cette plateforme se révèle être le parfait partenaire de lancement. Ainsi, l’entreprise n’a pas hésité à introduire dans son outil une fonctionnalité qui permet aux podcasteurs de traduire leurs émissions et par la même occasion garder leur voix originale.
De plus, OpenAI a coopéré avec des acteurs de voix avérés pour générer cinq voix différentes. Pour ce faire, il se sert de son système de reconnaissance vocale Whisper. Cette innovation et ces partenariats sont les signes du grand potentiel de la technologie vocale. Ils montrent également la manière dont elle peut être utilisée de façon responsable et créative.
Certes, ces avancées technologiques ouvrent la porte à de nouvelles possibilités. Toutefois, elles introduisent aussi à d’éventuels risques, à savoir l’usurpation d’identité et la fraude. Cela dit, OpenAI est tout à fait conscient de ces défis. C’est la raison pour laquelle elle cherche par tous les moyens à déployer ces fonctionnalités de conversation d’IA de manière responsable.
Notez que ces nouvelles fonctionnalités sont accessibles uniquement via la formule d’abonnement payants Plus et Enterprise dans les deux prochaines semaines. Elles seront aussi réservées uniquement aux applications ChatGPT Android et iOS.
- Partager l'article :