in

Nouvelles mises à jour du modèle vocal d’OpenAI, à quoi s’attendre ?

Activation modèle vocal IA d'OpenAI

Après la course au chatbots, les grandes entreprises d’intelligences artificielles se lancent aujourd’hui dans le développement de modèles d’IA vocale. Et si Amazon vient de déployer Alexa+, OpenAI vient de dévoiler ses propres modèles vocaux. Il s’agit de GPT-4o-transcribe, GPT-4o-mini-transcribe et GPT-4o-mini-tts.

À ce qu’il paraît, ces modèles dont déjà disponibles via l’API d’OpenAI. Quant à leurs prix, on en parlera plus tard.

En attendant, je vous propose de découvrir à quoi serviront les nouveaux modèles d’IA vocaux d’OpenAI et à qui ils sont destinés.

YouTube video

À quoi devrait-on s’attendre avec ces modèles d’IA vocaux d’OpenAI ?

Les modèles vocaux GPT-4o-transcribe d’OpenAI serviront avant tout aux développeurs de créer leurs propres applications.

Mais cela ne vous empêche pas, en tant que particulier, de les tester, même pour vous amuser. Ils sont d’ailleurs disponibles sur openai.fm, le site de démonstration de l’entreprise.

Une fois sur le site, vous vous apercevrez qu’il est tout à fait possible de personnaliser les voix via une description textuelle.

Hauteur, accent, ton et autres qualités vocales, tout est personnalisable. Et c’est une stratégie qui devrait permettre à OpenAI d’éviter les éventuelles correspondances pouvant conduire à des poursuites judiciaires. Comme ce qu’il s’est passé avec la star hollywoodienne Scarlett Johansson.

Aussi, cette possibilité de personnalisation devrait offrir aux utilisateurs la possibilité de choisir le son de l’IA vocale quand ils engagent une discussion avec l’une de celles-ci.

Le successeur de Whisper

D’après ce qu’a déclaré Jeff Harris, personnel technique d’OpenAI, gpt-4o-transcribe vient remplacer Whisper, le modèle de synthèse vocale de l’entreprise.

Par contre, le modèle bénéficie de données supplémentaires pour offrir une meilleure performance en matière de transcription et d’expression orale.

Pour ce qui est de sa disponibilité sur ChatGPT, OpenAI n’a pas encore mentionné de date précise. On devrait alors se contenter d’une utilisation exclusive sur les API d’OpenAI.

En tout cas, gpt-4o-transcribe est mieux performant dans les environnements bruyants et prend en charge plus de 100 langues.

représentation modèle vocal gpt-4o-transcribe OpenAI

Les fonctionnalités incluses dans les modèles gpt-4o-transcribe

Parmi les nouvelles fonctionnalités des modèles d’IA vocaux d’OpenAI, les gpt-4o-transcribe, on devrait s’attendre à un détecteur d’activité vocale sémantique et une fonction de suppression de bruit.

Par contre, ni le modèle GPT-4o-mini-transcribe ni le GPT-4o-mini-tts ne prend en charge la diarisation. C’est-à-dire la technique qui permet de partitionner un flux audio et de segmenter le contenu selon l’identité des locuteurs.

En d’autres termes, la conception du modèle gpt-4o-transcribe vise à lui donner la capacité de recevoir une ou plusieurs voix sur un seul canal d’entrée pour y répondre par une seule voix de sortie.

En somme, ses modèles d’IA vocaux d’OpenAI s’adaptent avec perfection à certains secteurs comme les centres d’appels, les assistants alimentés par intelligence artificielle, et la transcription audio.

Comme promis, voici le prix à payer pour accéder aux modèles GPT-4o-transcribe d’OpenAI

Comme mentionné plus haut, les nouveaux modèles d’IA vocaux d’OpenAI sont déjà disponibles via l’API de la société. Reste à savoir combien coûte l’adhésion.

Eh bien, d’après OpenAI, le modèle gpt-4o-transcribe est proposé à 6,00 $ par million de jetons d’entrée audio, soit environ 0,006 $ par minute.

En ce qui concerne le modèle gpt-4o-mini-transcribe, il est disponible pour 3,00 $ par million de jetons d’entrée audio, ce qui revient approximativement à 0,003 $ par minute.

Quant au modèle gpt-4o-mini-tts, il est facturé 0,60 $ par million de jetons d’entrée de texte et 12,00 $ par million de jetons de sortie audio, représentant environ 0,015 $ par minute.

Restez à la pointe de l'information avec INTELLIGENCE-ARTIFICIELLE.COM !

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *