OpenAI présente des modèles avancés de transcription et de voix | VBM | par Marcus Spencer | Média de barre vertical | Mars 2025

Intelligence Artificielle
Noesis News
mars 23, 2025
0
207
6 minutes de lecture

– Openai a dévoilé des mises à niveau significatives à sa transcription et à sa génération de voix IA Modèles, marquant un bond en avant dans le domaine du traitement audio. Ces améliorations, annoncées sur 20 mars 2025, Visez à améliorer la précision, la fiabilité et la personnalisation des développeurs et des utilisateurs.

Les nouveaux modèles, nommés GPT-4O Transcribe et GPT-4O Mini transcribeRemplacez l’ancien Chuchoter modèle et Offrez des performances supérieures dans les tâches de la parole à texte. Openai affirme que ces modèles excellent dans des scénarios difficiles, tels que des environnements avec des accents forts, un bruit de fond ou des vitesses de parole variables.

Les mises à niveau incluent un taux d’erreur de mots réduit et une reconnaissance améliorée du langage, ce qui les rend particulièrement efficaces pour les applications comme le service client, la transcription des réunions et plus.

En plus de la transcription, Openai a introduit le GPT-4O MINI TTS (text-vocation) modèle, ce qui permet aux développeurs de personnaliser les sorties vocales avec une précision sans précédent. Ce modèle peut ajuster le ton, l’émotion et la vitesse, permettant aux applications allant des agents du service client empathique à la narration dynamique. Les développeurs peuvent désormais demander au modèle de «parler comme un agent de service client sympathique» ou d’adopter d’autres styles vocaux spécifiques3.

Ces avancées font partie de Openai une vision plus large pour créer plus intuitif et interactif IA Systèmes. Les nouveaux modèles sont disponibles via API d’Openaioffrant aux développeurs des outils pour construire des agents vocaux plus robustes et polyvalents. Openai a également intégré ces modèles avec son SDK des agents, rationalisation du processus de développement pour les applications audio.

Openai est activement S’engager avec la communauté à travers des événements Comme le «Recherche profonde sur le forum OpenAI»Session virtuelle prévue pour 28 mars 2025.

Nous serons sûrs de faire rapport sur les histoires et les annonces futures impliquant Openai et les activités de ses entreprises. 😁

Source link

OpenAI présente des modèles avancés de transcription et de voix | VBM | par Marcus Spencer | Média de barre vertical | Mars 2025

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Arrêter d’écrire un python désordonné: un cours accidentel...

The best sunglasses for seniors in 2025, according...

40 mèmes hilarants relatables partagés sur le compte...

WELEVEL RAshes 5,7 millions de dollars au développement...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags