OpenAI présente des modèles avancés de transcription et de voix | VBM | par Marcus Spencer | Média de barre vertical | Mars 2025

 OpenAI présente des modèles avancés de transcription et de voix | VBM | par Marcus Spencer | Média de barre vertical | Mars 2025


Openai a dévoilé des mises à niveau significatives à sa transcription et à sa génération de voix IA Modèles, marquant un bond en avant dans le domaine du traitement audio. Ces améliorations, annoncées sur 20 mars 2025, Visez à améliorer la précision, la fiabilité et la personnalisation des développeurs et des utilisateurs.

Les nouveaux modèles, nommés GPT-4O Transcribe et GPT-4O Mini transcribeRemplacez l’ancien Chuchoter modèle et Offrez des performances supérieures dans les tâches de la parole à texte. Openai affirme que ces modèles excellent dans des scénarios difficiles, tels que des environnements avec des accents forts, un bruit de fond ou des vitesses de parole variables.

Les mises à niveau incluent un taux d’erreur de mots réduit et une reconnaissance améliorée du langage, ce qui les rend particulièrement efficaces pour les applications comme le service client, la transcription des réunions et plus.

En plus de la transcription, Openai a introduit le GPT-4O MINI TTS (text-vocation) modèle, ce qui permet aux développeurs de personnaliser les sorties vocales avec une précision sans précédent. Ce modèle peut ajuster le ton, l’émotion et la vitesse, permettant aux applications allant des agents du service client empathique à la narration dynamique. Les développeurs peuvent désormais demander au modèle de «parler comme un agent de service client sympathique» ou d’adopter d’autres styles vocaux spécifiques3.

Ces avancées font partie de Openai une vision plus large pour créer plus intuitif et interactif IA Systèmes. Les nouveaux modèles sont disponibles via API d’Openaioffrant aux développeurs des outils pour construire des agents vocaux plus robustes et polyvalents. Openai a également intégré ces modèles avec son SDK des agents, rationalisation du processus de développement pour les applications audio.

Openai est activement S’engager avec la communauté à travers des événements Comme le «Recherche profonde sur le forum OpenAI»Session virtuelle prévue pour 28 mars 2025.

Nous serons sûrs de faire rapport sur les histoires et les annonces futures impliquant Openai et les activités de ses entreprises. 😁



Source link

Related post