Le nouveau modèle NOVA Sonic AI d’Amazon présente une «voix plus humaine»

 Le nouveau modèle NOVA Sonic AI d’Amazon présente une «voix plus humaine»


Amazon Nova Canvas est un modèle de base pour les développeurs pour créer des images de haute qualité. Image: Amazon

Amazon est le dernier géant de la technologie à dévoiler un modèle vocal AI. Selon Amazon, son Nova Sonic est «un nouveau modèle de base qui unifie la compréhension de la parole et la génération de la parole en un seul modèle, pour permettre des conversations vocales plus humaines dans les applications d’IA.» Nova Sonic rivalisera avec des modèles d’IA similaires d’Openai, Google et d’autres sociétés technologiques.

Nova Sonic comprend plus que les mots

Le Nova Sonic ne comprend pas seulement les mots de l’orateur, mais il peut également traiter le ton, le style et le rythme. Le générateur de voix AI s’adapte au contexte de la conversation, donc le dialogue coule plus naturellement, par rapport aux modèles les plus macrés des premières générations d’Alexa. Le Nova Sonic peut le faire car il combine plusieurs fonctions de traitement de la parole et de génération dans un seul modèle d’IA au lieu d’utiliser plusieurs modèles différents.

Traditionnellement, les outils vocaux de l’IA impliquant l’exécution de plusieurs modèles en séquence: un modèle de reconnaissance vocale convertirait la parole en texte, alors un modèle grand langage (LLM) traiterait le texte d’entrée et générerait des réponses, et enfin un modèle de texte vocable convertirait le texte en audio. Ce pipeline complexe a souvent éliminé le ton, le style et la rythme du dialogue original de l’orateur.

Étant donné que le Nova Sonic combine tout cela dans un modèle, il peut s’adapter au contexte acoustique de la parole d’entrée. Il répond également plus naturellement aux cadences du discours humain; Par exemple, il n’interrompt pas lorsque l’orateur hésite ou s’arrête à respirer.

Comment obtenir Nova Sonic

Nova Sonic est actuellement disponible via une nouvelle API en Amazon Bedrock, la plate-forme de création d’applications d’entreprise de la société, et simplifiera le développement d’applications vocales.

Ce que les développeurs doivent savoir sur Amazon Nova

Le géant de la technologie a récemment introduit Amazon Nova Act, un nouveau modèle d’IA formé pour effectuer des actions au sein d’un navigateur Web. De plus, il existe un SDK Amazon Nova à explorer. L’un des modèles de fondation est Nova Canvas pour générer des images de haute qualité; Il existe également des modèles pour générer du texte à partir de différentes modalités ainsi que des vidéos à partir de texte et d’entrée d’image.



Source link

Related post