Comment essayer VEO 3, le générateur vidéo de l’IA de Google qui devient viral sur Internet
La vidéo générée par l’IA a progressé rapidement, avec des développeurs technologiques de premier plan pour construire et commercialiser leurs propres modèles. Nous voyons maintenant la montée en puissance des outils qui peuvent générer une vidéo étonnamment photoréaliste à partir d’une seule invite en langage naturel. Pour la plupart, cependant, la vidéo générée par l’IA a eu une lacune flagrante: elle est silencieuse.
Plus maintenant. Lors de sa conférence annuelle des développeurs d’E / S mardi, Google a annoncé la sortie de Veo 3, la dernière itération de sa modèle d’IA générant des vidéosqui est également livré avec la capacité de générer l’audio synchronisé.
Aussi: Tout annoncé sur Google I / O 2025: Gemini, Search, Android XR, et plus
Imaginez que vous invitez le système à générer un jeu vidéo dans une voiture de métro animée, par exemple. VEO 3 peut produire la vidéo, ainsi que le bruit de fond ambiant généré par l’AI pour ajouter au sens du réalisme. Vous pouvez même l’inviter à générer de l’audio de voix humaines, selon Google.
Le modèle serait également spécialisé dans la simulation de la physique du monde réel et de la synchronisation des lèvres, ce qui en fait un outil potentiellement précieux pour les cinéastes et fait progresser la mission plus large de Google d’amener l’IA utilisable aux industries créatives. Il est maintenant disponible pour les abonnés Gemini Ultra aux États-Unis. Il est également accessible à travers CoulerLe nouvel outil de cinéma alimenté par Google, qui a également été dévoilé à l’E / S cette semaine.
Un défi technique majeur
VEO 3 représente l’un des premiers modèles d’un grand développeur technologique qui peut synchroniser la vidéo et l’audio générés par l’IA. Méta- Génération de filmslibéré en octobre, en est un autre. Quelques autres outils, Comme le Gen-3 Alpha de Runway, venez avec des fonctionnalités qui permettent une vidéo générée par AI-AI dans un processus de post-production, mais la génération simultanée des deux nécessite le calcul et les ressources d’une force majeure comme Google.
Aussi: 8 meilleures fonctionnalités et outils d’IA révélés sur Google I / O 2025
La construction de modèles d’IA capables de générer des vidéos et audio synchronisés a été un défi technique épineux et un domaine de recherche actif dans l’industrie de l’IA. La vidéo générée par l’AI et l’audio généré par l’IA sont des défis techniques distincts, et les fusionner introduit une toute nouvelle dimension de complexité. Voici une démo de Veo 3.
https://www.youtube.com/watch?v=94kmlfyiao8
D’une part, la vidéo est une série de cadres fixes, tandis que l’audio est une vague continue. La synchronisation des deux nécessite donc des modèles qui peuvent fonctionner à travers ces deux modalités, représentant les échelles de temps très différentes dans lesquelles ils opèrent.
Une vidéo de fusion d’IA avec du son doit également être en mesure de rendre compte dynamiquement des variables comme le matériau, la distance et la vitesse. Une voiture conduisant à 100 miles par heure semble très différente de celle qui voyage à 10 miles par heure; Un cheval marchant sur des pavés semble différent de celui qui marche sur l’herbe.
Obtenez les meilleures histoires du matin dans votre boîte de réception chaque jour avec notre Newsletter Tech Today.
