Google a récemment lancé un nouvel outil d’intelligence artificielle dédié à la production audiovisuelle. Dénommé Veo 3, cet outil est capable de générer des vidéos ultra-réalistes à partir de simples instructions textuelles. Il a été présenté lors de la conférence Google I/O 2025.
Veo 3 est développé par la division DeepMind. Il permet de créer des clips de 8 secondes, composés des images, des sons d’ambiance, des dialogues et même de la musique.
Veo 3 se distingue de ses concurrentes comme Sora d’OpenAI ou Runway Gen-2 par une compréhension fine des consignes, une synchronisation labiale réaliste, et un respect physique des mouvements et proportions. Résultat : des séquences courtes mais très crédibles, dignes d’un mini-film.
Le géant californien a également dévoilé Flow. Il s’agit d’une plateforme pensée pour accompagner les créateurs dans la réalisation de scénarios, de storyboards et de plans de tournage à l’aide de l’IA. Flow intègre Veo 3, Imagen (pour les images fixes) et Gemini (pour le texte et les dialogues).
Veo 3 est pour l’instant réservé aux utilisateurs américains, via l’abonnement Google AI Ultra à 249 dollars par mois. Une version limitée est accessible avec Google AI Pro. Google prévoit un déploiement international, mais n’a encore annoncé aucune.
Malgré son potentiel, l’outil n’est pas sans limites : vidéos de courte durée, qualité audio encore variable, et interface à améliorer. Il soulève aussi des questions sur la véracité des contenus générés, la désinformation ou encore les droits d’auteur. Reste que Veo 3 ouvre de nouvelles perspectives pour divers corps de métiers. Créateurs de contenu, communicants ou formateurs, auront désormais un accès plus facile à la production audiovisuelle sans studio ni caméra.