Gemini Omni : Google sort son IA vidéo qui édite par chat

Hier, lors du keynote de Google I/O 2026, Sundar Pichai et Demis Hassabis ont dévoilé Gemini Omni, le nouveau modèle vidéo multimodal de Google. Et autant le dire tout de suite : ce n’est pas un simple « Veo 4 ». C’est un modèle pensé pour générer ET éditer de la vidéo en conversant avec lui, comme on discuterait avec un monteur.

Vous avez sans doute déjà vu passer Sora 2 ou Veo 3 ces derniers mois. Mais Gemini Omni va plus loin sur plusieurs points : il accepte texte, image, vidéo et audio en entrée, il édite vos propres vidéos en chat, et il s’intègre directement à YouTube Shorts gratuitement. J’ai épluché les annonces officielles, le keynote et les premières démos pour vous faire le point.

Au programme de cet article : ce qu’est Gemini Omni concrètement, ce qu’il sait faire, comment l’utiliser dès aujourd’hui, ses différences avec Sora 2 et Veo, et la question qui fâche en Europe : peut-on vraiment y accéder depuis la France ?

Qu’est-ce que Gemini Omni ?

Gemini Omni est le nouveau modèle vidéo omnimodal de Google, annoncé le 19 mai 2026 lors du keynote Google I/O 2026. Il s’appuie sur l’architecture de Veo (le modèle vidéo précédent de Google DeepMind), mais avec une approche totalement repensée.

La grosse nouveauté ? Le modèle est nativement multimodal. Concrètement, vous pouvez lui donner du texte, des images, des extraits vidéo et même de l’audio comme références, le tout dans une même requête, et il produit une vidéo cohérente. Demis Hassabis a particulièrement insisté sur la compréhension de la physique : objets qui tombent de manière réaliste, fluides qui s’écoulent, lumière et ombres cohérentes entre les plans.

Google a aussi annoncé une variante baptisée Gemini Omni Flash, plus rapide, conçue pour l’édition vidéo en temps réel et déjà disponible dans plusieurs produits.

Ce que Gemini Omni sait vraiment faire

Au-delà des promesses marketing, voici les capacités confirmées par les démos du keynote et les premiers tests :

Génération de vidéos à partir d’un prompt texte, avec rendu cinématographique et physique réaliste
Édition conversationnelle d’une vidéo existante : vous chargez un selfie, vous demandez « change le décor en plage », « remplace mon t-shirt par un costume », « ajoute un zoom à 0:13 », et le modèle exécute
Mélange d’entrées : combiner images de produit, slogan texte et musique de fond pour produire un clip promotionnel cohérent
Avatars personnalisés : générer des vidéos « comme si c’était vous » à partir d’un digital twin de votre visage et de votre voix
Édition itérative non destructive : enchaîner les modifications par chat sans tout regénérer

En revanche, Google reste flou sur certains points techniques. Aucune durée maximale n’a été communiquée, aucune résolution officielle n’est mentionnée dans les blogs officiels, et la commande vocale complète arrive « prochainement » (pas tout de suite partout). Sortie vidéo uniquement pour l’instant, même si Google parle d’élargir vers l’image et l’audio « avec le temps ».

Comment utiliser Gemini Omni dès aujourd’hui

Bonne nouvelle : Google n’a pas attendu pour ouvrir l’accès. Le déploiement a commencé immédiatement après le keynote, sur plusieurs plateformes :

App Gemini (web, Android, iOS) pour les abonnés Google AI Plus, Pro et Ultra
Google Flow, l’outil créatif de Google pour les workflows de génération
YouTube Shorts et YouTube Create : gratuitement, pour la création et l’édition de vidéos courtes
API Gemini, AI Studio et Vertex AI en developer preview, avec un rollout entreprise dans les semaines à venir

Pour les développeurs, Google n’a pas encore publié de grille tarifaire détaillée (prix par minute générée, par résolution, etc.). Il va falloir patienter quelques semaines.

Gemini Omni vs Sora 2 et Veo : qu’est-ce qui change vraiment ?

Trois modèles vidéo IA dominent désormais le marché. Voici les vraies différences.

Face à Veo 3 (l’ancien modèle Google), Omni reste sur la même base architecturale mais apporte trois changements majeurs : la multimodalité native (audio + vidéo en entrée, pas seulement texte + image), la physique réaliste nettement améliorée, et surtout l’édition conversationnelle qui n’existait pas dans Veo.

Face à Sora 2 d’OpenAI, la différence est plus stratégique que technique. Sora reste centré sur la génération de plans longs cinématographiques, avec un cycle de production plus lourd et un accès toujours limité au public. Gemini Omni, lui, est conçu pour l’édition rapide et l’usage social, avec une intégration directe à YouTube et à l’app Gemini grand public. Si vous voulez tourner un trailer de film, regardez Sora. Si vous voulez créer un Short ou éditer une vidéo en discutant, Gemini Omni est plus adapté.

Petit détail à ne pas négliger : OpenAI a annoncé l’arrêt de Sora dans sa forme publique actuelle, ce qui rebat largement les cartes. Google se positionne désormais comme le leader incontesté de la vidéo IA grand public. Pour aller plus loin sur ce sujet, vous pouvez consulter mon comparatif des meilleures IA de génération vidéo.

Disponibilité en France : la grosse douche froide

C’est le bémol majeur. Plusieurs fonctionnalités clés de Gemini Omni ne sont pas accessibles en Europe, en particulier celles utilisant la vidéo comme entrée (l’édition conversationnelle d’une vidéo existante, notamment). Google ne donne aucune date pour l’arrivée complète en France.

La raison probable ? Le cadre réglementaire européen (AI Act, RGPD) sur les modèles de génération vidéo et les contenus deepfake. Google parle d’un déploiement « global » en théorie, mais la presse française confirme que des restrictions sont actives en pratique.

Si vous voulez tester Omni Flash en attendant, vous pouvez vous tourner vers YouTube Shorts qui semble accessible sans restriction. Pour les fonctions avancées (édition vidéo en chat, avatars), il faudra patienter.

Prix et plans : combien ça coûte vraiment ?

Gemini Omni n’a pas de tarification dédiée. Le modèle est inclus dans les abonnements Google AI existants :

Google AI Plus : accès à Omni Flash dans l’app Gemini
Google AI Pro : Omni Flash + fonctionnalités avancées
Google AI Ultra (100 à 200 $/mois) : accès complet, plus Gemini Spark (l’agent autonome) et toutes les autres nouveautés I/O 2026
YouTube Shorts et YouTube Create : gratuit pour la création et l’édition de Shorts

Pour les développeurs, l’accès API est en preview, avec une grille de prix à venir. Si vous êtes déjà sur Google Cloud / Vertex AI, vous y aurez accès rapidement.

Sécurité et SynthID : Google met les barrières

Toutes les vidéos générées avec Gemini Omni portent un filigrane SynthID, imperceptible à l’œil mais détectable par les outils Google (Chrome, Search, Gemini). Cela permet d’identifier qu’une vidéo a été générée ou modifiée par IA, un sujet crucial à l’heure des deepfakes.

Google a aussi temporisé certaines fonctions sensibles : la modification de voix reste en test interne pour limiter les risques de deepfakes vocaux. C’est une approche plutôt prudente qui contraste avec d’autres acteurs du marché.

Mon avis sur Gemini Omni

Gemini Omni est probablement l’annonce IA la plus marquante de Google I/O 2026, devant même Gemini Spark. La promesse « monter une vidéo en discutant avec une IA » est tenue, et la qualité visuelle paraît nettement supérieure aux précédents modèles vidéo.

Trois points me semblent particulièrement importants :

L’intégration YouTube est un coup de maître. Mettre Omni Flash gratuitement dans YouTube Shorts, c’est créer instantanément la plus grande base d’utilisateurs vidéo IA au monde.
Le retard européen va peser. Si vous travaillez dans le marketing ou la création de contenu en France, vous ne pourrez pas exploiter les fonctions les plus puissantes pour le moment. C’est frustrant et probablement temporaire, mais c’est une réalité aujourd’hui.
La concurrence est bousculée. Avec l’arrêt de Sora dans sa forme publique et le focus de Claude sur le texte, Google prend une avance solide sur la vidéo IA grand public.

Pour le moment, c’est clairement le modèle vidéo IA le plus complet du marché. Reste à voir comment Google fait évoluer la tarification précise, les limites techniques (durée, résolution) et surtout l’accès depuis l’Europe. Je mettrai cet article à jour dès que de nouveaux éléments seront publiés par Google.

Similaire

Loïc Frissard

Passionné par le web et l'entrepreneuriat, j'ai fondé Digitiz en 2016. Mon objectif est de vous transmettre mon expérience et de pouvoir vous faire gagner du temps dans le choix de vos outils.

Partagez cet article sur les réseaux sociaux