Google запустила новое семейство мультимодальных моделей Gemini Omni, и первым участником линейки стала Gemini Omni Flash — нейросеть, умеющая превращать в видеоролики буквально любые входные данные: текстовые запросы, фотографии, аудиозаписи и уже готовые видеофрагменты.
Не просто генерация, а редактура на ходу
Главное, чем Gemini Omni Flash отличается от предшественников вроде модели Veo, — это не просто способность создать ролик с нуля, а возможность трансформировать существующее видео в другое. Пользователь описывает изменения обычными словами в режиме диалога, а модель переосмысливает сцену, при этом не ломая ее внутреннюю логику: персонажи не теряют последовательность действий, а сцена сохраняет связность между запросами.

Старший директор по исследованиям Google DeepMind Думитру Эрхан уточнил, что сейчас система генерирует ролики длительностью до 10 секунд со звуком — но работа по увеличению этого лимита уже идет полным ходом.
Модель опирается на всю базу знаний экосистемы Gemini, что дает ей понимание исторического и научного контекста, а также способность корректно воспроизводить физические явления — гравитацию, динамику жидкостей и прочие законы реального мира. По словам технического директора Google DeepMind Корая Кавукчуоглу, новая технология обладает принципиально более глубоким пониманием устройства мира по сравнению с любыми предыдущими разработками компании.
Свой аватар, своя речь и обязательный водяной знак
Gemini Omni Flash позволит пользователям создавать персональные цифровые аватары и озвучивать их собственным голосом. Руководитель команды разработчиков Николь Брихтова напомнила, что интерес к подобным функциям подтвержден цифрами: прошлогодняя модель Nano Banana, специализировавшаяся на генерации изображений, собрала более 50 миллиардов созданных пользователями картинок.
Вместе с тем Google вводит ограничения ради безопасности: на текущем этапе модель не может изменять чужую речь в видеозаписях. Все сгенерированные ролики автоматически получают невидимую метку SynthID — цифровой водяной знак для верификации подлинности контента. В планах — добавить вывод статичных изображений и аудио.
Gemini Omni Flash уже доступна глобально для подписчиков тарифов Google AI Plus, Pro и Ultra через приложение Gemini и сервис Google Flow. С этой недели бесплатный доступ также открывается для пользователей YouTube Shorts и YouTube Create App.