Google показала Gemini Omni — ИИ собирает видео из любых данных

Содержание показать

Google запустила новое семейство мультимодальных моделей Gemini Omni, и первым участником линейки стала Gemini Omni Flash — нейросеть, умеющая превращать в видеоролики буквально любые входные данные: текстовые запросы, фотографии, аудиозаписи и уже готовые видеофрагменты.

Не просто генерация, а редактура на ходу

Главное, чем Gemini Omni Flash отличается от предшественников вроде модели Veo, — это не просто способность создать ролик с нуля, а возможность трансформировать существующее видео в другое. Пользователь описывает изменения обычными словами в режиме диалога, а модель переосмысливает сцену, при этом не ломая ее внутреннюю логику: персонажи не теряют последовательность действий, а сцена сохраняет связность между запросами.

Старший директор по исследованиям Google DeepMind Думитру Эрхан уточнил, что сейчас система генерирует ролики длительностью до 10 секунд со звуком — но работа по увеличению этого лимита уже идет полным ходом.

Модель опирается на всю базу знаний экосистемы Gemini, что дает ей понимание исторического и научного контекста, а также способность корректно воспроизводить физические явления — гравитацию, динамику жидкостей и прочие законы реального мира. По словам технического директора Google DeepMind Корая Кавукчуоглу, новая технология обладает принципиально более глубоким пониманием устройства мира по сравнению с любыми предыдущими разработками компании.

Свой аватар, своя речь и обязательный водяной знак

Gemini Omni Flash позволит пользователям создавать персональные цифровые аватары и озвучивать их собственным голосом. Руководитель команды разработчиков Николь Брихтова напомнила, что интерес к подобным функциям подтвержден цифрами: прошлогодняя модель Nano Banana, специализировавшаяся на генерации изображений, собрала более 50 миллиардов созданных пользователями картинок.

Вместе с тем Google вводит ограничения ради безопасности: на текущем этапе модель не может изменять чужую речь в видеозаписях. Все сгенерированные ролики автоматически получают невидимую метку SynthID — цифровой водяной знак для верификации подлинности контента. В планах — добавить вывод статичных изображений и аудио.

Gemini Omni Flash уже доступна глобально для подписчиков тарифов Google AI Plus, Pro и Ultra через приложение Gemini и сервис Google Flow. С этой недели бесплатный доступ также открывается для пользователей YouTube Shorts и YouTube Create App.

Google показала Gemini Omni — ИИ собирает видео из любых данных

Обновлено: 20.05.2026

Не просто генерация, а редактура на ходу

Свой аватар, своя речь и обязательный водяной знак

Автор

TraffNews

Traffnews рекомендует

Сервисы

AdsCard

Cloak IT

Dolphin{anty}

Партнерки

1win Partners

INSIDE

Kingfin

Похожие материалы

Affiliate World Europe 2026: как проходит конференция в Будапеште

X встраивает видеоредактор и открыто заходит на территорию TikTok

США сняли запрет с GPT‑5.6 — завтра модель станет общедоступной

Две трети всех крипто-краж в мире связаны с Северной Кореей

Соцсеть X разгоняет стримы: Live Studio и выплаты авторам

Telegram заблокировал свыше 19 млн каналов и групп за полгода

Google ограничила использование Gemini для Meta*

Второй день G GATE CONF 2026: меньше суеты, больше общения и полезных знакомств

Яна

Sales Manager