Gemini Omni Flash
Генерация видео Gemini Omni Flash
- Официальная универсальная мультимодальная модель генерации видео Google Gemini Omni Flash
- Поддерживает Text-to-Video, Image-to-Video, Video-to-Video (редактирование), можно смешивать ввод текста + изображений + видео
- Вывод 720p / 24fps, 3–10 секунд, со звуком; поддерживает диалоговое многораундовое редактирование
- Асинхронный API задач: после отправки результат генерации запрашивается по идентификатору задачи
POST
Аутентификация
Все запросы требуют аутентификации по Bearer Token.Получение API-ключа:Перейдите на страницу управления API-ключами, чтобы получить свой API-ключ.При выполнении запросов добавляйте в заголовок:
Параметры запроса
Название модели генерации видео, фиксированное значение
gemini-omni-flash-preview.Текстовая инструкция. Для Text-to-Video — описание сцены; для Image/Video-to-Video — инструкция по движению / стилю / редактированию.
prompt и референсные материалы (image_urls / video_urls) — необходимо предоставить хотя бы одно из них.Референсные изображения, максимум 16 штук. Каждый элемент — URL вида
http(s)://.Поддерживаются JPEG / PNG. Для нескольких субъектов (например, «кошка + клубок ниток») можно передать несколько изображений и описать в prompt, как они взаимодействуют.Референсное / редактируемое видео, максимум 1 (несколько видеоссылок не поддерживаются). Может быть прямой ссылкой
http(s):// или data:video/....Соотношение сторон видео, реально управляет ориентацией выводимого кадра.Поддерживаются только:
16:9- горизонтальное (по умолчанию)9:16- вертикальное
16:9.Разрешение видео. В настоящее время поддерживается только
720p.Идентификатор предыдущей задачи: укажите **
task_id** предыдущей задачи генерации.Ответ
Код состояния ответа. При успехе имеет значение
200.Возвращаемый массив задач.
Получение результата задачи
Генерация видео является асинхронной задачей. После отправки возвращаетсяtask_id. Используйте эндпоинт Получить статус задачи, чтобы узнать прогресс и результат генерации.