HappyHorse
Генерация видео HappyHorse 1.1
- Модель генерации видео Alibaba Cloud Bailian HappyHorse 1.1 (единая точка входа, автоматическое определение режима на одной модели)
- Автоматический выбор режима по параметрам: T2V (только prompt) / I2V (first_frame_image) / R2V (image_urls)
- Поддержка разрешений 720P/1080P и любой целочисленной длительности от 3 до 15 секунд
- Тарификация только по разрешению × длительности (секунды), независимо от функциональности
POST
Авторизация
Все эндпоинты API требуют аутентификации по Bearer TokenПолучение API Key:Перейдите на страницу управления API Key, чтобы получить ваш API KeyДобавьте в заголовок запроса:
Маршрутизация режимов
happyhorse-1.1 — единая точка входа для Text-to-Video / Image-to-Video / Reference-Image-to-Video. Бэкенд автоматически определяет режим на основе входных параметров. Все режимы тарифицируются по одному правилу (только разрешение × секунды):
| Передаваемые поля | Маршрутизация | Описание режима |
|---|---|---|
Только prompt | Text-to-Video (T2V) | Генерация видео исключительно по тексту |
prompt + first_frame_image | Image-to-Video (I2V) | Анимация из изображения первого кадра |
prompt + image_urls (1–9 изображений) | Reference-Image-to-Video (R2V) | Генерация новой сцены по опорным изображениям |
first_frame_image > image_urls > только prompt.
Правила взаимоисключения: два медиа-поля (first_frame_image / image_urls) взаимоисключающие. Передача двух взаимоисключающих полей одновременно вернёт 400 mixed_media_not_allowed.
Параметры запроса
Имя модели генерации видео, фиксированное значение
happyhorse-1.1Описание содержания видео, до 2500 символов; не может содержать специальных токеновПример:
"A little girl walking down the road, cinematic feel"Изображение первого кадра, активирует режим I2V (Image-to-Video). Поддерживает URL или base64 (
data:image/<mime>;base64,<payload>, шлюз автоматически загружает его в OSS)Взаимоисключающее с image_urlsТребования к изображению первого кадра:
- Формат: JPEG / JPG / PNG / BMP / WEBP
- Короткая сторона: ≥ 300 px
- Соотношение сторон: от
1:2.5до2.5:1 - Размер файла: ≤ 10 МБ
Массив изображений (режим R2V): 1–9 изображений, используются как опоры по субъекту/стилю для генерации новой сценыПоддерживает URL или base64Взаимоисключающее с
first_frame_imageТребования к опорным изображениям:
- Формат: JPEG / JPG / PNG / BMP / WEBP
- Короткая сторона: рекомендуется ≥ 720p
- Соотношение сторон: короткая / длинная ≥ 0.4
- Размер файла: ≤ 10 МБ
- Количество: 1–9 изображений
Разрешение видео (влияет на тарификацию)Варианты:
720P— стандартное1080P— высокая чёткость (по умолчанию)
Длительность видео в секундах (влияет на тарификацию)Поддерживаемый диапазон: любое целое число от
3 до 15По умолчанию: 5Соотношение сторонПоддерживаемые форматы:
16:9— широкоэкранный пейзаж (по умолчанию)9:16— портретный1:1— квадрат4:3— пейзаж3:4— портрет
Добавлять ли водяной знак к сгенерированному видео
true: добавить водяной знакfalse: не добавлять (по умолчанию)
Случайное зерно для управления случайностью генерируемого содержимогоДиапазон значений:
[0, 2147483647]. Если опущено, используется случайное зерно.- Для идентичных запросов модель генерирует разные результаты при разных значениях seed (например, при пропуске seed)
- Для идентичных запросов модель генерирует похожие результаты при одинаковом значении seed, но точное совпадение не гарантируется
Ответ
Код статуса ответа, 200 при успехе
Массив данных ответа
Сценарии использования
Сценарий 1: Текст в видео T2V (простейший запрос)
Сценарий 2: Текст в видео T2V (полный набор параметров)
Сценарий 3: Изображение в видео I2V (first_frame_image)
Сценарий 4: Опорное изображение в видео R2V (несколько опорных изображений)
Сценарий 5: 720P для экономии
Руководство по выбору режима
| Требование | Рекомендуемый подход |
|---|---|
| Сгенерировать видео только по тексту | Передайте только prompt (T2V) |
| Сделать изображение «оживающим» (использовать его как первый кадр) | Передайте first_frame_image (I2V) |
| Сгенерировать новую сцену из набора опорных изображений | Передайте image_urls (1–9, R2V) |
| Экономия | Используйте resolution: "720P" |
Советы по использованию
- Логика единой точки входа: входные поля определяют режим. Учтите, что два медиа-поля (
first_frame_image/image_urls) взаимоисключающие sizeдействует только в T2V/R2V: в режиме I2Vsizeигнорируется — соотношение сторон вывода определяется входным медиа- Длительность: 5–10 секунд — оптимальный диапазон. Слишком короткое видео приводит к рваному движению; слишком длинное значительно увеличивает время обработки на восходящем сервисе
- Качество изображения первого кадра: чёткое, хорошо скомпонованное, субъект в центре — значительно улучшает результат I2V
- Написание промпта: описывайте движение / камеру / атмосферу (например, «slow push-in, cinematic, warm tones») для лучших результатов, чем при чисто статичных описаниях сцены
Запрос результатов задачиГенерация видео — асинхронная задача, которая при отправке возвращает
task_id. Используйте эндпоинт Получение статуса задачи для запроса прогресса и результатов генерации.