HappyHorse 1.0
Генерация видео HappyHorse 1.0
- Модель генерации видео Alibaba Cloud Bailian HappyHorse 1.0 (единая точка входа, автоматическое определение режима на одной модели)
- Автоматический выбор режима по параметрам: T2V (только prompt) / I2V (first_frame_image) / R2V (image_urls) / EDIT (video_url)
- Поддержка разрешений 720P/1080P и любой целочисленной длительности от 3 до 15 секунд
- Тарификация только по разрешению × длительности (секунды), независимо от функциональности
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Авторизация
Все эндпоинты API требуют аутентификации по Bearer TokenПолучение API Key:Перейдите на страницу управления API Key, чтобы получить ваш API KeyДобавьте в заголовок запроса:
Маршрутизация режимов
happyhorse-1.0 — единая точка входа для Text-to-Video / Image-to-Video / Reference-Image-to-Video / Video Edit. Бэкенд автоматически определяет режим на основе входных параметров. Все режимы тарифицируются по одному правилу (только разрешение × секунды):
| Передаваемые поля | Маршрутизация | Описание режима |
|---|---|---|
Только prompt | Text-to-Video (T2V) | Генерация видео исключительно по тексту |
prompt + first_frame_image | Image-to-Video (I2V) | Анимация из изображения первого кадра |
prompt + image_urls (1–9 изображений) | Reference-Image-to-Video (R2V) | Генерация новой сцены по опорным изображениям |
prompt + video_url (опционально image_urls 0–5 как стилевые опоры / audio_setting) | Video Edit (EDIT) | Переписать / перестилизовать исходное видео |
video_url > first_frame_image > image_urls > только prompt.
Правила взаимоисключения: три медиа-поля (first_frame_image / image_urls / video_url) попарно взаимоисключающие. Единственная допустимая комбинация — video_url + image_urls (режим EDIT + опорные изображения). Передача двух взаимоисключающих полей вернёт 400 mixed_media_not_allowed.
Параметры запроса
Имя модели генерации видео, фиксированное значение
happyhorse-1.0Описание содержания видео, до 2500 символов; не может содержать специальных токенов
- Режимы T2V / R2V / EDIT: обязательный
- Режим I2V: опциональный, но рекомендуется для управления движением камеры и действиями
"A little girl walking down the road, cinematic feel"Изображение первого кадра, активирует режим I2V (Image-to-Video). Поддерживает URL или base64 (
data:image/<mime>;base64,<payload>, шлюз автоматически загружает его в OSS)Взаимоисключающее с image_urls / video_urlТребования к изображению первого кадра:
- Формат: JPEG / JPG / PNG / BMP / WEBP
- Короткая сторона: ≥ 300 px
- Соотношение сторон: от
1:2.5до2.5:1 - Размер файла: ≤ 10 МБ
Массив изображений:
- Режим R2V (передаётся только
image_urls): 1–9 изображений, используются как опоры по субъекту/стилю для генерации новой сцены - Режим EDIT (передаётся вместе с
video_url): 0–5 изображений, используются как стилевая опора
first_frame_image; может комбинироваться с video_urlТребования к опорным изображениям:
- Формат: JPEG / JPG / PNG / BMP / WEBP
- Короткая сторона: рекомендуется ≥ 720p
- Соотношение сторон: короткая / длинная ≥ 0.4
- Размер файла: ≤ 10 МБ
- Количество: R2V должно быть 1–9; EDIT до 5
URL исходного видео, активирует режим EDIT (Video Edit). Base64 не поддерживается — укажите прямую ссылку HTTP/HTTPSВзаимоисключающее с
first_frame_image; может комбинироваться с image_urls (≤ 5)Требования к исходному видео:
- Длительность: 3–60 секунд (более 15 с автоматически обрезается восходящим сервисом от 0 до 15 с)
- Разрешение: минимум 480p, короткая сторона ≥ 360
- Соотношение сторон: от
1:8до8:1 - Формат: MP4 / MOV (рекомендуется H.264)
- Частота кадров: > 8 fps
- Размер файла: ≤ 100 МБ
Настройка аудио, действует только в режиме EDIT (должно быть передано
video_url)Варианты:auto— автоматическая генерация аудио (по умолчанию)origin— сохранить аудиодорожку исходного видео
Разрешение видео (влияет на тарификацию)Варианты:
720P— стандартное1080P— высокая чёткость (по умолчанию)
Длительность видео в секундах (влияет на тарификацию)Поддерживаемый диапазон: любое целое число от
3 до 15По умолчанию: 5Соотношение сторонПоддерживаемые форматы:
16:9— широкоэкранный пейзаж (по умолчанию)9:16— портретный1:1— квадрат4:3— пейзаж3:4— портрет
Добавлять ли водяной знак к сгенерированному видео
true: добавить водяной знакfalse: не добавлять (по умолчанию)
Случайное зерно для управления случайностью генерируемого содержимогоДиапазон значений:
[0, 2147483647]. Если опущено, используется случайное зерно.- Для идентичных запросов модель генерирует разные результаты при разных значениях seed (например, при пропуске seed)
- Для идентичных запросов модель генерирует похожие результаты при одинаковом значении seed, но точное совпадение не гарантируется
Ответ
Код статуса ответа, 200 при успехе
Массив данных ответа
Сценарии использования
Сценарий 1: Текст в видео T2V (простейший запрос)
Сценарий 2: Текст в видео T2V (полный набор параметров)
Сценарий 3: Изображение в видео I2V (first_frame_image)
Сценарий 4: Опорное изображение в видео R2V (несколько опорных изображений)
Сценарий 5: Video Edit EDIT (сохранение оригинального аудио + стилевая опора)
Сценарий 6: 720P для экономии
Руководство по выбору режима
| Требование | Рекомендуемый подход |
|---|---|
| Сгенерировать видео только по тексту | Передайте только prompt (T2V) |
| Сделать изображение «оживающим» (использовать его как первый кадр) | Передайте first_frame_image (I2V) |
| Сгенерировать новую сцену из набора опорных изображений | Передайте image_urls (1–9, R2V) |
| Переписать / перестилизовать существующее видео | Передайте video_url (EDIT), опционально с image_urls (0–5) как стилевыми опорами |
| Экономия | Используйте resolution: "720P" |
Советы по использованию
- Логика единой точки входа: входные поля определяют режим. Учтите, что три медиа-поля (
first_frame_image/image_urls/video_url) попарно взаимоисключающие sizeдействует только в T2V/R2V: в режимах I2V / EDITsizeигнорируется — соотношение сторон вывода определяется входным медиа- Длительность: 5–10 секунд — оптимальный диапазон. Слишком короткое видео приводит к рваному движению; слишком длинное значительно увеличивает время обработки на восходящем сервисе
- Качество изображения первого кадра: чёткое, хорошо скомпонованное, субъект в центре — значительно улучшает результат I2V
- Написание промпта: описывайте движение / камеру / атмосферу (например, «slow push-in, cinematic, warm tones») для лучших результатов, чем при чисто статичных описаниях сцены
- Входное видео EDIT: длиннее 15 секунд будет автоматически обрезано восходящим сервисом от 0 до 15с. Если нужны другие фрагменты, сначала нарежьте видео самостоятельно
Запрос результатов задачиГенерация видео — асинхронная задача, которая при отправке возвращает
task_id. Используйте эндпоинт Получение статуса задачи для запроса прогресса и результатов генерации.