Wan2.7
Wan2.7-R2V — генерация видео по референсу
- Модель Alibaba Cloud Wanxiang 2.7 для генерации видео по референсу
- Создание нового видео с сохранением стиля, персонажей и сцен на основе одного или нескольких опорных изображений/видео
- Поддержка консистентности персонажей, переноса стиля и комбинирования нескольких ресурсов
- Поддержка опорного голоса (reference_voice) для управления голосом персонажа
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Авторизация
Все эндпоинты API требуют аутентификации по Bearer TokenПолучение API Key:Перейдите на страницу управления API Key, чтобы получить ваш API KeyДобавьте в заголовок запроса:
Параметры запроса
Имя модели генерации видео, фиксированное значение
wan2.7-r2vОписание содержания видео, до 5000 символовДля нескольких изображений/видео используйте «image 1», «image 2», «video 1» и т. д. для ссылки на соответствующие опорные ресурсы (в порядке передачи)Пример:
"The character in image 1 enters the scene in image 2 and looks around"Массив изображений с ролями; должно быть передано хотя бы это поле или
video_urlsПоля каждого объекта:url(string): URL изображенияrole(string): роль изображенияreference_image— опорное изображение (по умолчанию)first_frame— заданный первый кадр (когда задан,sizeигнорируется, соотношение сторон следует первому кадру)
reference_voice(string, опционально): URL аудиосэмпла голоса для этого опорного персонажа, используется для управления голосом персонажа в сгенерированном видео
Массив URL опорных видео, до 5 видео (всего изображений + видео ≤ 5)Должно быть передано хотя бы это поле или
image_with_rolesОграничения видео:
- Формат: mp4, mov
- Длительность: 1–30 с
- Разрешение: ширина и высота в диапазоне [240, 4096] пикселей
- Соотношение сторон: 1:8 – 8:1
- Размер файла: до 100 МБ
Негативный промпт, описывающий нежелательное содержание, до 500 символов
Разрешение видеоВарианты:
720P— стандартное1080P— высокая чёткость (по умолчанию)
Длительность видео (секунды)Поддерживаемый диапазон:
2 – 15 секундПо умолчанию: 5Соотношение сторонПоддерживаемые форматы:
16:9— широкоэкранный пейзаж (по умолчанию)9:16— портрет1:1— квадрат4:3— пейзаж3:4— портрет
Включить ли интеллектуальное переписывание промптаЗначительно улучшает результаты для коротких промптов, но увеличивает время обработкиПо умолчанию:
trueДобавлять ли водяной знак «AI Generated» к сгенерированному видео
true: добавить водяной знакfalse: без водяного знака (по умолчанию)
Целое число — зерно для управления случайностью генерируемого содержимогоДиапазон: целое
≥ 0- Для идентичных запросов модель генерирует разные результаты при разных значениях seed (например, при пропуске seed)
- Для идентичных запросов модель генерирует похожие результаты при одинаковом значении seed, но точное совпадение не гарантируется
Ответ
Код статуса ответа, 200 при успехе
Массив данных ответа
Сценарии использования
Сценарий 1: Одно опорное изображение (простейший)
Сценарий 2: Несколько опорных изображений
Сценарий 3: Генерация по опорному видео
Сценарий 4: Заданный первый кадр + опорное изображение
Сценарий 5: Опорное изображение + опорный голос (точное управление)
Правила ссылок на изображения
При нескольких опорных изображениях используйте числовые индексы вprompt для ссылки на них:
- 1-е изображение → «image 1» или «the first image»
- 1-е видео → «video 1» или «the first video»
Запрос результатов задачиГенерация видео — асинхронная задача, которая при отправке возвращает
task_id. Используйте эндпоинт Получение статуса задачи для запроса прогресса и результатов генерации.