Wan2.7
Wan2.7-R2V Reference-to-Video
- Modelo reference-to-video Wanxiang 2.7 de Alibaba Cloud
- Genera un nuevo video con estilo, personajes y escenas consistentes a partir de una o más imágenes/videos de referencia
- Soporta consistencia de personajes, transferencia de estilo y combinación de múltiples activos
- Soporta voz de referencia (reference_voice) para controlar la voz del personaje
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorización
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Parámetros de la solicitud
Nombre del modelo de generación de video, fijado como
wan2.7-r2vDescripción del contenido del video, hasta 5000 caracteresPara múltiples imágenes/videos, use “image 1”, “image 2”, “video 1”, etc. para referenciar los activos de referencia correspondientes (en el orden de entrada)Ejemplo:
"The character in image 1 enters the scene in image 2 and looks around"Array de imágenes con roles; debe proporcionarse al menos uno entre este y
video_urlsCampos de cada objeto:url(string): URL de la imagenrole(string): rol de la imagenreference_image- imagen de referencia (por defecto)first_frame- primer fotograma especificado (cuando se proporciona,sizese ignora y la proporción de aspecto sigue la de la imagen del primer fotograma)
reference_voice(string, opcional): URL de la muestra de audio de voz para ese personaje de referencia, usado para controlar la voz del personaje en el video generado
Array de URLs de videos de referencia, hasta 5 videos (total imágenes + videos ≤ 5)Debe proporcionarse al menos uno entre este e
image_with_rolesRestricciones del video:
- Formato: mp4, mov
- Duración: 1–30s
- Resolución: ancho y alto en el rango [240, 4096] píxeles
- Proporción de aspecto: 1:8 – 8:1
- Tamaño del archivo: hasta 100MB
Prompt negativo que describe contenido no deseado, hasta 500 caracteres
Resolución del videoOpciones:
720P- Estándar1080P- Alta definición (por defecto)
Duración del video (segundos)Rango soportado:
2 ~ 15 segundosPor defecto: 5Proporción de aspectoFormatos soportados:
16:9- Paisaje panorámico (por defecto)9:16- Retrato1:1- Cuadrado4:3- Paisaje3:4- Retrato
Si se debe activar la reescritura inteligente del promptMejora significativamente los resultados para prompts cortos, pero aumenta el tiempo de procesamientoPor defecto:
trueSi se debe añadir la marca de agua “AI Generated” al video generado
true: añadir marca de aguafalse: sin marca de agua (por defecto)
Entero de seed usado para controlar la aleatoriedad del contenido generadoRango de valores: entero
≥0- Para solicitudes idénticas, el modelo genera resultados diferentes al recibir valores de seed diferentes (por ejemplo, al omitir el seed)
- Para solicitudes idénticas, el modelo genera resultados similares al recibir el mismo valor de seed, pero no se garantiza consistencia exacta
Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Casos de uso
Caso 1: Imagen de referencia única (más simple)
Caso 2: Múltiples imágenes de referencia
Caso 3: Generación basada en video de referencia
Caso 4: Primer fotograma especificado + imagen de referencia
Caso 5: Imagen de referencia + voz de referencia (preciso)
Reglas de referencia de imágenes
Con múltiples imágenes de referencia, use índices numéricos en elprompt para referirse a ellas:
- 1ª imagen → “image 1” o “the first image”
- 1er video → “video 1” o “the first video”
Consultar resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.