Wan2.7
Generación de Video Wan2.7
- Modelo de generación de video Wanxiang 2.7 de Alibaba Cloud (entrada unificada)
- Enrutamiento automático según los parámetros: Text-to-Video / Image-to-Video (primer fotograma, primer y último fotograma, continuación de video)
- Soporta resolución 720P/1080P, duración de 2 a 15 segundos
- Soporta audio personalizado (música de fondo en modo text-to-video, audio conductor en modo image-to-video)
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorización
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Enrutamiento de modos
wan2.7 es una entrada unificada para text-to-video e image-to-video. El backend determina automáticamente el modo según los parámetros entrantes. Ambos modos se facturan de forma idéntica:
| Condición | Se enruta a | Descripción del modo |
|---|---|---|
Cualquiera de image_urls / image_with_roles / video_urls está presente | Image-to-Video | Primer fotograma / Primer y último fotograma / Continuación de video |
| Ninguno de los parámetros anteriores está presente | Text-to-Video | Genera video únicamente a partir de la descripción en texto |
Parámetros de la solicitud
Nombre del modelo de generación de video, fijado como
wan2.7Descripción del contenido del video, hasta 5000 caracteres
- Modo Text-to-Video (cuando no se proporciona imagen/video): obligatorio
- Modo Image-to-Video: opcional, pero recomendado para guiar el movimiento de cámara y las acciones
"A cat chasing butterflies on the grass, bright sunshine, slow motion"Array de URLs de imágenes. Proporcionarlo entra automáticamente en modo Image-to-Video
- 1 imagen: primer fotograma del video
- 2 imágenes: primer y último fotograma del video (1ª = primer fotograma, 2ª = último fotograma)
image_with_rolesArray de imágenes con roles, alternativa a
image_urls, usado para especificar con precisión el rol de cada imagenCampos de cada objeto:url(string): URL de la imagen (admite http/https)role(string): rol de la imagen,first_frame/last_frame, por defectofirst_frame
Array de URLs de videos. Proporcionarlo entra en el modo de continuación de video (solo se usa el 1er video)
Restricciones del video:
- Formato: mp4, mov
- Duración: 2–10s
- Resolución: ancho y alto en el rango [240, 4096] píxeles
- Proporción de aspecto: 1:8 – 8:1
- Tamaño del archivo: hasta 100MB
Prompt negativo que describe el contenido no deseado, hasta 500 caracteresEjemplo:
"blurry, distorted, low quality"Resolución del videoOpciones:
720P- Estándar1080P- Alta definición (por defecto)
Duración del video (segundos)Rango soportado:
2 ~ 15 segundosPor defecto: 5Proporción de aspecto, solo efectiva en modo Text-to-Video (cuando no se proporciona imagen/video)Formatos soportados:
16:9- Paisaje panorámico (por defecto)9:16- Retrato1:1- Cuadrado4:3- Paisaje3:4- Retrato
URL de audio personalizado
- Modo Text-to-Video: usado como música de fondo
- Modo Image-to-Video: usado como audio conductor, sincronizado con las acciones en pantalla
Si se debe activar la reescritura inteligente del promptMejora significativamente los resultados para prompts cortos, pero aumenta el tiempo de procesamientoPor defecto:
trueSi se debe añadir la marca de agua “AI Generated” al video generado
true: añadir marca de aguafalse: sin marca de agua (por defecto)
Entero de seed usado para controlar la aleatoriedad del contenido generadoRango de valores: entero
≥0- Para solicitudes idénticas, el modelo genera resultados diferentes al recibir valores de seed diferentes (por ejemplo, al omitir el seed)
- Para solicitudes idénticas, el modelo genera resultados similares al recibir el mismo valor de seed, pero no se garantiza consistencia exacta
Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Casos de uso
Caso 1: Texto a video (Solicitud más simple)
Caso 2: Texto a video (Parámetros completos)
Caso 3: Primer fotograma a video
Caso 4: Primer y último fotograma a video
Con 2 imágenes: la 1ª es el primer fotograma, la 2ª es el último fotograma. También puede usar image_with_roles para una especificación precisa.
Caso 5: Continuación de video
Caso 6: Imagen + audio conductor
Guía de selección de modo
| Requisito | Enfoque recomendado |
|---|---|
| Generar video solo a partir de texto | Pasar solo prompt (sin imagen/video) |
| Hacer que una imagen “cobre vida” | Pasar 1 imagen a image_urls |
| Controlar el primer y último fotograma | Pasar 2 imágenes a image_urls (primer + último) |
| Extender un video existente | Pasar el video a video_urls |
| Hacer que la imagen se mueva al ritmo de la música | Pasar imagen + audio_url |
Consultar resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.