Wan2.6
wan2.6-i2v-flash Image-to-Video
- Modelo rápido image-to-video Wanxiang 2.6
- Genera video fluido a partir de una imagen del primer fotograma y prompts de texto
- Soporta alternancia audio/silencio, narración multi-toma, audio personalizado
- Soporta resolución 720p/1080p, duración de 2-15 segundos
- Soporta plantillas de efectos de video
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autenticación
Todos los endpoints requieren autenticación mediante Bearer TokenObtener API Key:Visite la página de gestión de API Keys para obtener su API KeyAñadir al encabezado de la solicitud:
Parámetros de la solicitud
Nombre del modelo de generación de video, fijado como
wan2.6-i2v-flashArray de URLs de imágenes de referencia (solo se admite 1 imagen del primer fotograma)Admite URLs de imágenes accesibles públicamente o codificación Base64 (
data:image/png;base64,...)Ejemplo: ["https://example.com/image.jpg"]Requisitos de la imagen:
- Formato: JPEG, JPG, PNG (sin transparencia), BMP, WEBP
- Resolución: rango de ancho/alto 240-8000 píxeles
- Tamaño: ≤ 10MB
Descripción del contenido del videoOpcional pero recomendado para image-to-video, describe las acciones y efectos esperadosEspecifique claramente el sujeto, la acción, la cámara y el estilo para obtener mejores resultadosEjemplo:
"The person in the image smiles and waves, camera slowly zooms in"Prompt negativo, describe contenido no deseadoMáximo 500 caracteresEjemplo:
"blurry, low quality, distorted"Resolución del videoOpciones:
720p- HD1080p- FHD (por defecto)
1080pLa resolución afecta directamente al precio, 1080p es más caro que 720p. La proporción de aspecto la determina la imagen de entrada.
Duración del video (segundos)Rango soportado:
2 a 15 segundos (entero)Por defecto: 5Si se debe generar audioEstablecer en
true: genera automáticamente música de fondo / efectos de sonido que coincidan (por defecto)Establecer en false: produce un video silenciosoPor defecto: trueNo se admite cuando el modelo es
wan2.6-i2v.URL de audio personalizado (wav/mp3, 3-30 segundos, ≤ 15MB)Tiene menor prioridad que
audio: se ignora cuando audio=falseSi el audio es más largo que la duración del video, será recortado; si es más corto, la parte restante quedará en silencioSi se debe activar la reescritura inteligente del promptMejora significativamente los resultados para prompts cortos, pero aumenta el tiempo de procesamientoPor defecto:
trueTipo de toma, requiere
prompt_extend=trueOpciones:single- Toma única (por defecto), produce un video de toma única continuamulti- Multi-toma, produce un video narrativo con múltiples transiciones de toma
shot_type tiene mayor prioridad que prompt. Incluso si el prompt menciona “multi-toma”, establecer single seguirá produciendo una toma única.Semilla aleatoria (≥0), especificar la misma semilla puede reproducir resultados similaresEjemplo:
12345Si se debe añadir una marca de agua “AI Generated” (esquina inferior derecha)Por defecto:
falseControl de audio
| Combinación de parámetros | Resultado |
|---|---|
Sin audio ni audio_url | Audio generado automáticamente (por defecto) |
audio_url: "https://..." | Usar audio especificado |
audio: false | Video silencioso |
audio: false + audio_url: "..." | Video silencioso (audio tiene mayor prioridad) |
Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Casos de uso
Caso 1: Solicitud mínima
Caso 2: Parámetros completos
Caso 3: Audio personalizado
Caso 4: Video silencioso
Caso 5: Plantilla de efecto
Caso 6: Imagen Base64
Consultar resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.