SkyReels V4
Generación de Video SkyReels V4
- Dos niveles de modelo: Fast (optimizado para velocidad) y Std (optimizado para calidad)
- Tres modos enrutados automáticamente según los campos de la solicitud: Text-to-Video (T2V), Image-to-Video (I2V), Referencia multimodal (Omni)
- Resolución 480p / 720p / 1080p, duración de 3 a 15 segundos
- Funciones avanzadas: primer/último/fotograma clave, imágenes de referencia, videos de referencia, collage en cuadrícula, extensión de video, sincronización de audio
- Modo de procesamiento asíncrono, devuelve un ID de tarea para consultas posteriores
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorización
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Modos de generación
SkyReels V4 se enruta automáticamente al modo correcto según los campos de la solicitud — no se necesita el campomode:
| Modo | Activador | Capacidad |
|---|---|---|
| T2V (Text-to-Video) | Solo prompt + campos generales | Generación basada únicamente en texto |
| I2V (Image-to-Video) | Cualquiera de first_frame_image / end_frame_image / mid_frame_images | Control de primer/último/fotograma clave |
| Omni (Referencia multimodal) | Cualquiera de ref_images / ref_videos | Referencia de sujeto, collage en cuadrícula, referencia de movimiento, extensión de video, sincronización de audio |
Mecanismo
@tag: Al usar mid_frame_images / ref_images / ref_videos, cada elemento debe declarar un tag que comience con @ (por ejemplo, @image1, @Actor-1, @video1), y el tag debe aparecer en el prompt.Piense en el prompt como un “guion” y en el tag como un “puntero de personaje” hacia activos específicos (imágenes / videos). Por ejemplo, un prompt como "@Actor-1 walks into the scene of @video1" indica al sistema que inyecte el sujeto de la imagen de referencia ligado a @Actor-1 y la referencia de movimiento ligada a @video1 en el proceso de generación.Parámetros de la solicitud
Campos generales
Hay dos niveles de modelo disponibles:
| Modelo | Posicionamiento | Casos de uso |
|---|---|---|
skyreels-v4-fast | Prioriza velocidad | Vistas previas rápidas, generación por lotes, contenido diario |
skyreels-v4-std | Prioriza calidad (precio 25~30% superior al Fast) | Tomas clave, requisitos de alto detalle, entregas formales |
Prompt de texto, máximo 1280 tokensDescriba escenas, sujetos, acciones y estilos en detalle para obtener mejores resultados.Al usar
ref_images / ref_videos / mid_frame_images, el prompt debe contener el @tag correspondiente (por ejemplo, @Actor-1, @video1, @image1).Ejemplo: "@Actor-1 walks through a neon-lit street at night."Duración del video de salida (segundos)
- Rango:
[3, 15] - Por defecto:
5
Resolución del videoOpciones:
480p720p1080p(por defecto)
Proporción de aspectoOpciones:
16:9(por defecto)4:31:19:163:4
Si se debe optimizar el prompt automáticamenteCuando está activado, el sistema optimiza automáticamente su prompt para obtener mejores resultados.
Campos específicos de I2V
URL de la imagen del primer fotograma (jpg / jpeg / png / gif / bmp)Cuando se proporciona, esta imagen se utiliza como fotograma inicial del video.
URL de la imagen del último fotograma (jpg / jpeg / png / gif / bmp)Cuando se proporciona, esta imagen se utiliza como fotograma final del video. Puede combinarse con
first_frame_image para el control de primer y último fotograma.Lista de fotogramas clave intermedios, hasta 6. Cada elemento tiene la siguiente estructura:
Campos específicos de Omni
Lista de imágenes de referencia (todos los elementos deben compartir el mismo
type). Cada elemento tiene la siguiente estructura:Lista de videos de referencia, hasta 1. Cada elemento tiene la siguiente estructura:
Escenarios soportados
Los siguientes escenarios son soportados tanto porskyreels-v4-fast como por skyreels-v4-std:
| Escenario | Modo | Campos requeridos | Caso de uso típico |
|---|---|---|---|
| Text-to-Video | T2V | prompt | Generación basada en texto puro, tomas conceptuales rápidas |
| Image-to-Video - Primer fotograma | I2V | first_frame_image | Imagen estática a video con un fotograma inicial especificado |
| Image-to-Video - Último fotograma | I2V | end_frame_image | Especifica el fotograma de cierre |
| Image-to-Video - Fotogramas clave | I2V | mid_frame_images (1 ~ 6) | Primer + último + fotogramas clave intermedios para un ritmo preciso |
| Omni Sujeto único/múltiple | Omni | ref_images (type=image) | Consistencia de personaje, encuadre multi-sujeto |
| Omni Collage en cuadrícula | Omni | ref_images (type=grid, 1 imagen) | Videos paso a paso (tutoriales, recetas, demos) |
| Omni Referencia de movimiento | Omni | ref_videos (type=reference) | Replicar el movimiento, sujeto o estilo de un video de referencia |
| Omni Extensión de video | Omni | ref_videos (type=extend) | Continuar un video existente con contenido nuevo |
| Omni Sincronización de audio | Omni | ref_images (type=image) + audio_url | Narración con humano digital, lip-sync impulsado por audio |
Restricciones de parámetros
Violar cualquiera de las siguientes hará que la solicitud sea rechazada con una respuesta 422, sin facturación:| Parámetro | Restricción |
|---|---|
prompt | Máximo 1280 tokens |
duration | [3, 15] segundos; sobrescrito por la longitud del video de referencia (máx. 10s) cuando ref_videos.type=reference |
resolution | Solo 480p / 720p / 1080p |
aspect_ratio | 16:9 / 4:3 / 1:1 / 9:16 / 3:4; ignorado en I2V; ignorado cuando Omni incluye ref_videos |
mid_frame_images | Hasta 6; time_stamp debe ser -1 o estar dentro de (0, duration) |
ref_images general | Todos los elementos deben compartir el mismo type; no puede coexistir con campos I2V |
ref_images.type=grid | Longitud de lista debe ser 1; image_urls debe ser 1 imagen |
ref_images.type=image | Longitud de lista 1 ~ 3; cada image_urls con longitud 1 ~ 5 |
ref_images.audio_url | Solo soportado cuando type=image, audio ≤ 15 segundos |
ref_videos | Hasta 1; video_url MP4 / MOV, ≤ 15 segundos |
ref_videos.type=reference | Sobrescribe la duration solicitada (máx. 10s), puede combinarse con ref_images.type=image, incluye por defecto el audio del video de entrada |
ref_videos.type=extend | Facturado por la duration solicitada; no puede combinarse con ref_images |
Campo tag | Debe comenzar con @ y aparecer en el prompt |
| Exclusión I2V / Omni | Los campos I2V y Omni no pueden usarse juntos |
Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Ejemplos de solicitud
Caso 1: Texto a video (mínimo)
Caso 2: Texto a video (parámetros completos)
Caso 3: Imagen a video - Primer fotograma
Caso 4: Imagen a video - Primer/Último fotograma + fotogramas clave intermedios
Caso 5: Omni - Referencia de sujeto único
Caso 6: Omni - Multi-sujeto + referencia de movimiento por video
Caso 7: Omni - Collage en cuadrícula
Caso 8: Omni - Extensión de video (extend)
Caso 9: Omni - Sincronización de audio (impulsado por voz)
Consultar resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.