Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Autenticación

Authorization
string
requerido
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala a la cabecera de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de la solicitud

model
string
requerido
Nombre del modelo de generación de videoModelos admitidos:
  • doubao-seedance-2.0 - Versión estándar, admite texto-a-video, imagen-a-video, video de primer/último fotograma, video de referencia, audio de referencia y video con audio
  • doubao-seedance-2.0-fast - Versión rápida, mismas funciones que la estándar con mayor velocidad de generación
  • doubao-seedance-2.0-face - Admite subidas de personas reales, mismas funciones que la versión estándar
  • doubao-seedance-2.0-fast-face - Admite subidas de personas reales, mismas funciones que la versión rápida
prompt
string
Descripción del contenido del videoRequerido para texto-a-video; opcional para imagen-a-video o video-de-referencia-a-videoSe recomienda especificar claramente el sujeto, la acción, el movimiento de cámara y el estilo para obtener mejores resultados
El prompt está limitado a 4000 caracteres, pero se recomiendan 500 caracteres.
Ejemplo: "A kitten yawning at the camera"
duration
integer
predeterminado:"5"
Duración del video (segundos)Rango admitido: 4 a 15 segundosPredeterminado: 5
size
string
predeterminado:"16:9"
Proporción del videoOpciones:
  • 16:9 - Horizontal
  • 9:16 - Vertical
  • 1:1 - Cuadrado
  • 4:3 - Proporción tradicional
  • 3:4 - Proporción tradicional vertical
  • 21:9 - Ultra ancha
  • adaptive - Adaptativa (coincide automáticamente con la imagen/video de entrada)
Predeterminado: 16:9
resolution
string
predeterminado:"480p"
Resolución del videoOpciones:
  • 480p - Definición estándar
  • 720p - Alta definición
  • 1080p - Full HD (solo admitida por doubao-seedance-2.0-face y doubao-seedance-2.0)
Predeterminado: 480p
seed
integer
Semilla aleatoria para controlar la aleatoriedad del contenido generado
  • Con la misma solicitud, valores de seed distintos producirán resultados diferentes
  • Con la misma solicitud, el mismo valor de seed producirá resultados similares, aunque no se garantiza una coincidencia exacta
generate_audio
boolean
predeterminado:"false"
Si se debe generar audio (video con audio)Cuando se establece en true, el video incluirá audio de acompañamiento generado por IAPredeterminado: false
return_last_frame
boolean
predeterminado:"false"
Si se debe devolver la imagen del último fotogramaCuando se establece en true, el resultado de la tarea devolverá adicionalmente la URL del último fotograma del video, que puede usarse para generación continua de videoPredeterminado: false
tools
array<object>
Lista de herramientas para capacidades mejoradas como búsqueda en la webEjemplo: [{"type": "web_search"}]
image_urls
array<string>
Array de URLs de imagen para imagen-a-videoAdmite dos formatos:
  • URL de imagen normal: https://example.com/cat.jpg
  • Asset URL (asset aprobado): asset://asset_a
Ejemplo: ["https://example.com/cat.jpg"] o ["asset://asset_a"]
Asset URL solo es compatible con los modelos doubao-seedance-2.0 y doubao-seedance-2.0-fast. Otros modelos no la admiten.
  • image_urls e image_with_roles no se pueden usar simultáneamente
  • Máximo de 9 imágenes de referencia
image_with_roles
array
Array de imágenes con roles, admite especificar primer fotograma/último fotograma
Cuando el campo url usa una Asset URL, solo se admiten los modelos doubao-seedance-2.0 y doubao-seedance-2.0-fast. Otros modelos no la admiten.
Ejemplo:
[
  {"url": "https://example.com/day.jpg", "role": "first_frame"},
  {"url": "https://example.com/night.jpg", "role": "last_frame"}
]
Formato Asset URL:
[
  {"url": "asset://asset_a", "role": "reference_image"}
]
  • image_urls e image_with_roles no se pueden usar simultáneamente
  • Al usar imágenes de primer/último fotograma, video_urls y audio_urls no están disponibles
video_urls
array<string>
Array de URLs de video de referenciaAdmite dos formatos:
  • URL de video normal: https://example.com/reference.mp4
  • Asset URL (asset aprobado): asset://asset_a
Ejemplo: ["https://example.com/reference.mp4"] o ["asset://asset_a"]
Asset URL solo es compatible con los modelos doubao-seedance-2.0 y doubao-seedance-2.0-fast. Otros modelos no la admiten.
  • Al usar imágenes de primer/último fotograma (image_with_roles), los videos de referencia no están disponibles
  • Máximo de 3 videos de referencia, duración total de 15s o menos
  • La resolución del video de referencia debe estar entre 480P y 720P
  • Los videos de referencia no deben contener personas reales
audio_urls
array<string>
Array de URLs de audio de referenciaAdmite dos formatos:
  • URL de audio normal: https://example.com/speech.wav
  • Asset URL (asset aprobado): asset://asset_a
Ejemplo: ["https://example.com/speech.wav"] o ["asset://asset_a"]
Asset URL solo es compatible con los modelos doubao-seedance-2.0 y doubao-seedance-2.0-fast. Otros modelos no la admiten.
  • Al usar imágenes de primer/último fotograma (image_with_roles), el audio de referencia no está disponible
  • Máximo de 3 archivos de audio de referencia, duración total de 15s o menos
  • El audio de referencia debe usarse junto con imágenes de referencia o videos de referencia

Respuesta

code
integer
Código de estado de la respuesta, 200 en caso de éxito
data
array
Array de datos de la respuesta

Casos de uso

Caso 1: Texto-a-video

{
  "model": "doubao-seedance-2.0",
  "prompt": "A kitten yawning at the camera",
  "resolution": "720p",
  "size": "16:9",
  "duration": 5,
  "seed": 42,
  "generate_audio": true
}

Caso 2: Imagen-a-video (primer fotograma)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten stands up and walks toward the camera",
  "image_urls": ["https://example.com/cat.jpg"],
  "duration": 5
}

Caso 3: Video con primer/último fotograma

{
  "model": "doubao-seedance-2.0",
  "prompt": "Transition from day to night",
  "image_with_roles": [
    {"url": "https://example.com/day.jpg", "role": "first_frame"},
    {"url": "https://example.com/night.jpg", "role": "last_frame"}
  ],
  "duration": 5
}

Caso 4: Video-de-referencia-a-video

{
  "model": "doubao-seedance-2.0",
  "prompt": "Convert the video style to anime style",
  "video_urls": ["https://example.com/reference.mp4"]
}

Caso 5: Video de referencia + audio de referencia

{
  "model": "doubao-seedance-2.0",
  "prompt": "A scene of a person speaking",
  "video_urls": ["https://example.com/reference.mp4"],
  "audio_urls": ["https://example.com/speech.wav"],
  "size": "16:9",
  "duration": 11
}

Caso 6: Video con audio

{
  "model": "doubao-seedance-2.0",
  "prompt": "A man stops a woman and says: \"Remember, you must never point your finger at the moon.\"",
  "generate_audio": true
}

Caso 7: Generación continua de video (devolver último fotograma)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten continues walking toward the camera",
  "image_urls": ["https://example.com/last_frame_from_prev.png"],
  "return_last_frame": true
}

Caso 8: Generación con versión rápida

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "City nightscape timelapse photography",
  "size": "21:9",
  "duration": 8
}

Caso 9: Imágenes de referencia + video de referencia + audio de referencia (video multimodal)

Combine imágenes de referencia, video de referencia y audio de referencia para generar un video publicitario inmersivo en primera persona. Ideal para promociones de productos, anuncios de marca y otros escenarios que requieran la fusión de material de múltiples fuentes.
{
  "model": "doubao-seedance-2.0",
  "prompt": "Use video 1's first-person perspective throughout, and use audio 1 as the background music throughout. First-person POV fruit tea advertisement for seedance brand 'Peace Apple' apple fruit tea limited edition. First frame is image 1: your hand picks a dewy Aksu red apple with a crisp apple collision sound. 2-4s: quick cut, your hand drops apple chunks into a shaker cup, adds ice and tea base, shakes vigorously, ice collision and shaking sounds sync with upbeat drum beats, background voice: 'Fresh-cut, fresh-shaken'. 4-6s: first-person close-up of the finished product, layered fruit tea poured into a clear cup, your hand gently squeezes cream cap spreading on top, sticks a pink label on the cup, camera zooms in on the layered texture of cream cap and fruit tea. 6-8s: first-person handheld cup raise, you lift the fruit tea from image 2 toward the camera (simulating handing it to the viewer), cup label clearly visible, background voice 'Take a sip of freshness', final frame freezes on image 2. Background voice consistently uses a female tone.",
  "image_urls": [
    "https://example.com/tea_pic1.jpg",
    "https://example.com/tea_pic2.jpg"
  ],
  "video_urls": ["https://example.com/tea_video1.mp4"],
  "audio_urls": ["https://example.com/tea_audio1.mp3"],
  "generate_audio": true,
  "size": "16:9",
  "duration": 11
}

Caso 10: Imagen-a-video con Asset URL

Los assets de avatar virtual aprobados pueden pasarse directamente como imágenes de referencia sin volver a subirlos ni someterlos a revisión nuevamente.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character walks naturally on a city street under bright sunshine",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Caso 11: Especificar retrato de referencia con Asset URL (image_with_roles)

{
  "model": "doubao-seedance-2.0",
  "prompt": "Using the reference portrait, the character walks elegantly toward the camera",
  "image_with_roles": [
    {
      "url": "asset://asset_a",
      "role": "reference_image"
    }
  ],
  "resolution": "720p",
  "duration": 5
}

Caso 12: Versión rápida + imagen-a-video con Asset URL

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "The character strolls in a park with a gentle breeze",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Caso 13: Imagen con Asset URL + video de referencia (transferencia de movimiento)

Combine un asset de retrato aprobado con un video de referencia para que el personaje realice los movimientos especificados.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character dances to the rhythm of the reference video with smooth and natural movements",
  "image_urls": ["https://example.com/dance_reference.jpg", "asset://asset_a"],
  "video_urls": ["https://example.com/dance_reference.mp4", "asset://asset_a"],
  "duration": 8,
  "resolution": "720p"
}
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un task_id al enviarla. Use el endpoint Obtener estado de tarea para consultar el progreso y los resultados de la generación.

Diferencias con la versión 1.5 Pro

Característica1.5 Pro2.0 / 2.0 fast
Resolución480p/720p/1080p480p/720p
Rango de duración4-12s5-15s
Duración predeterminada5s5s
Parámetro de proporciónaspect_ratiosize (nueva opción adaptive)
Generación de audioparámetro audioparámetro generate_audio
Video de referenciaNo admitidoAdmitido vía video_urls
Audio de referenciaNo admitidoAdmitido vía audio_urls
Imagen-a-videoimage_urls / image_with_rolesimage_urls / image_with_roles
Video con audioNo admitidoAdmitido vía generate_audio
Video continuoNo admitidoAdmitido vía return_last_frame
Versión rápidaNo admitidaAdmitida vía doubao-seedance-2.0-fast