Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-3.0-turbo",
    "prompt": "Un corgi corriendo por la playa, estilo cinematográfico, luz del atardecer",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-3.0-turbo",
    "prompt": "Un corgi corriendo por la playa, estilo cinematográfico, luz del atardecer",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autenticación

Authorization
string
requerido
Todas las interfaces requieren autenticación mediante Bearer TokenObtener la API Key:Visita la página de gestión de API Keys para obtener tu API KeyAl usarla, añádela en el encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de solicitud

model
string
requerido
Nombre del modelo de generación de videoModelos admitidos:
  • kling-3.0-turbo - Kling 3.0 Turbo
prompt
string
requerido
Prompt de textoEl límite del proveedor es de 3072 caracteres como máximo; se recomienda no superar los 2500 caracteres.Ejemplo: "Un corgi corriendo por la playa, estilo cinematográfico, luz del atardecer"
first_frame_image
string
Admite URL de imagen o Base64.
Límites del proveedor para la imagen del primer fotograma:
  • Formato: .jpg / .jpeg / .png
  • Tamaño: ≤ 50MB
  • Ancho y alto: ≥ 300px
  • Relación de aspecto: 1:2.5 ~ 2.5:1
aspect_ratio
string
predeterminado:"16:9"
Relación de aspecto del videoValores posibles:
  • 16:9 - Horizontal
  • 9:16 - Vertical
  • 1:1 - Cuadrado
Valor predeterminado: 16:9
Solo tiene efecto en texto a video. En imagen a video este campo no es válido; la relación del video la determina el primer fotograma.
resolution
string
predeterminado:"720p"
Definición del videoValores posibles:
  • 720p
  • 1080p
Valor predeterminado: 720p
duration
integer
predeterminado:"5"
Duración del video (segundos)Rango de valores: 3-15 (mínimo 3 segundos, máximo 15 segundos)Valor predeterminado: 5⚠️ Atención: debe introducirse como un número puro (por ejemplo 6), sin comillas, de lo contrario se producirá un error
watermark
boolean
Si se añade marca de aguaSolo se envía al proveedor cuando se pasa explícitamente; si no se pasa, no se añade marca de agua.

Texto a video vs imagen a video

El sistema determina automáticamente el modo de generación según se proporcione o no first_frame_image: con imagen de primer fotograma usa imagen a video, sin imagen de primer fotograma usa texto a video; el usuario no necesita declararlo explícitamente.
ParámetroTexto a videoImagen a video
prompt✅ Obligatorio✅ Opcional (si se deja vacío, se genera únicamente a partir del primer fotograma)
first_frame_image❌ No se pasa✅ Obligatorio
aspect_ratio✅ Opcional❌ No válido (la relación la determina el primer fotograma)
resolution✅ Opcional✅ Opcional
duration✅ Opcional (3-15)✅ Opcional (3-15)
watermark✅ Opcional✅ Opcional

Respuesta

code
integer
Código de estado de la respuesta, 200 cuando es exitosa
data
array
Array de datos devueltos

Casos de uso

Caso 1: Texto a video (1080P)

{
  "model": "kling-3.0-turbo",
  "prompt": "Un corgi corriendo por la playa, estilo cinematográfico, luz del atardecer",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 5
}

Caso 2: Texto a video (vertical 720P)

{
  "model": "kling-3.0-turbo",
  "prompt": "Cruce de Shibuya en Tokio, una noche lluviosa con luces de neón reflejándose en el suelo mojado, peatones caminando bajo sus paraguas",
  "aspect_ratio": "9:16",
  "resolution": "720p",
  "duration": 10
}

Caso 3: Imagen a video (imagen de primer fotograma)

{
  "model": "kling-3.0-turbo",
  "prompt": "La cámara se acerca lentamente, el personaje sonríe",
  "first_frame_image": "https://cdn.example.com/first.jpg",
  "resolution": "720p",
  "duration": 5
}

Caso 4: Imagen a video solo con el primer fotograma (sin prompt)

{
  "model": "kling-3.0-turbo",
  "first_frame_image": "https://cdn.example.com/first.jpg",
  "resolution": "1080p",
  "duration": 5
}

Caso 5: Múltiples tomas (storyboard) (texto a video)

{
  "model": "kling-3.0-turbo",
  "prompt": "Toma 1,2,un corgi corriendo por la playa;Toma 2,3,la cámara se acerca y el personaje sonríe;",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 5
}
Consultar el resultado de la tareaLa generación de video es una tarea asíncrona; tras el envío se devuelve un task_id. Usa la interfaz Obtener estado de la tarea para consultar el progreso y el resultado de la generación.