Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorización

Authorization
string
requerido
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de la solicitud

model
string
requerido
Nombre del modelo de generación de videoModelos compatibles:
  • kling-v3 - Kling v3 (recomendado)
prompt
string
requerido
Prompt de textoDescriba escenas, acciones y estilos en detalle para obtener mejores resultados. Se recomienda utilizar prompts en inglés.Ejemplo: "a golden retriever running on the beach, sunset, cinematic"
negative_prompt
string
Prompt negativo para excluir contenido no deseadoEjemplo: "blurry, low quality, distorted"
mode
string
predeterminado:"std"
Modo de generaciónOpciones:
  • std - Modo estándar (720P)
  • pro - Modo profesional (1080P)
  • 4k - Modo 4K
Predeterminado: std
duration
integer
predeterminado:"5"
Predeterminado: 5 Duración del video (segundos)Rango: 3-15 (mínimo 3 segundos, máximo 15 segundos)⚠️ Nota: Debe ser un número simple (por ejemplo, 6), sin comillas, de lo contrario se producirá un error
aspect_ratio
string
predeterminado:"16:9"
Relación de aspecto del videoOpciones:
  • 16:9 - Horizontal
  • 9:16 - Vertical
  • 1:1 - Cuadrado
Predeterminado: 16:9
image_urls
array<url>
Array de URLs de imágenes para la generación image-to-video
  • Pase 1 imagen: se usa como primer frame
  • Pase 2 imágenes: se asignan automáticamente como primer frame + último frame
Se admiten hasta 2 imágenesEjemplo: ["https://example.com/first.jpg"]
  • Se admiten hasta 2 imágenes
  • Las URLs de imágenes deben ser de acceso público, sin protección contra hotlinking
  • En el modo image-to-video, aspect_ratio puede ser sobrescrito por la relación real de la imagen
watermark
boolean
Define si se añade una marca de agua
audio
boolean
predeterminado:"false"
Define si se genera el video con audio
multi_shot
boolean
predeterminado:"false"
Define si se activa el modo multi-shot (varios planos).
  • true
  • false
shot_type
string
Método de división de planos: customize / intelligence.Obligatorio cuando multi_shot=true.
multi_prompt
array<object>
Información por plano, como prompt y duración.Defina el orden, el prompt y la duración de los planos mediante index, prompt y duration.
  • Admite de 1 a 6 planos
  • La longitud máxima del contenido por plano es 512
  • La duración de cada plano debe ser >= 1 y no puede exceder la duración total de la tarea
  • La suma de las duraciones de todos los planos debe ser igual al duration de nivel superior
Formato:
"multi_prompt": [
  { "index": 1, "prompt": "string", "duration": 5 },
  { "index": 2, "prompt": "string", "duration": 5 }
]
Obligatorio cuando multi_shot=true y shot_type=customize.
element_list
array<object>
Lista de sujetos de referencia, hasta 3 sujetos.
  • Creados al instante mediante name, description, element_input_urls
Ejemplo:
[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]
Notas:
  • Para la creación al instante, name, description y element_input_urls son obligatorios
  • element_input_urls: 2-4 imágenes por sujeto (la primera como imagen frontal, las demás como referencias)
  • Referencie los elementos en prompt con @name, por ejemplo, "@element_dog chasing @element_cat on grass"

Restricciones de parámetros

  • mode=4k es compatible con kling-v3
  • image_urls admite hasta 2 imágenes (1 primer frame, 2 primer+último frames)
  • La entrada solo del último frame no es válida (debe incluir el primer frame)
  • Cuando multi_shot=true, el prompt de nivel superior puede omitirse
  • multi_prompt admite hasta 6 planos, e index debe comenzar en 1 y ser continuo

Matriz de compatibilidad de funciones

TipoFunciónstd 5sstd 10sstd 15spro 5spro 10s
Text-to-VideoGeneración
Image-to-VideoGeneración
Image-to-VideoPrimer frame
Image-to-VideoÚltimo frame

Texto a video (Text-to-Video) vs Imagen a video (Image-to-Video)

El sistema determina automáticamente el modo según si se proporciona o no image_urls: sin imágenes significa text-to-video, con imágenes significa image-to-video.
ParámetroText-to-VideoImage-to-Video
prompt✅ Obligatorio✅ Obligatorio
image_urls❌ No se utiliza✅ Obligatorio (1-2 imágenes)
negative_prompt✅ Opcional✅ Opcional
mode✅ Opcional✅ Opcional
duration✅ Opcional (3-15)✅ Opcional (3-15)
aspect_ratio✅ Opcional⚠️ Puede ser sobrescrito por la relación de la imagen
watermark✅ Opcional✅ Opcional
audio✅ Opcional✅ Opcional

Respuesta

code
integer
Código de estado de la respuesta, 200 en caso de éxito
data
array
Array de datos de la respuesta

Casos de uso

Caso 1: Texto a video (Modo estándar)

{
  "model": "kling-v3",
  "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Caso 2: Texto a video (Modo Pro + prompt negativo)

{
  "model": "kling-v3",
  "prompt": "Tokyo Shibuya crossing at night, neon lights reflected on wet ground, people walking with umbrellas",
  "negative_prompt": "blurry, low quality, distorted",
  "mode": "pro",
  "duration": 10,
  "aspect_ratio": "16:9"
}

Caso 3: Texto a video (15 segundos)

{
  "model": "kling-v3",
  "prompt": "a time-lapse of a flower blooming in a garden",
  "duration": 15,
  "aspect_ratio": "16:9"
}

Caso 4: Imagen a video (Primer frame)

{
  "model": "kling-v3",
  "prompt": "the cat slowly walks forward and looks around",
  "image_urls": ["https://example.com/cat.jpg"],
  "mode": "std",
  "duration": 5
}

Caso 5: Imagen a video (Control de primer + último frame)

{
  "model": "kling-v3",
  "prompt": "smooth cinematic transition",
  "image_urls": [
    "https://example.com/frame-start.jpg",
    "https://example.com/frame-end.jpg"
  ],
  "mode": "std",
  "duration": 5
}

Caso 6: Generar video con audio

{
  "model": "kling-v3",
  "prompt": "A rock singer singing on this stage, concert scene, flashing lights",
  "audio": true,
  "mode": "std",
  "duration": 5
}

Caso 7: Storyboard multi-shot (customize, 15 segundos, vertical con audio)

{
  "model": "kling-v3",
  "multi_prompt": [
    {
      "index": 1,
      "prompt": "Two friends talking under a streetlight at night. Warm glow, casual poses, no dialogue.",
      "duration": 2
    },
    {
      "index": 2,
      "prompt": "A runner sprinting through a forest, leaves flying. Low-angle shot, focus on movement.",
      "duration": 3
    },
    {
      "index": 3,
      "prompt": "A woman hugging a cat, smiling. Soft sunlight, cozy home setting, emphasize warmth.",
      "duration": 3
    },
    {
      "index": 4,
      "prompt": "A door creaking open, shadowy hallway. Dark tones, minimal details, eerie mood.",
      "duration": 3
    },
    {
      "index": 5,
      "prompt": "A man slipping on a banana peel, shocked expression. Exaggerated pose, bright colors.",
      "duration": 3
    },
    {
      "index": 6,
      "prompt": "A sunset over mountains, small figure walking away. Wide angle, peaceful atmosphere.",
      "duration": 1
    }
  ],
  "multi_shot": true,
  "shot_type": "customize",
  "duration": 15,
  "mode": "pro",
  "audio": true,
  "size": "9:16"
}
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.