Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorización

Authorization
string
requerido
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de la solicitud

model
string
requerido
Nombre del modelo de generación de videoModelos compatibles:
  • kling-v3-omni - Kling v3 Omni (interfaz unificada)
prompt
string
requerido
Prompt de texto positivoAdmite referenciar imágenes de image_urls usando la sintaxis <<<image_N>>>, donde N comienza en 1.Ejemplo: "Make the person in <<<image_1>>> wave at the camera"
Si se proporcionan imágenes pero el prompt no contiene ninguna referencia <<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.
negative_prompt
string
Prompt negativo utilizado para excluir contenido no deseado. La longitud máxima es de 2500 caracteres.
mode
string
predeterminado:"std"
Modo de generaciónOpciones:
  • std - Modo estándar (720P)
  • pro - Modo profesional (1080P)
  • 4k - Modo 4K ultra HD
Predeterminado: std
duration
integer
predeterminado:"5"
Predeterminado: 5 Duración del video (segundos)Rango: 3-15 (mínimo 3 segundos, máximo 15 segundos)⚠️ Nota: Debe ser un número simple (por ejemplo, 6), sin comillas, de lo contrario se producirá un error
aspect_ratio
string
predeterminado:"16:9"
Relación de aspecto del videoOpciones:
  • 16:9 - Horizontal
  • 9:16 - Vertical
  • 1:1 - Cuadrado
Predeterminado: 16:9
image_urls
array<url>
Array de URLs de imágenes para la referencia de imágenesReferencie las imágenes correspondientes en el prompt usando la sintaxis <<<image_N>>> (N comienza en 1)Ejemplo: ["https://example.com/photo.jpg"]
  • Las URLs de imágenes deben ser de acceso público, sin protección contra hotlinking
  • En el modo image-to-video, aspect_ratio puede ser sobrescrito por la relación real de la imagen
image_with_roles
array<object>
Array de imágenes basadas en roles, recomendado para image-to-video.Formato de cada elemento: { "url": "...", "role": "..." }
  • first_frame: primer frame
  • last_frame: último frame
  • reference: imagen de referencia
image_urls e image_with_roles son mutuamente excluyentes. Use solo uno.
video_list
array
Lista de videos de referencia (basada en URL), hasta 1 video.Use refer_type para distinguir los tipos:
  • base: video a editar (predeterminado)
  • feature: video de referencia de características
Use keep_original_sound para controlar el audio original:
  • no: no conservar (predeterminado)
  • yes: conservar el sonido original
Formato de la solicitud:
"video_list":[
  { "video_url": "video_url", "refer_type": "base", "keep_original_sound": "no" }
]
  • video_url no puede estar vacío y la URL del video debe ser accesible
  • Cuando refer_type=base:
    • No se pueden definir los frames inicial/final
    • El video de referencia debe durar entre 3 y 10 segundos
    • La duración del video generado sigue al video subido
  • Cuando refer_type=feature y video_url no está vacío:
    • image_urls solo puede incluir una imagen del primer frame
  • Requisitos del video: solo MP4/MOV; duración mínima de 3 segundos; resolución 720px-2160px; velocidad de fotogramas 24-60fps (la salida es 24fps); tamaño no superior a 200MB
multi_shot
boolean
predeterminado:"false"
Define si se activa el modo multi-shot.
shot_type
string
Método de división de planos: customize / intelligence.Obligatorio cuando multi_shot=true.
multi_prompt
array<object>
Lista multi-shot, cada elemento es { index, prompt, duration }.
  • Mínimo 1 plano, máximo 6 planos
  • El duration de cada plano debe ser un entero y >= 1
  • La suma de las duraciones de todos los planos debe ser igual al duration de nivel superior
  • index debe comenzar en 1 y aumentar de forma continua
  • Obligatorio cuando multi_shot=true y shot_type=customize
Ejemplo:
[
  { "index": 1, "prompt": "a happy dog in running@element_cat", "duration": 3 },
  { "index": 2, "prompt": "a happy dog play with a cat@element_dog", "duration": 3 }
]
element_list
array<object>
Lista de sujetos de referencia, hasta 3 sujetos. Admite:
  • Crear sujetos al instante con name, description, element_input_urls
Formato común:
[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]
Notas:
  • Para la creación al instante, name, description, element_input_urls son obligatorios
  • element_input_urls: de 2 a 4 imágenes por sujeto (la primera como imagen frontal, las demás como referencias)
  • Use @name en prompt, por ejemplo, "@element_dog and @element_cat are playing on the grass"
watermark
boolean
Define si se añade una marca de agua
audio
boolean
predeterminado:"false"
Define si se genera el video con audio
Este parámetro es mutuamente excluyente con video_list.Cuando video_list tiene un valor, el parámetro audio no es necesario.

Restricciones y límites de parámetros

  • image_urls e image_with_roles son mutuamente excluyentes
  • mode=4k está disponible para kling-v3-omni
  • La entrada solo del último frame (last_frame sin primer frame) no es válida
  • Los frames inicial/final y la edición de video son mutuamente excluyentes: cuando video_list.refer_type=base (u omitido), no se permiten los frames inicial/final
  • Cuando video_list está presente, se ignora audio
  • video_list admite como máximo 1 video
  • multi_prompt admite hasta 6 planos, con index comenzando en 1 y aumentando de forma continua

Sintaxis de referencia de imágenes

El modelo Omni utiliza la sintaxis <<<image_N>>> para referenciar imágenes en los prompts, ofreciendo una experiencia unificada text-to-video/image-to-video:
SintaxisDescripción
<<<image_1>>>Referencia la 1ª imagen del array image_urls
<<<image_2>>>Referencia la 2ª imagen del array image_urls
Referencia automática: Si se proporciona image_urls pero el prompt no contiene ninguna referencia <<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.

Respuesta

code
integer
Código de estado de la respuesta, 200 en caso de éxito
data
array
Array de datos de la respuesta

Casos de uso

Caso 1: Texto a video (Modo estándar)

{
  "model": "kling-v3-omni",
  "prompt": "A golden retriever running on the beach, sunset, cinematic",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Caso 2: Referencia de imagen (Imagen única)

{
  "model": "kling-v3-omni",
  "prompt": "Make the person in <<<image_1>>> wave at the camera",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "pro",
  "duration": 5
}

Caso 3: Múltiples referencias de imagen

{
  "model": "kling-v3-omni",
  "prompt": "The character in <<<image_1>>> walks toward the scene in <<<image_2>>>",
  "image_urls": [
    "https://example.com/character.jpg",
    "https://example.com/scene.jpg"
  ],
  "mode": "pro",
  "duration": 5
}

Caso 4: Imagen proporcionada sin referencia explícita (añadida automáticamente)

{
  "model": "kling-v3-omni",
  "prompt": "The person slowly turns and smiles",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "std",
  "duration": 5
}
El sistema añadirá automáticamente <<<image_1>>> al principio del prompt, equivalente a "<<<image_1>>>The person slowly turns and smiles".

Caso 5: Generar video con audio

{
  "model": "kling-v3-omni",
  "prompt": "A yellow canary singing on a branch",
  "audio": true,
  "mode": "std",
  "duration": 5
}
Nota: audio es mutuamente excluyente con video_list. Cuando video_list tiene un valor, el parámetro audio no es necesario.
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.