Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-video-o1",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-video-o1",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorización

Authorization
string
requerido
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de la solicitud

model
string
requerido
Nombre del modelo de generación de videoModelos compatibles:
  • kling-video-o1 - Kling Video O1 (mejorado por razonamiento, la más alta calidad)
prompt
string
requerido
Prompt de texto positivoAdmite referenciar imágenes de image_urls usando la sintaxis <<<image_N>>>, donde N comienza en 1.Ejemplo: "Make the person in <<<image_1>>> wave at the camera"
Si se proporcionan imágenes pero el prompt no contiene ninguna referencia <<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.
mode
string
predeterminado:"std"
Modo de generaciónOpciones:
  • std - Modo estándar (720P)
  • pro - Modo profesional (1080P)
Predeterminado: std
duration
integer
predeterminado:"5"
Duración del video (segundos)Opciones: 5 o 10Predeterminado: 5
aspect_ratio
string
predeterminado:"16:9"
Relación de aspecto del videoOpciones:
  • 16:9 - Horizontal
  • 9:16 - Vertical
  • 1:1 - Cuadrado
Predeterminado: 16:9
image_urls
array<url>
Array de URLs de imágenes para la referencia de imágenesReferencie las imágenes correspondientes en el prompt usando la sintaxis <<<image_N>>> (N comienza en 1)Ejemplo: ["https://example.png"]
  • Las URLs de imágenes deben ser de acceso público, sin protección contra hotlinking
  • En el modo image-to-video, aspect_ratio puede ser sobrescrito por la relación real de la imagen
  • Hasta dos imágenes. El primer elemento del array es el frame inicial, y el segundo es el frame final
video_list
array
Lista de videos de referencia (basada en URL), hasta 1 video.Use refer_type para distinguir los tipos:
  • base: video a editar (predeterminado)
  • feature: video de referencia de características
Use keep_original_sound para controlar si se conserva el audio original:
  • no: no conservar (predeterminado)
  • yes: conservar el sonido original
Formato de la solicitud:
"video_list":[
  { "video_url": "video_url", "refer_type": "base", "keep_original_sound": "no" }
]
  • video_url no puede estar vacío y la URL del video debe ser accesible
  • Cuando refer_type=base:
    • No se pueden definir los frames inicial/final
    • El video de referencia debe durar entre 3 y 10 segundos
    • La duración del video generado sigue al video subido
  • Cuando refer_type=feature y video_url no está vacío:
    • image_urls solo puede incluir una imagen del primer frame
  • Requisitos del video: solo MP4/MOV; duración mínima de 3 segundos; resolución 720px-2160px; velocidad de fotogramas 24-60fps (la salida es 24fps); tamaño no superior a 200MB

Sintaxis de referencia de imágenes

El modelo Video O1 utiliza la sintaxis <<<image_N>>> para referenciar imágenes en los prompts, ofreciendo una experiencia unificada text-to-video/image-to-video:
SintaxisDescripción
<<<image_1>>>Referencia la 1ª imagen del array image_urls
<<<image_2>>>Referencia la 2ª imagen del array image_urls
Referencia automática: Si se proporciona image_urls pero el prompt no contiene ninguna referencia <<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.

Respuesta

code
integer
Código de estado de la respuesta, 200 en caso de éxito
data
array
Array de datos de la respuesta

Casos de uso

Caso 1: Texto a video (Máxima calidad)

{
  "model": "kling-video-o1",
  "prompt": "A cinematic shot of a city skyline at golden hour",
  "mode": "pro",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Caso 2: Referencia de imagen (Imagen única)

{
  "model": "kling-video-o1",
  "prompt": "Make the person in <<<image_1>>> wave at the camera",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "pro",
  "duration": 5
}

Caso 3: Múltiples referencias de imagen

{
  "model": "kling-video-o1",
  "prompt": "The character in <<<image_1>>> walks toward the scene in <<<image_2>>>",
  "image_urls": [
    "https://example.com/character.jpg",
    "https://example.com/scene.jpg"
  ],
  "mode": "pro",
  "duration": 5
}

Caso 4: Imagen proporcionada sin referencia explícita (añadida automáticamente)

{
  "model": "kling-video-o1",
  "prompt": "The person slowly turns and smiles",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "std",
  "duration": 5
}
El sistema añadirá automáticamente <<<image_1>>> al principio del prompt, equivalente a "<<<image_1>>>The person slowly turns and smiles".
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.