Saltar para o conteúdo principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-video-o1",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-video-o1",
    "prompt": "Make the person in <<<image_1>>> wave at the camera",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorização

Authorization
string
obrigatório
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione-a ao cabeçalho da requisição:
Authorization: Bearer YOUR_API_KEY

Parâmetros da requisição

model
string
obrigatório
Nome do modelo de geração de vídeoModelos suportados:
  • kling-video-o1 - Kling Video O1 (aprimorado com raciocínio, máxima qualidade)
prompt
string
obrigatório
Prompt de texto positivoSuporta referência a imagens de image_urls usando a sintaxe <<<image_N>>>, onde N começa em 1.Exemplo: "Make the person in <<<image_1>>> wave at the camera"
Se imagens forem fornecidas, mas o prompt não contiver nenhuma referência <<<image_N>>>, o sistema adicionará automaticamente <<<image_1>>> no início do prompt.
mode
string
padrão:"std"
Modo de geraçãoOpções:
  • std - Modo padrão (720P)
  • pro - Modo profissional (1080P)
Padrão: std
duration
integer
padrão:"5"
Duração do vídeo (segundos)Opções: 5 ou 10Padrão: 5
aspect_ratio
string
padrão:"16:9"
Proporção do vídeoOpções:
  • 16:9 - Paisagem
  • 9:16 - Retrato
  • 1:1 - Quadrado
Padrão: 16:9
image_urls
array<url>
Array de URLs de imagens para referenciamento de imagensReferencie as imagens correspondentes no prompt usando a sintaxe <<<image_N>>> (N começa em 1)Exemplo: ["https://example.png"]
  • As URLs das imagens devem ser publicamente acessíveis, sem proteção contra hotlink
  • No modo image-to-video, aspect_ratio pode ser substituído pela proporção real da imagem
  • Até duas imagens. O primeiro item do array é o frame inicial e o segundo é o frame final
video_list
array
Lista de vídeos de referência (baseada em URLs), até 1 vídeo.Use refer_type para distinguir os tipos:
  • base: vídeo a ser editado (padrão)
  • feature: vídeo de referência por característica
Use keep_original_sound para controlar se o áudio original deve ser mantido:
  • no: não manter (padrão)
  • yes: manter o áudio original
Formato da requisição:
"video_list":[
  { "video_url": "video_url", "refer_type": "base", "keep_original_sound": "no" }
]
  • video_url não pode estar vazio, e a URL do vídeo deve ser acessível
  • Quando refer_type=base:
    • Não é possível definir frames inicial/final
    • O vídeo de referência deve ter de 3 a 10 segundos
    • A duração do vídeo gerado segue o vídeo enviado
  • Quando refer_type=feature e video_url não está vazio:
    • image_urls só pode incluir uma imagem de primeiro frame
  • Requisitos do vídeo: apenas MP4/MOV; duração de pelo menos 3 segundos; resolução de 720px-2160px; taxa de quadros de 24-60fps (a saída é 24fps); tamanho não superior a 200MB

Sintaxe de referência de imagens

O modelo Video O1 usa a sintaxe <<<image_N>>> para referenciar imagens nos prompts, oferecendo uma experiência unificada de text-to-video/image-to-video:
SintaxeDescrição
<<<image_1>>>Referencia a 1ª imagem no array image_urls
<<<image_2>>>Referencia a 2ª imagem no array image_urls
Referência automática: Se image_urls for fornecido, mas o prompt não contiver nenhuma referência <<<image_N>>>, o sistema adicionará automaticamente <<<image_1>>> no início do prompt.

Resposta

code
integer
Código de status da resposta, 200 em caso de sucesso
data
array
Array de dados da resposta

Casos de uso

Caso 1: Texto para vídeo (Máxima qualidade)

{
  "model": "kling-video-o1",
  "prompt": "A cinematic shot of a city skyline at golden hour",
  "mode": "pro",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Caso 2: Referência de imagem (uma imagem)

{
  "model": "kling-video-o1",
  "prompt": "Make the person in <<<image_1>>> wave at the camera",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "pro",
  "duration": 5
}

Caso 3: Múltiplas referências de imagens

{
  "model": "kling-video-o1",
  "prompt": "The character in <<<image_1>>> walks toward the scene in <<<image_2>>>",
  "image_urls": [
    "https://example.com/character.jpg",
    "https://example.com/scene.jpg"
  ],
  "mode": "pro",
  "duration": 5
}

Caso 4: Imagem fornecida sem referência explícita (adicionada automaticamente)

{
  "model": "kling-video-o1",
  "prompt": "The person slowly turns and smiles",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "std",
  "duration": 5
}
O sistema adicionará automaticamente <<<image_1>>> no início do prompt, equivalente a "<<<image_1>>>The person slowly turns and smiles".
Consultar os resultados da tarefaA geração de vídeo é uma tarefa assíncrona que retorna um task_id ao ser submetida. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.