Saltar para o conteúdo principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorização

Authorization
string
obrigatório
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione-a ao cabeçalho da requisição:
Authorization: Bearer YOUR_API_KEY

Parâmetros da requisição

model
string
obrigatório
Nome do modelo de geração de vídeoModelos suportados:
  • kling-v3 - Kling v3 (recomendado)
prompt
string
obrigatório
Prompt de textoDescreva cenas, ações e estilos em detalhes para obter melhores resultados. Recomenda-se utilizar prompts em inglês.Exemplo: "a golden retriever running on the beach, sunset, cinematic"
negative_prompt
string
Prompt negativo para excluir conteúdo indesejadoExemplo: "blurry, low quality, distorted"
mode
string
padrão:"std"
Modo de geraçãoOpções:
  • std - Modo padrão (720P)
  • pro - Modo profissional (1080P)
  • 4k - Modo 4K
Padrão: std
duration
integer
padrão:"5"
Padrão: 5 Duração do vídeo (segundos)Faixa: 3-15 (mínimo de 3 segundos, máximo de 15 segundos)⚠️ Nota: Deve ser um número simples (por exemplo, 6), sem aspas, caso contrário ocorrerá um erro
aspect_ratio
string
padrão:"16:9"
Proporção do vídeoOpções:
  • 16:9 - Paisagem
  • 9:16 - Retrato
  • 1:1 - Quadrado
Padrão: 16:9
image_urls
array<url>
Array de URLs de imagens para geração image-to-video
  • Forneça 1 imagem: usada como primeiro frame
  • Forneça 2 imagens: atribuídas automaticamente como primeiro frame + último frame
Suporta no máximo 2 imagensExemplo: ["https://example.com/first.jpg"]
  • Suporta no máximo 2 imagens
  • As URLs das imagens devem ser publicamente acessíveis, sem proteção contra hotlink
  • No modo image-to-video, aspect_ratio pode ser substituído pela proporção real da imagem
watermark
boolean
Define se uma marca d’água deve ser adicionada
audio
boolean
padrão:"false"
Define se o vídeo deve ser gerado com áudio
multi_shot
boolean
padrão:"false"
Define se o modo multi-shot (múltiplos planos) deve ser ativado.
  • true
  • false
shot_type
string
Método de divisão de planos: customize / intelligence.Obrigatório quando multi_shot=true.
multi_prompt
array<object>
Informações por plano, como prompt e duração.Defina a ordem, o prompt e a duração dos planos por meio de index, prompt e duration.
  • Suporta de 1 a 6 planos
  • O comprimento máximo do conteúdo por plano é 512
  • A duração de cada plano deve ser >= 1 e não pode exceder a duração total da tarefa
  • A soma das durações de todos os planos deve ser igual ao duration de nível superior
Formato:
"multi_prompt": [
  { "index": 1, "prompt": "string", "duration": 5 },
  { "index": 2, "prompt": "string", "duration": 5 }
]
Obrigatório quando multi_shot=true e shot_type=customize.
element_list
array<object>
Lista de sujeitos de referência, até 3 sujeitos.
  • Criados na hora via name, description, element_input_urls
Exemplo:
[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]
Observações:
  • Para criação na hora, name, description e element_input_urls são obrigatórios
  • element_input_urls: 2-4 imagens por sujeito (a primeira como imagem frontal, as demais como referências)
  • Referencie os elementos em prompt com @name, por exemplo, "@element_dog chasing @element_cat on grass"

Restrições de parâmetros

  • mode=4k é suportado para kling-v3
  • image_urls suporta até 2 imagens (1 primeiro frame, 2 primeiro+último frames)
  • Entrada apenas do último frame é inválida (deve incluir o primeiro frame)
  • Quando multi_shot=true, o prompt de nível superior pode ser omitido
  • multi_prompt suporta até 6 planos, e index deve começar em 1 e ser contínuo

Matriz de suporte de recursos

TipoRecursostd 5sstd 10sstd 15spro 5spro 10s
Text-to-VideoGeração
Image-to-VideoGeração
Image-to-VideoPrimeiro frame
Image-to-VideoÚltimo frame

Texto para vídeo (Text-to-Video) vs Imagem para vídeo (Image-to-Video)

O sistema determina automaticamente o modo com base no fato de image_urls ser fornecido ou não: sem imagens significa text-to-video, com imagens significa image-to-video.
ParâmetroText-to-VideoImage-to-Video
prompt✅ Obrigatório✅ Obrigatório
image_urls❌ Não utilizado✅ Obrigatório (1-2 imagens)
negative_prompt✅ Opcional✅ Opcional
mode✅ Opcional✅ Opcional
duration✅ Opcional (3-15)✅ Opcional (3-15)
aspect_ratio✅ Opcional⚠️ Pode ser substituído pela proporção da imagem
watermark✅ Opcional✅ Opcional
audio✅ Opcional✅ Opcional

Resposta

code
integer
Código de status da resposta, 200 em caso de sucesso
data
array
Array de dados da resposta

Casos de uso

Caso 1: Texto para vídeo (Modo padrão)

{
  "model": "kling-v3",
  "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Caso 2: Texto para vídeo (Modo Pro + prompt negativo)

{
  "model": "kling-v3",
  "prompt": "Tokyo Shibuya crossing at night, neon lights reflected on wet ground, people walking with umbrellas",
  "negative_prompt": "blurry, low quality, distorted",
  "mode": "pro",
  "duration": 10,
  "aspect_ratio": "16:9"
}

Caso 3: Texto para vídeo (15 segundos)

{
  "model": "kling-v3",
  "prompt": "a time-lapse of a flower blooming in a garden",
  "duration": 15,
  "aspect_ratio": "16:9"
}

Caso 4: Imagem para vídeo (Primeiro frame)

{
  "model": "kling-v3",
  "prompt": "the cat slowly walks forward and looks around",
  "image_urls": ["https://example.com/cat.jpg"],
  "mode": "std",
  "duration": 5
}

Caso 5: Imagem para vídeo (Controle de primeiro + último frame)

{
  "model": "kling-v3",
  "prompt": "smooth cinematic transition",
  "image_urls": [
    "https://example.com/frame-start.jpg",
    "https://example.com/frame-end.jpg"
  ],
  "mode": "std",
  "duration": 5
}

Caso 6: Gerar vídeo com áudio

{
  "model": "kling-v3",
  "prompt": "A rock singer singing on this stage, concert scene, flashing lights",
  "audio": true,
  "mode": "std",
  "duration": 5
}

Caso 7: Storyboard multi-shot (customize, 15 segundos, vertical com áudio)

{
  "model": "kling-v3",
  "multi_prompt": [
    {
      "index": 1,
      "prompt": "Two friends talking under a streetlight at night. Warm glow, casual poses, no dialogue.",
      "duration": 2
    },
    {
      "index": 2,
      "prompt": "A runner sprinting through a forest, leaves flying. Low-angle shot, focus on movement.",
      "duration": 3
    },
    {
      "index": 3,
      "prompt": "A woman hugging a cat, smiling. Soft sunlight, cozy home setting, emphasize warmth.",
      "duration": 3
    },
    {
      "index": 4,
      "prompt": "A door creaking open, shadowy hallway. Dark tones, minimal details, eerie mood.",
      "duration": 3
    },
    {
      "index": 5,
      "prompt": "A man slipping on a banana peel, shocked expression. Exaggerated pose, bright colors.",
      "duration": 3
    },
    {
      "index": 6,
      "prompt": "A sunset over mountains, small figure walking away. Wide angle, peaceful atmosphere.",
      "duration": 1
    }
  ],
  "multi_shot": true,
  "shot_type": "customize",
  "duration": 15,
  "mode": "pro",
  "audio": true,
  "size": "9:16"
}
Consultar os resultados da tarefaA geração de vídeo é uma tarefa assíncrona que retorna um task_id ao ser submetida. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.