Kling v3
Geração de vídeo Kling v3
- Modo de processamento assíncrono, retorna um ID de tarefa para consultas posteriores
- Suporta text-to-video e image-to-video (controle de primeiro frame / primeiro e último frames)
- Suporta modo padrão (720P), modo profissional (1080P) e modo 4K
- Suporta durações de vídeo de 3 a 15 segundos
- Suporta a geração de vídeos com áudio
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorização
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione-a ao cabeçalho da requisição:
Parâmetros da requisição
Nome do modelo de geração de vídeoModelos suportados:
kling-v3- Kling v3 (recomendado)
Prompt de textoDescreva cenas, ações e estilos em detalhes para obter melhores resultados. Recomenda-se utilizar prompts em inglês.Exemplo:
"a golden retriever running on the beach, sunset, cinematic"Prompt negativo para excluir conteúdo indesejadoExemplo:
"blurry, low quality, distorted"Modo de geraçãoOpções:
std- Modo padrão (720P)pro- Modo profissional (1080P)4k- Modo 4K
stdPadrão:
5
Duração do vídeo (segundos)Faixa: 3-15 (mínimo de 3 segundos, máximo de 15 segundos)⚠️ Nota: Deve ser um número simples (por exemplo, 6), sem aspas, caso contrário ocorrerá um erroProporção do vídeoOpções:
16:9- Paisagem9:16- Retrato1:1- Quadrado
16:9Array de URLs de imagens para geração image-to-video
- Forneça 1 imagem: usada como primeiro frame
- Forneça 2 imagens: atribuídas automaticamente como primeiro frame + último frame
["https://example.com/first.jpg"]Define se uma marca d’água deve ser adicionada
Define se o vídeo deve ser gerado com áudio
Define se o modo multi-shot (múltiplos planos) deve ser ativado.
truefalse
Método de divisão de planos:
customize / intelligence.Obrigatório quando multi_shot=true.Informações por plano, como prompt e duração.Defina a ordem, o prompt e a duração dos planos por meio de Obrigatório quando
index, prompt e duration.- Suporta de 1 a 6 planos
- O comprimento máximo do conteúdo por plano é 512
- A duração de cada plano deve ser >= 1 e não pode exceder a duração total da tarefa
- A soma das durações de todos os planos deve ser igual ao
durationde nível superior
multi_shot=true e shot_type=customize.Lista de sujeitos de referência, até 3 sujeitos.Observações:
- Criados na hora via
name,description,element_input_urls
- Para criação na hora,
name,descriptioneelement_input_urlssão obrigatórios element_input_urls: 2-4 imagens por sujeito (a primeira como imagem frontal, as demais como referências)- Referencie os elementos em
promptcom@name, por exemplo,"@element_dog chasing @element_cat on grass"
Restrições de parâmetros
mode=4ké suportado parakling-v3image_urlssuporta até 2 imagens (1 primeiro frame, 2 primeiro+último frames)- Entrada apenas do último frame é inválida (deve incluir o primeiro frame)
- Quando
multi_shot=true, opromptde nível superior pode ser omitido multi_promptsuporta até 6 planos, eindexdeve começar em 1 e ser contínuo
Matriz de suporte de recursos
| Tipo | Recurso | std 5s | std 10s | std 15s | pro 5s | pro 10s |
|---|---|---|---|---|---|---|
| Text-to-Video | Geração | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Geração | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Primeiro frame | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Último frame | ✅ | ✅ | ✅ | ✅ | ✅ |
Texto para vídeo (Text-to-Video) vs Imagem para vídeo (Image-to-Video)
O sistema determina automaticamente o modo com base no fato deimage_urls ser fornecido ou não: sem imagens significa text-to-video, com imagens significa image-to-video.
| Parâmetro | Text-to-Video | Image-to-Video |
|---|---|---|
prompt | ✅ Obrigatório | ✅ Obrigatório |
image_urls | ❌ Não utilizado | ✅ Obrigatório (1-2 imagens) |
negative_prompt | ✅ Opcional | ✅ Opcional |
mode | ✅ Opcional | ✅ Opcional |
duration | ✅ Opcional (3-15) | ✅ Opcional (3-15) |
aspect_ratio | ✅ Opcional | ⚠️ Pode ser substituído pela proporção da imagem |
watermark | ✅ Opcional | ✅ Opcional |
audio | ✅ Opcional | ✅ Opcional |
Resposta
Código de status da resposta, 200 em caso de sucesso
Array de dados da resposta
Casos de uso
Caso 1: Texto para vídeo (Modo padrão)
Caso 2: Texto para vídeo (Modo Pro + prompt negativo)
Caso 3: Texto para vídeo (15 segundos)
Caso 4: Imagem para vídeo (Primeiro frame)
Caso 5: Imagem para vídeo (Controle de primeiro + último frame)
Caso 6: Gerar vídeo com áudio
Caso 7: Storyboard multi-shot (customize, 15 segundos, vertical com áudio)
Consultar os resultados da tarefaA geração de vídeo é uma tarefa assíncrona que retorna um
task_id ao ser submetida. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.