Kling v3
Generación de video Kling v3
- Modo de procesamiento asíncrono, devuelve un ID de tarea para consultas posteriores
- Admite text-to-video e image-to-video (control de primer frame / primer y último frames)
- Admite el modo estándar (720P), modo profesional (1080P) y modo 4K
- Admite duraciones de video de 3 a 15 segundos
- Admite la generación de videos con audio
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorización
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Parámetros de la solicitud
Nombre del modelo de generación de videoModelos compatibles:
kling-v3- Kling v3 (recomendado)
Prompt de textoDescriba escenas, acciones y estilos en detalle para obtener mejores resultados. Se recomienda utilizar prompts en inglés.Ejemplo:
"a golden retriever running on the beach, sunset, cinematic"Prompt negativo para excluir contenido no deseadoEjemplo:
"blurry, low quality, distorted"Modo de generaciónOpciones:
std- Modo estándar (720P)pro- Modo profesional (1080P)4k- Modo 4K
stdPredeterminado:
5
Duración del video (segundos)Rango: 3-15 (mínimo 3 segundos, máximo 15 segundos)⚠️ Nota: Debe ser un número simple (por ejemplo, 6), sin comillas, de lo contrario se producirá un errorRelación de aspecto del videoOpciones:
16:9- Horizontal9:16- Vertical1:1- Cuadrado
16:9Array de URLs de imágenes para la generación image-to-video
- Pase 1 imagen: se usa como primer frame
- Pase 2 imágenes: se asignan automáticamente como primer frame + último frame
["https://example.com/first.jpg"]Define si se añade una marca de agua
Define si se genera el video con audio
Define si se activa el modo multi-shot (varios planos).
truefalse
Método de división de planos:
customize / intelligence.Obligatorio cuando multi_shot=true.Información por plano, como prompt y duración.Defina el orden, el prompt y la duración de los planos mediante Obligatorio cuando
index, prompt y duration.- Admite de 1 a 6 planos
- La longitud máxima del contenido por plano es 512
- La duración de cada plano debe ser >= 1 y no puede exceder la duración total de la tarea
- La suma de las duraciones de todos los planos debe ser igual al
durationde nivel superior
multi_shot=true y shot_type=customize.Lista de sujetos de referencia, hasta 3 sujetos.Notas:
- Creados al instante mediante
name,description,element_input_urls
- Para la creación al instante,
name,descriptionyelement_input_urlsson obligatorios element_input_urls: 2-4 imágenes por sujeto (la primera como imagen frontal, las demás como referencias)- Referencie los elementos en
promptcon@name, por ejemplo,"@element_dog chasing @element_cat on grass"
Restricciones de parámetros
mode=4kes compatible conkling-v3image_urlsadmite hasta 2 imágenes (1 primer frame, 2 primer+último frames)- La entrada solo del último frame no es válida (debe incluir el primer frame)
- Cuando
multi_shot=true, elpromptde nivel superior puede omitirse multi_promptadmite hasta 6 planos, eindexdebe comenzar en 1 y ser continuo
Matriz de compatibilidad de funciones
| Tipo | Función | std 5s | std 10s | std 15s | pro 5s | pro 10s |
|---|---|---|---|---|---|---|
| Text-to-Video | Generación | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Generación | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Primer frame | ✅ | ✅ | ✅ | ✅ | ✅ |
| Image-to-Video | Último frame | ✅ | ✅ | ✅ | ✅ | ✅ |
Texto a video (Text-to-Video) vs Imagen a video (Image-to-Video)
El sistema determina automáticamente el modo según si se proporciona o noimage_urls: sin imágenes significa text-to-video, con imágenes significa image-to-video.
| Parámetro | Text-to-Video | Image-to-Video |
|---|---|---|
prompt | ✅ Obligatorio | ✅ Obligatorio |
image_urls | ❌ No se utiliza | ✅ Obligatorio (1-2 imágenes) |
negative_prompt | ✅ Opcional | ✅ Opcional |
mode | ✅ Opcional | ✅ Opcional |
duration | ✅ Opcional (3-15) | ✅ Opcional (3-15) |
aspect_ratio | ✅ Opcional | ⚠️ Puede ser sobrescrito por la relación de la imagen |
watermark | ✅ Opcional | ✅ Opcional |
audio | ✅ Opcional | ✅ Opcional |
Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Casos de uso
Caso 1: Texto a video (Modo estándar)
Caso 2: Texto a video (Modo Pro + prompt negativo)
Caso 3: Texto a video (15 segundos)
Caso 4: Imagen a video (Primer frame)
Caso 5: Imagen a video (Control de primer + último frame)
Caso 6: Generar video con audio
Caso 7: Storyboard multi-shot (customize, 15 segundos, vertical con audio)
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.