Kling v3 Omni
Generación de video Kling v3 Omni
- Modo de procesamiento asíncrono, devuelve un ID de tarea para consultas posteriores
- Interfaz unificada text-to-video/image-to-video con sintaxis de referencia de imágenes
- Admite el modo estándar (720P), modo profesional (1080P) y modo 4K
- Referencia imágenes en los prompts usando la sintaxis image_N
- Admite la generación de videos con audio (mutuamente excluyente con video_list)
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorización
Todos los endpoints de la API requieren autenticación mediante Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Parámetros de la solicitud
Nombre del modelo de generación de videoModelos compatibles:
kling-v3-omni- Kling v3 Omni (interfaz unificada)
Prompt de texto positivoAdmite referenciar imágenes de
image_urls usando la sintaxis <<<image_N>>>, donde N comienza en 1.Ejemplo: "Make the person in <<<image_1>>> wave at the camera"Si se proporcionan imágenes pero el prompt no contiene ninguna referencia
<<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.Prompt negativo utilizado para excluir contenido no deseado. La longitud máxima es de 2500 caracteres.
Modo de generaciónOpciones:
std- Modo estándar (720P)pro- Modo profesional (1080P)4k- Modo 4K ultra HD
stdPredeterminado:
5
Duración del video (segundos)Rango: 3-15 (mínimo 3 segundos, máximo 15 segundos)⚠️ Nota: Debe ser un número simple (por ejemplo, 6), sin comillas, de lo contrario se producirá un errorRelación de aspecto del videoOpciones:
16:9- Horizontal9:16- Vertical1:1- Cuadrado
16:9Array de URLs de imágenes para la referencia de imágenesReferencie las imágenes correspondientes en el prompt usando la sintaxis
<<<image_N>>> (N comienza en 1)Ejemplo: ["https://example.com/photo.jpg"]Array de imágenes basadas en roles, recomendado para image-to-video.Formato de cada elemento:
{ "url": "...", "role": "..." }first_frame: primer framelast_frame: último framereference: imagen de referencia
Lista de videos de referencia (basada en URL), hasta 1 video.Use
refer_type para distinguir los tipos:base: video a editar (predeterminado)feature: video de referencia de características
keep_original_sound para controlar el audio original:no: no conservar (predeterminado)yes: conservar el sonido original
Define si se activa el modo multi-shot.
Método de división de planos:
customize / intelligence.Obligatorio cuando multi_shot=true.Lista multi-shot, cada elemento es
{ index, prompt, duration }.- Mínimo 1 plano, máximo 6 planos
- El
durationde cada plano debe ser un entero y >= 1 - La suma de las duraciones de todos los planos debe ser igual al
durationde nivel superior indexdebe comenzar en 1 y aumentar de forma continua- Obligatorio cuando
multi_shot=trueyshot_type=customize
Lista de sujetos de referencia, hasta 3 sujetos. Admite:Notas:
- Crear sujetos al instante con
name,description,element_input_urls
- Para la creación al instante,
name,description,element_input_urlsson obligatorios element_input_urls: de 2 a 4 imágenes por sujeto (la primera como imagen frontal, las demás como referencias)- Use
@nameenprompt, por ejemplo,"@element_dog and @element_cat are playing on the grass"
Define si se añade una marca de agua
Define si se genera el video con audio
Restricciones y límites de parámetros
image_urlseimage_with_rolesson mutuamente excluyentesmode=4kestá disponible parakling-v3-omni- La entrada solo del último frame (
last_framesin primer frame) no es válida - Los frames inicial/final y la edición de video son mutuamente excluyentes: cuando
video_list.refer_type=base(u omitido), no se permiten los frames inicial/final - Cuando
video_listestá presente, se ignoraaudio video_listadmite como máximo 1 videomulti_promptadmite hasta 6 planos, conindexcomenzando en 1 y aumentando de forma continua
Sintaxis de referencia de imágenes
El modelo Omni utiliza la sintaxis<<<image_N>>> para referenciar imágenes en los prompts, ofreciendo una experiencia unificada text-to-video/image-to-video:
| Sintaxis | Descripción |
|---|---|
<<<image_1>>> | Referencia la 1ª imagen del array image_urls |
<<<image_2>>> | Referencia la 2ª imagen del array image_urls |
Referencia automática: Si se proporciona
image_urls pero el prompt no contiene ninguna referencia <<<image_N>>>, el sistema añadirá automáticamente <<<image_1>>> al principio del prompt.Respuesta
Código de estado de la respuesta, 200 en caso de éxito
Array de datos de la respuesta
Casos de uso
Caso 1: Texto a video (Modo estándar)
Caso 2: Referencia de imagen (Imagen única)
Caso 3: Múltiples referencias de imagen
Caso 4: Imagen proporcionada sin referencia explícita (añadida automáticamente)
El sistema añadirá automáticamente<<<image_1>>>al principio del prompt, equivalente a"<<<image_1>>>The person slowly turns and smiles".
Caso 5: Generar video con audio
Nota:audioes mutuamente excluyente convideo_list. Cuandovideo_listtiene un valor, el parámetroaudiono es necesario.
Consultar los resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un
task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.