Passer au contenu principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3",
    "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Autorisation

Authorization
string
requis
Tous les points de terminaison API nécessitent une authentification par Bearer TokenObtenir votre clé API :Rendez-vous sur la page de gestion des clés API pour obtenir votre clé APIAjoutez-la à l’en-tête de la requête :
Authorization: Bearer YOUR_API_KEY

Paramètres de la requête

model
string
requis
Nom du modèle de génération vidéoModèles pris en charge :
  • kling-v3 — Kling v3 (recommandé)
prompt
string
requis
Prompt textuelDécrivez en détail les scènes, actions et styles pour obtenir de meilleurs résultats. L’utilisation de prompts en anglais est recommandée.Exemple : "a golden retriever running on the beach, sunset, cinematic"
negative_prompt
string
Prompt négatif pour exclure les contenus indésirablesExemple : "blurry, low quality, distorted"
mode
string
défaut:"std"
Mode de générationOptions :
  • std — mode standard (720P)
  • pro — mode professionnel (1080P)
  • 4k — mode 4K
Par défaut : std
duration
integer
défaut:"5"
Par défaut : 5 Durée de la vidéo (en secondes)Plage : 3 à 15 (minimum 3 secondes, maximum 15 secondes)⚠️ Note : doit être un nombre simple (par ex. 6), sans guillemets, sinon une erreur se produira
aspect_ratio
string
défaut:"16:9"
Format d’image de la vidéoOptions :
  • 16:9 — paysage
  • 9:16 — portrait
  • 1:1 — carré
Par défaut : 16:9
image_urls
array<url>
Tableau d’URL d’images pour la génération image-to-video
  • Fournir 1 image : utilisée comme première image
  • Fournir 2 images : automatiquement assignées comme première image + dernière image
2 images maximum prises en chargeExemple : ["https://example.com/first.jpg"]
  • 2 images maximum prises en charge
  • Les URL d’images doivent être publiquement accessibles, sans protection anti-hotlink
  • En mode image-to-video, aspect_ratio peut être remplacé par le rapport réel de l’image
watermark
boolean
Ajouter ou non un filigrane
audio
boolean
défaut:"false"
Générer ou non la vidéo avec audio
multi_shot
boolean
défaut:"false"
Activer ou non le mode multi-plans.
  • true
  • false
shot_type
string
Méthode de découpage des plans : customize / intelligence.Obligatoire lorsque multi_shot=true.
multi_prompt
array<object>
Informations par plan, par exemple prompt et durée.Définissez l’ordre, le prompt et la durée des plans via index, prompt et duration.
  • De 1 à 6 plans pris en charge
  • Longueur maximale du contenu par plan : 512
  • Chaque durée de plan doit être >= 1 et ne peut pas dépasser la durée totale de la tâche
  • La somme des durées de tous les plans doit être égale à la duration de premier niveau
Format :
"multi_prompt": [
  { "index": 1, "prompt": "string", "duration": 5 },
  { "index": 2, "prompt": "string", "duration": 5 }
]
Obligatoire lorsque multi_shot=true et shot_type=customize.
element_list
array<object>
Liste des sujets de référence, jusqu’à 3 sujets.
  • Créés à la volée via name, description, element_input_urls
Exemple :
[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]
Notes :
  • Pour la création à la volée, name, description et element_input_urls sont obligatoires
  • element_input_urls : 2 à 4 images par sujet (la première comme image frontale, les autres comme références)
  • Référencez les éléments dans prompt avec @name, par ex. "@element_dog chasing @element_cat on grass"

Contraintes des paramètres

  • mode=4k est pris en charge pour kling-v3
  • image_urls prend en charge jusqu’à 2 images (1 première image, 2 premières + dernière images)
  • L’entrée de la dernière image seule est invalide (la première image doit être incluse)
  • Lorsque multi_shot=true, le prompt de premier niveau peut être omis
  • multi_prompt prend en charge jusqu’à 6 plans, et index doit commencer à 1 et être continu

Matrice de prise en charge des fonctionnalités

TypeFonctionnalitéstd 5sstd 10sstd 15spro 5spro 10s
Text-to-VideoGénération
Image-to-VideoGénération
Image-to-VideoPremière image
Image-to-VideoDernière image

Texte vers vidéo (Text-to-Video) vs Image vers vidéo (Image-to-Video)

Le système détermine automatiquement le mode selon que image_urls est fourni ou non : aucune image signifie text-to-video, avec des images signifie image-to-video.
ParamètreText-to-VideoImage-to-Video
prompt✅ Obligatoire✅ Obligatoire
image_urls❌ Non utilisé✅ Obligatoire (1 à 2 images)
negative_prompt✅ Optionnel✅ Optionnel
mode✅ Optionnel✅ Optionnel
duration✅ Optionnel (3 à 15)✅ Optionnel (3 à 15)
aspect_ratio✅ Optionnel⚠️ Peut être remplacé par le rapport de l’image
watermark✅ Optionnel✅ Optionnel
audio✅ Optionnel✅ Optionnel

Réponse

code
integer
Code de statut de la réponse, 200 en cas de succès
data
array
Tableau de données de la réponse

Cas d’usage

Cas 1 : Texte vers vidéo (mode standard)

{
  "model": "kling-v3",
  "prompt": "A golden cat running on a sunlit meadow, slow motion, cinematic quality",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

Cas 2 : Texte vers vidéo (mode Pro + prompt négatif)

{
  "model": "kling-v3",
  "prompt": "Tokyo Shibuya crossing at night, neon lights reflected on wet ground, people walking with umbrellas",
  "negative_prompt": "blurry, low quality, distorted",
  "mode": "pro",
  "duration": 10,
  "aspect_ratio": "16:9"
}

Cas 3 : Texte vers vidéo (15 secondes)

{
  "model": "kling-v3",
  "prompt": "a time-lapse of a flower blooming in a garden",
  "duration": 15,
  "aspect_ratio": "16:9"
}

Cas 4 : Image vers vidéo (première image)

{
  "model": "kling-v3",
  "prompt": "the cat slowly walks forward and looks around",
  "image_urls": ["https://example.com/cat.jpg"],
  "mode": "std",
  "duration": 5
}

Cas 5 : Image vers vidéo (contrôle première + dernière image)

{
  "model": "kling-v3",
  "prompt": "smooth cinematic transition",
  "image_urls": [
    "https://example.com/frame-start.jpg",
    "https://example.com/frame-end.jpg"
  ],
  "mode": "std",
  "duration": 5
}

Cas 6 : Générer une vidéo avec audio

{
  "model": "kling-v3",
  "prompt": "A rock singer singing on this stage, concert scene, flashing lights",
  "audio": true,
  "mode": "std",
  "duration": 5
}

Cas 7 : Storyboard multi-plans (customize, 15 secondes, portrait avec audio)

{
  "model": "kling-v3",
  "multi_prompt": [
    {
      "index": 1,
      "prompt": "Two friends talking under a streetlight at night. Warm glow, casual poses, no dialogue.",
      "duration": 2
    },
    {
      "index": 2,
      "prompt": "A runner sprinting through a forest, leaves flying. Low-angle shot, focus on movement.",
      "duration": 3
    },
    {
      "index": 3,
      "prompt": "A woman hugging a cat, smiling. Soft sunlight, cozy home setting, emphasize warmth.",
      "duration": 3
    },
    {
      "index": 4,
      "prompt": "A door creaking open, shadowy hallway. Dark tones, minimal details, eerie mood.",
      "duration": 3
    },
    {
      "index": 5,
      "prompt": "A man slipping on a banana peel, shocked expression. Exaggerated pose, bright colors.",
      "duration": 3
    },
    {
      "index": 6,
      "prompt": "A sunset over mountains, small figure walking away. Wide angle, peaceful atmosphere.",
      "duration": 1
    }
  ],
  "multi_shot": true,
  "shot_type": "customize",
  "duration": 15,
  "mode": "pro",
  "audio": true,
  "size": "9:16"
}
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un task_id lors de la soumission. Utilisez le point de terminaison Obtenir le statut de la tâche pour interroger la progression et les résultats.