Passer au contenu principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Authentification

Authorization
string
requis
Tous les points de terminaison de l’API nécessitent une authentification par Bearer TokenObtenez votre API Key :Rendez-vous sur la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la dans l’en-tête de la requête :
Authorization: Bearer YOUR_API_KEY

Paramètres de la requête

model
string
requis
Nom du modèle de génération vidéoModèles pris en charge :
  • doubao-seedance-2.0 — version standard, prend en charge texte-vers-vidéo, image-vers-vidéo, vidéo à partir de la première/dernière image, vidéo de référence, audio de référence et vidéo avec piste audio
  • doubao-seedance-2.0-fast — version rapide, mêmes fonctionnalités que la version standard avec une vitesse de génération supérieure
  • doubao-seedance-2.0-face — prend en charge le téléversement de personnes réelles, mêmes fonctionnalités que la version standard
  • doubao-seedance-2.0-fast-face — prend en charge le téléversement de personnes réelles, mêmes fonctionnalités que la version rapide
prompt
string
Description du contenu de la vidéoObligatoire pour le texte-vers-vidéo ; facultatif pour l’image-vers-vidéo ou la vidéo-référence-vers-vidéoIl est recommandé de préciser clairement le sujet, l’action, le mouvement de caméra et le style pour de meilleurs résultats
Le prompt est limité à 4000 caractères, mais 500 caractères sont recommandés.
Exemple : "A kitten yawning at the camera"
duration
integer
défaut:"5"
Durée de la vidéo (en secondes)Plage prise en charge : de 4 à 15 secondesPar défaut : 5
size
string
défaut:"16:9"
Rapport d’aspect de la vidéoOptions :
  • 16:9 — paysage
  • 9:16 — portrait
  • 1:1 — carré
  • 4:3 — rapport traditionnel
  • 3:4 — rapport traditionnel vertical
  • 21:9 — ultra-large
  • adaptive — adaptatif (s’adapte automatiquement à l’image/vidéo d’entrée)
Par défaut : 16:9
resolution
string
défaut:"480p"
Résolution de la vidéoOptions :
  • 480p — définition standard
  • 720p — haute définition
  • 1080p — Full HD (uniquement pris en charge par doubao-seedance-2.0-face et doubao-seedance-2.0)
Par défaut : 480p
seed
integer
Seed aléatoire pour contrôler l’aléa du contenu généré
  • Pour une même requête, des valeurs de seed différentes produiront des résultats différents
  • Pour une même requête, la même valeur de seed produira des résultats similaires, mais la cohérence exacte n’est pas garantie
generate_audio
boolean
défaut:"false"
Générer ou non l’audio (vidéo avec piste audio)Lorsque ce paramètre est true, la vidéo inclut un audio d’accompagnement généré par l’IAPar défaut : false
return_last_frame
boolean
défaut:"false"
Renvoyer ou non l’image de la dernière imageLorsque ce paramètre est true, le résultat de la tâche renvoie également l’URL de l’image de la dernière image de la vidéo, qui peut être utilisée pour la génération vidéo continuePar défaut : false
tools
array<object>
Liste d’outils pour des capacités étendues telles que la recherche webExemple : [{"type": "web_search"}]
image_urls
array<string>
Tableau d’URL d’images pour image-vers-vidéoPrend en charge deux formats :
  • URL d’image classique : https://example.com/cat.jpg
  • URL d’asset (asset approuvé) : asset://asset_a
Exemple : ["https://example.com/cat.jpg"] ou ["asset://asset_a"]
L’URL d’asset n’est prise en charge que par les modèles doubao-seedance-2.0 et doubao-seedance-2.0-fast. Les autres modèles ne la prennent pas en charge.
  • image_urls et image_with_roles ne peuvent pas être utilisés simultanément
  • Maximum de 9 images de référence
image_with_roles
array
Tableau d’images avec rôles, prend en charge la spécification de la première/dernière image
Lorsque le champ url utilise une URL d’asset, seuls les modèles doubao-seedance-2.0 et doubao-seedance-2.0-fast sont pris en charge. Les autres modèles ne la prennent pas en charge.
Exemple :
[
  {"url": "https://example.com/day.jpg", "role": "first_frame"},
  {"url": "https://example.com/night.jpg", "role": "last_frame"}
]
Format d’URL d’asset :
[
  {"url": "asset://asset_a", "role": "reference_image"}
]
  • image_urls et image_with_roles ne peuvent pas être utilisés simultanément
  • Lors de l’utilisation d’images de première/dernière image, video_urls et audio_urls ne sont pas disponibles
video_urls
array<string>
Tableau d’URL de vidéos de référencePrend en charge deux formats :
  • URL de vidéo classique : https://example.com/reference.mp4
  • URL d’asset (asset approuvé) : asset://asset_a
Exemple : ["https://example.com/reference.mp4"] ou ["asset://asset_a"]
L’URL d’asset n’est prise en charge que par les modèles doubao-seedance-2.0 et doubao-seedance-2.0-fast. Les autres modèles ne la prennent pas en charge.
  • Lors de l’utilisation d’images de première/dernière image (image_with_roles), les vidéos de référence ne sont pas disponibles
  • Maximum de 3 vidéos de référence, durée totale inférieure ou égale à 15 s
  • La résolution de la vidéo de référence doit être comprise entre 480P et 720P
  • Les vidéos de référence ne doivent pas contenir de personnes réelles
audio_urls
array<string>
Tableau d’URL d’audio de référencePrend en charge deux formats :
  • URL audio classique : https://example.com/speech.wav
  • URL d’asset (asset approuvé) : asset://asset_a
Exemple : ["https://example.com/speech.wav"] ou ["asset://asset_a"]
L’URL d’asset n’est prise en charge que par les modèles doubao-seedance-2.0 et doubao-seedance-2.0-fast. Les autres modèles ne la prennent pas en charge.
  • Lors de l’utilisation d’images de première/dernière image (image_with_roles), l’audio de référence n’est pas disponible
  • Maximum de 3 fichiers audio de référence, durée totale inférieure ou égale à 15 s
  • L’audio de référence doit être utilisé avec des images de référence ou des vidéos de référence

Réponse

code
integer
Code d’état de la réponse, 200 en cas de succès
data
array
Tableau de données de la réponse

Cas d’usage

Cas 1 : texte-vers-vidéo

{
  "model": "doubao-seedance-2.0",
  "prompt": "A kitten yawning at the camera",
  "resolution": "720p",
  "size": "16:9",
  "duration": 5,
  "seed": 42,
  "generate_audio": true
}

Cas 2 : image-vers-vidéo (première image)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten stands up and walks toward the camera",
  "image_urls": ["https://example.com/cat.jpg"],
  "duration": 5
}

Cas 3 : vidéo à partir de la première/dernière image

{
  "model": "doubao-seedance-2.0",
  "prompt": "Transition from day to night",
  "image_with_roles": [
    {"url": "https://example.com/day.jpg", "role": "first_frame"},
    {"url": "https://example.com/night.jpg", "role": "last_frame"}
  ],
  "duration": 5
}

Cas 4 : vidéo à partir d’une vidéo de référence

{
  "model": "doubao-seedance-2.0",
  "prompt": "Convert the video style to anime style",
  "video_urls": ["https://example.com/reference.mp4"]
}

Cas 5 : vidéo de référence + audio de référence

{
  "model": "doubao-seedance-2.0",
  "prompt": "A scene of a person speaking",
  "video_urls": ["https://example.com/reference.mp4"],
  "audio_urls": ["https://example.com/speech.wav"],
  "size": "16:9",
  "duration": 11
}

Cas 6 : vidéo avec piste audio

{
  "model": "doubao-seedance-2.0",
  "prompt": "A man stops a woman and says: \"Remember, you must never point your finger at the moon.\"",
  "generate_audio": true
}

Cas 7 : génération vidéo continue (renvoyer la dernière image)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten continues walking toward the camera",
  "image_urls": ["https://example.com/last_frame_from_prev.png"],
  "return_last_frame": true
}

Cas 8 : génération avec la version rapide

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "City nightscape timelapse photography",
  "size": "21:9",
  "duration": 8
}

Cas 9 : images de référence + vidéo de référence + audio de référence (vidéo multimodale)

Combinez des images de référence, une vidéo de référence et un audio de référence pour générer une vidéo publicitaire immersive en vue à la première personne. Idéal pour la promotion de produits, les publicités de marque et autres scénarios nécessitant la fusion de matériaux provenant de sources multiples.
{
  "model": "doubao-seedance-2.0",
  "prompt": "Use video 1's first-person perspective throughout, and use audio 1 as the background music throughout. First-person POV fruit tea advertisement for seedance brand 'Peace Apple' apple fruit tea limited edition. First frame is image 1: your hand picks a dewy Aksu red apple with a crisp apple collision sound. 2-4s: quick cut, your hand drops apple chunks into a shaker cup, adds ice and tea base, shakes vigorously, ice collision and shaking sounds sync with upbeat drum beats, background voice: 'Fresh-cut, fresh-shaken'. 4-6s: first-person close-up of the finished product, layered fruit tea poured into a clear cup, your hand gently squeezes cream cap spreading on top, sticks a pink label on the cup, camera zooms in on the layered texture of cream cap and fruit tea. 6-8s: first-person handheld cup raise, you lift the fruit tea from image 2 toward the camera (simulating handing it to the viewer), cup label clearly visible, background voice 'Take a sip of freshness', final frame freezes on image 2. Background voice consistently uses a female tone.",
  "image_urls": [
    "https://example.com/tea_pic1.jpg",
    "https://example.com/tea_pic2.jpg"
  ],
  "video_urls": ["https://example.com/tea_video1.mp4"],
  "audio_urls": ["https://example.com/tea_audio1.mp3"],
  "generate_audio": true,
  "size": "16:9",
  "duration": 11
}

Cas 10 : image-vers-vidéo avec URL d’asset

Les assets d’avatars virtuels approuvés peuvent être transmis directement comme images de référence sans avoir besoin de les téléverser ni de les soumettre à nouveau à validation.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character walks naturally on a city street under bright sunshine",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Cas 11 : spécifier un portrait de référence avec une URL d’asset (image_with_roles)

{
  "model": "doubao-seedance-2.0",
  "prompt": "Using the reference portrait, the character walks elegantly toward the camera",
  "image_with_roles": [
    {
      "url": "asset://asset_a",
      "role": "reference_image"
    }
  ],
  "resolution": "720p",
  "duration": 5
}

Cas 12 : version rapide + URL d’asset pour image-vers-vidéo

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "The character strolls in a park with a gentle breeze",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Cas 13 : image via URL d’asset + vidéo de référence (transfert de mouvement)

Combinez un asset de portrait approuvé avec une vidéo de référence pour faire exécuter au personnage des mouvements spécifiés.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character dances to the rhythm of the reference video with smooth and natural movements",
  "image_urls": ["https://example.com/dance_reference.jpg", "asset://asset_a"],
  "video_urls": ["https://example.com/dance_reference.mp4", "asset://asset_a"],
  "duration": 8,
  "resolution": "720p"
}
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un task_id lors de la soumission. Utilisez le point de terminaison Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.

Différences avec la version 1.5 Pro

Fonctionnalité1.5 Pro2.0 / 2.0 fast
Résolution480p/720p/1080p480p/720p
Plage de durée4-12 s5-15 s
Durée par défaut5 s5 s
Paramètre de rapport d’aspectaspect_ratiosize (nouvelle option adaptive)
Génération audioParamètre audioParamètre generate_audio
Vidéo de référenceNon prise en chargePrise en charge via video_urls
Audio de référenceNon pris en chargePris en charge via audio_urls
Image-vers-vidéoimage_urls / image_with_rolesimage_urls / image_with_roles
Vidéo avec piste audioNon prise en chargePrise en charge via generate_audio
Vidéo continueNon prise en chargePrise en charge via return_last_frame
Version rapideNon prise en chargePrise en charge via doubao-seedance-2.0-fast