Wan2.7
Génération vidéo Wan2.7
- Modèle de génération vidéo Alibaba Cloud Wanxiang 2.7 (point d’entrée unifié)
- Routage automatique selon les paramètres : Text-to-Video / Image-to-Video (première trame, première-dernière trame, continuation de vidéo)
- Prend en charge les résolutions 720P/1080P, durée 2 à 15 secondes
- Prend en charge l’audio personnalisé (musique de fond en mode Text-to-Video, audio directeur en mode Image-to-Video)
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisation
Tous les endpoints API requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Routage des modes
wan2.7 est un point d’entrée unifié pour Text-to-Video et Image-to-Video. Le backend détermine automatiquement le mode en fonction des paramètres entrants. Les deux modes sont facturés de façon identique :
| Condition | Route vers | Description du mode |
|---|---|---|
L’un de image_urls / image_with_roles / video_urls est fourni | Image-to-Video | Première trame / Première-dernière trame / Continuation de vidéo |
| Aucun des paramètres ci-dessus n’est fourni | Text-to-Video | Génère une vidéo purement à partir d’une description textuelle |
Paramètres de la requête
Nom du modèle de génération vidéo, fixé à
wan2.7Description du contenu de la vidéo, jusqu’à 5000 caractères
- Mode Text-to-Video (lorsqu’aucune image/vidéo n’est fournie) : obligatoire
- Mode Image-to-Video : optionnel, mais recommandé pour guider les mouvements de caméra et les actions
"A cat chasing butterflies on the grass, bright sunshine, slow motion"Tableau d’URLs d’images. Le fournir active automatiquement le mode Image-to-Video
- 1 image : première trame vers vidéo
- 2 images : première-dernière trame vers vidéo (1re = première trame, 2e = dernière trame)
image_with_rolesTableau d’images avec rôles, alternative à
image_urls, permettant de spécifier précisément le rôle de chaque imageChamps de chaque objet :url(string) : URL de l’image (prend en charge http/https)role(string) : rôle de l’image,first_frame/last_frame, par défautfirst_frame
Tableau d’URLs vidéo. Le fournir active le mode continuation de vidéo (seule la 1re vidéo est utilisée)
Contraintes vidéo :
- Format : mp4, mov
- Durée : 2–10s
- Résolution : largeur et hauteur dans la plage [240, 4096] pixels
- Rapport d’aspect : 1:8 – 8:1
- Taille de fichier : jusqu’à 100 Mo
Prompt négatif décrivant le contenu indésirable, jusqu’à 500 caractèresExemple :
"blurry, distorted, low quality"Résolution de la vidéoOptions :
720P— standard1080P— haute définition (par défaut)
Durée de la vidéo (secondes)Plage prise en charge :
2 ~ 15 secondesPar défaut : 5Rapport d’aspect, effectif uniquement en mode Text-to-Video (lorsqu’aucune image/vidéo n’est fournie)Formats pris en charge :
16:9— écran large paysage (par défaut)9:16— portrait1:1— carré4:3— paysage3:4— portrait
URL d’audio personnalisé
- Mode Text-to-Video : utilisé comme musique de fond
- Mode Image-to-Video : utilisé comme audio directeur, synchronisé avec les actions à l’écran
Activer la réécriture intelligente du promptAméliore significativement les résultats pour les prompts courts, mais augmente le temps de traitementPar défaut :
trueAjouter un filigrane « AI Generated » à la vidéo générée
true: ajouter un filigranefalse: sans filigrane (par défaut)
Entier servant de graine pour contrôler le caractère aléatoire du contenu généréPlage de valeurs : entier
≥ 0- Pour des requêtes identiques, le modèle génère des résultats différents lorsqu’il reçoit des valeurs de graine différentes (par exemple, omettre la graine)
- Pour des requêtes identiques, le modèle génère des résultats similaires lorsqu’il reçoit la même valeur de graine, mais une cohérence exacte n’est pas garantie
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Cas d’utilisation
Cas 1 : Texte vers vidéo (requête la plus simple)
Cas 2 : Texte vers vidéo (paramètres complets)
Cas 3 : Première trame vers vidéo
Cas 4 : Première-dernière trame vers vidéo
Avec 2 images : la 1re est la première trame, la 2e la dernière. Vous pouvez aussi utiliser image_with_roles pour une spécification précise.
Cas 5 : Continuation de vidéo
Cas 6 : Image + audio directeur
Guide de sélection du mode
| Besoin | Approche recommandée |
|---|---|
| Générer une vidéo uniquement à partir de texte | Transmettre uniquement prompt (pas d’image/vidéo) |
| Donner « vie » à une image | Transmettre 1 image dans image_urls |
| Contrôler les trames de début et de fin | Transmettre 2 images dans image_urls (première + dernière) |
| Prolonger une vidéo existante | Transmettre la vidéo dans video_urls |
| Faire bouger une image au rythme de la musique | Transmettre image + audio_url |
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.