Wan2.7
Wan2.7-R2V Reference-to-Video
- Modèle Reference-to-Video Alibaba Cloud Wanxiang 2.7
- Génère une nouvelle vidéo avec un style, des personnages et des scènes cohérents à partir d’une ou plusieurs images/vidéos de référence
- Prend en charge la cohérence des personnages, le transfert de style et la combinaison de plusieurs ressources
- Prend en charge une voix de référence (reference_voice) pour contrôler la voix du personnage
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisation
Tous les endpoints API requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Paramètres de la requête
Nom du modèle de génération vidéo, fixé à
wan2.7-r2vDescription du contenu de la vidéo, jusqu’à 5000 caractèresPour plusieurs images/vidéos, utilisez « image 1 », « image 2 », « video 1 », etc., pour faire référence aux ressources de référence correspondantes (dans l’ordre d’entrée)Exemple :
"The character in image 1 enters the scene in image 2 and looks around"Tableau d’images avec rôles ; au moins ce champ ou
video_urls doit être fourniChamps de chaque objet :url(string) : URL de l’imagerole(string) : rôle de l’imagereference_image— image de référence (par défaut)first_frame— première trame spécifiée (lorsque fournie,sizeest ignoré et le rapport d’aspect suit l’image de première trame)
reference_voice(string, optionnel) : URL d’un échantillon audio vocal pour ce personnage de référence, utilisé pour contrôler la voix du personnage dans la vidéo générée
Tableau d’URLs de vidéos de référence, jusqu’à 5 vidéos (total images + vidéos ≤ 5)Au moins ce champ ou
image_with_roles doit être fourniContraintes vidéo :
- Format : mp4, mov
- Durée : 1–30s
- Résolution : largeur et hauteur dans la plage [240, 4096] pixels
- Rapport d’aspect : 1:8 – 8:1
- Taille de fichier : jusqu’à 100 Mo
Prompt négatif décrivant le contenu indésirable, jusqu’à 500 caractères
Résolution de la vidéoOptions :
720P— standard1080P— haute définition (par défaut)
Durée de la vidéo (secondes)Plage prise en charge :
2 ~ 15 secondesPar défaut : 5Rapport d’aspectFormats pris en charge :
16:9— écran large paysage (par défaut)9:16— portrait1:1— carré4:3— paysage3:4— portrait
Activer la réécriture intelligente du promptAméliore significativement les résultats pour les prompts courts, mais augmente le temps de traitementPar défaut :
trueAjouter un filigrane « AI Generated » à la vidéo générée
true: ajouter un filigranefalse: sans filigrane (par défaut)
Entier servant de graine pour contrôler le caractère aléatoire du contenu généréPlage de valeurs : entier
≥ 0- Pour des requêtes identiques, le modèle génère des résultats différents lorsqu’il reçoit des valeurs de graine différentes (par exemple, omettre la graine)
- Pour des requêtes identiques, le modèle génère des résultats similaires lorsqu’il reçoit la même valeur de graine, mais une cohérence exacte n’est pas garantie
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Cas d’utilisation
Cas 1 : Image de référence unique (le plus simple)
Cas 2 : Plusieurs images de référence
Cas 3 : Génération basée sur une vidéo de référence
Cas 4 : Première trame spécifiée + image de référence
Cas 5 : Image de référence + voix de référence (précis)
Règles de référence aux images
Avec plusieurs images de référence, utilisez des indices numériques dans leprompt pour y faire référence :
- 1re image → « image 1 » ou « the first image »
- 1re vidéo → « video 1 » ou « the first video »
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.