Wan2.6
wan2.6-i2v-flash Image-to-Video
- Modèle image-to-video rapide Wanxiang 2.6
- Génère une vidéo fluide à partir d’une image de première trame et de prompts textuels
- Prend en charge la bascule audio/silencieux, la narration multi-plans, l’audio personnalisé
- Prend en charge les résolutions 720p/1080p, durée 2–15 secondes
- Prend en charge les modèles d’effets vidéo
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Authentification
Tous les endpoints requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Paramètres de la requête
Nom du modèle de génération vidéo, fixé à
wan2.6-i2v-flashTableau d’URLs d’images de référence (1 seule image de première trame prise en charge)Prend en charge les URLs d’images accessibles publiquement ou l’encodage Base64 (
data:image/png;base64,...)Exemple : ["https://example.com/image.jpg"]Exigences relatives à l’image :
- Format : JPEG, JPG, PNG (sans transparence), BMP, WEBP
- Résolution : plage largeur/hauteur 240–8000 pixels
- Taille : ≤ 10 Mo
Description du contenu de la vidéoOptionnel mais recommandé pour image-to-video ; décrit les actions et effets attendusSpécifiez clairement le sujet, l’action, la caméra et le style pour de meilleurs résultatsExemple :
"The person in the image smiles and waves, camera slowly zooms in"Prompt négatif décrivant le contenu indésirableMaximum 500 caractèresExemple :
"blurry, low quality, distorted"Résolution de la vidéoOptions :
720p— HD1080p— FHD (par défaut)
1080pLa résolution influe directement sur le tarif, 1080p est plus cher que 720p. Le rapport d’aspect est déterminé par l’image d’entrée.
Durée de la vidéo (secondes)Plage prise en charge :
2 à 15 secondes (entier)Par défaut : 5Générer un audioDéfinir à
true : génère automatiquement de la musique de fond/des effets sonores adaptés (par défaut)Définir à false : produit une vidéo silencieusePar défaut : trueNon pris en charge lorsque le modèle est
wan2.6-i2v.URL d’audio personnalisé (wav/mp3, 3–30 secondes, ≤ 15 Mo)Priorité inférieure à
audio : ignoré lorsque audio=falseSi l’audio est plus long que la durée de la vidéo, il sera tronqué ; s’il est plus court, la partie restante sera silencieuseActiver la réécriture intelligente du promptAméliore significativement les résultats pour les prompts courts, mais augmente le temps de traitementPar défaut :
trueType de plan, nécessite
prompt_extend=trueOptions :single— plan unique (par défaut), produit une vidéo continue en un seul planmulti— multi-plans, produit une vidéo narrative avec plusieurs transitions de plans
shot_type a une priorité supérieure à prompt. Même si le prompt mentionne « multi-shot », définir single produira toujours un plan unique.Graine aléatoire (≥ 0), spécifier la même graine permet de reproduire des résultats similairesExemple :
12345Ajouter un filigrane « AI Generated » (en bas à droite)Par défaut :
falseContrôle audio
| Combinaison de paramètres | Résultat |
|---|---|
Pas de audio ni audio_url | Audio généré automatiquement (par défaut) |
audio_url: "https://..." | Utiliser l’audio spécifié |
audio: false | Vidéo silencieuse |
audio: false + audio_url: "..." | Vidéo silencieuse (audio a une priorité supérieure) |
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Cas d’utilisation
Cas 1 : Requête minimale
Cas 2 : Paramètres complets
Cas 3 : Audio personnalisé
Cas 4 : Vidéo silencieuse
Cas 5 : Modèle d’effet
Cas 6 : Image Base64
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.