Wan2.7
Wan2.7-R2V Reference-to-Video
- Alibaba Cloud Wanxiang 2.7 Modell für Reference-to-Video
- Erzeugt ein neues Video mit konsistentem Stil, Figuren und Szenen auf Basis eines oder mehrerer Referenzbilder/-videos
- Unterstützt Figurenkonsistenz, Stiltransfer und Kombination mehrerer Assets
- Unterstützt eine Referenzstimme (reference_voice) zur Steuerung der Figurenstimme
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
Alle API-Endpunkte erfordern eine Bearer-Token-AuthentifizierungAPI-Key abrufen:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenFügen Sie ihn zum Request-Header hinzu:
Anfrageparameter
Name des Videogenerierungsmodells, fest auf
wan2.7-r2vBeschreibung des Videoinhalts, bis zu 5000 ZeichenBei mehreren Bildern/Videos verwenden Sie „image 1”, „image 2”, „video 1” usw., um auf die entsprechenden Referenz-Assets zu verweisen (in der Reihenfolge der Eingabe)Beispiel:
"The character in image 1 enters the scene in image 2 and looks around"Array von Bildern mit Rollen; mindestens dieses Feld oder
video_urls muss angegeben werdenFelder jedes Objekts:url(string): Bild-URLrole(string): Bildrollereference_image– Referenzbild (Standard)first_frame– festgelegtes Erstbild (wenn angegeben, wirdsizeignoriert und das Seitenverhältnis folgt dem Erstbild)
reference_voice(string, optional): URL eines Sprachsamples für diese Referenzfigur, dient zur Steuerung der Figurenstimme im generierten Video
Array von Referenzvideo-URLs, bis zu 5 Videos (insgesamt Bilder + Videos ≤ 5)Mindestens dieses Feld oder
image_with_roles muss angegeben werdenVideobeschränkungen:
- Format: mp4, mov
- Dauer: 1–30s
- Auflösung: Breite und Höhe im Bereich [240, 4096] Pixel
- Seitenverhältnis: 1:8 – 8:1
- Dateigröße: bis zu 100 MB
Negativer Prompt zur Beschreibung unerwünschter Inhalte, bis zu 500 Zeichen
VideoauflösungOptionen:
720P– Standard1080P– Hohe Auflösung (Standard)
Videodauer (Sekunden)Unterstützter Bereich:
2 ~ 15 SekundenStandard: 5SeitenverhältnisUnterstützte Formate:
16:9– Querformat Breitbild (Standard)9:16– Hochformat1:1– Quadrat4:3– Querformat3:4– Hochformat
Soll die intelligente Prompt-Umschreibung aktiviert werden?Verbessert die Ergebnisse für kurze Prompts deutlich, erhöht aber die VerarbeitungszeitStandard:
trueSoll dem generierten Video ein „AI Generated”-Wasserzeichen hinzugefügt werden?
true: Wasserzeichen hinzufügenfalse: kein Wasserzeichen (Standard)
Ganzzahliger Seed zur Steuerung der Zufälligkeit des generierten InhaltsWertebereich: Ganzzahl
≥ 0- Bei identischen Anfragen erzeugt das Modell unterschiedliche Ergebnisse, wenn unterschiedliche Seed-Werte empfangen werden (z. B. ohne Seed)
- Bei identischen Anfragen erzeugt das Modell ähnliche Ergebnisse, wenn derselbe Seed-Wert empfangen wird, eine exakte Übereinstimmung ist jedoch nicht garantiert
Antwort
Statuscode der Antwort, 200 bei Erfolg
Datenarray der Antwort
Anwendungsfälle
Fall 1: Einzelnes Referenzbild (am einfachsten)
Fall 2: Mehrere Referenzbilder
Fall 3: Generierung basierend auf einem Referenzvideo
Fall 4: Festgelegtes Erstbild + Referenzbild
Fall 5: Referenzbild + Referenzstimme (präzise)
Regeln für Bildreferenzen
Bei mehreren Referenzbildern verwenden Sie numerische Indizes imprompt, um auf sie zu verweisen:
-
- Bild → „image 1” oder „the first image”
-
- Video → „video 1” oder „the first video”
Aufgabenergebnisse abfragenDie Videogenerierung ist eine asynchrone Aufgabe, die nach der Übermittlung eine
task_id zurückgibt. Verwenden Sie den Endpunkt Aufgabenstatus abrufen, um den Generierungsfortschritt und die Ergebnisse abzufragen.