SkyReels V4
SkyReels V4 Videogenerierung
- Zwei Modellstufen: Fast (geschwindigkeitsoptimiert) und Std (qualitätsoptimiert)
- Drei Modi mit automatischem Routing nach Anfragefeldern: Text-to-Video (T2V), Image-to-Video (I2V), Multimodale Referenz (Omni)
- Auflösungen 480p / 720p / 1080p, Dauer 3 ~ 15 Sekunden
- Erweiterte Funktionen: Erstes/letztes/Schlüsselbild, Referenzbilder, Referenzvideos, Raster-Collage, Videoverlängerung, Audiosynchronisation
- Asynchroner Verarbeitungsmodus, gibt eine Task-ID für spätere Abfragen zurück
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
Alle API-Endpunkte erfordern eine Bearer-Token-AuthentifizierungAPI-Key abrufen:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenFügen Sie ihn zum Request-Header hinzu:
Generierungsmodi
SkyReels V4 wählt den passenden Modus automatisch anhand der Anfragefelder — keinmode-Feld erforderlich:
| Modus | Auslöser | Funktion |
|---|---|---|
| T2V (Text-to-Video) | Nur prompt + allgemeine Felder | Rein textgesteuerte Generierung |
| I2V (Image-to-Video) | Eines von first_frame_image / end_frame_image / mid_frame_images | Steuerung erstes/letztes/Schlüsselbild |
| Omni (Multimodale Referenz) | Eines von ref_images / ref_videos | Subjektreferenz, Raster-Collage, Bewegungsreferenz, Videoverlängerung, Audiosynchronisation |
@tag-Mechanismus: Bei Verwendung von mid_frame_images / ref_images / ref_videos muss jedes Element ein tag deklarieren, das mit @ beginnt (z. B. @image1, @Actor-1, @video1), und dieser tag muss im prompt vorkommen.Stellen Sie sich prompt als „Drehbuch” und tag als „Zeiger auf eine Figur” für bestimmte Assets (Bilder / Videos) vor. Ein Prompt wie "@Actor-1 walks into the scene of @video1" weist das System beispielsweise an, das mit @Actor-1 verknüpfte Referenzbildsubjekt und die mit @video1 verknüpfte Bewegungsreferenz in den Generierungsprozess einzufügen.Anfrageparameter
Allgemeine Felder
Zwei Modellstufen stehen zur Verfügung:
| Modell | Positionierung | Anwendungsfälle |
|---|---|---|
skyreels-v4-fast | Geschwindigkeit zuerst | Schnelle Vorschauen, Batch-Generierung, Alltagsinhalte |
skyreels-v4-std | Qualität zuerst (ca. 25~30 % teurer als Fast) | Schlüsselaufnahmen, hohe Detailanforderungen, finale Lieferung |
Text-Prompt, maximal 1280 TokensBeschreiben Sie Szenen, Subjekte, Aktionen und Stile detailliert für bessere Generierungsergebnisse.Bei Verwendung von
ref_images / ref_videos / mid_frame_images muss der entsprechende @tag (z. B. @Actor-1, @video1, @image1) im prompt enthalten sein.Beispiel: "@Actor-1 walks through a neon-lit street at night."Dauer des Ausgabevideos (Sekunden)
- Bereich:
[3, 15] - Standard:
5
VideoauflösungOptionen:
480p720p1080p(Standard)
SeitenverhältnisOptionen:
16:9(Standard)4:31:19:163:4
Soll der Prompt automatisch optimiert werden?Bei Aktivierung optimiert das System Ihren Prompt automatisch für bessere Generierungsergebnisse.
I2V-spezifische Felder
URL des ersten Einzelbildes (jpg / jpeg / png / gif / bmp)Wenn angegeben, wird dieses Bild als Anfangsbild des Videos verwendet.
URL des letzten Einzelbildes (jpg / jpeg / png / gif / bmp)Wenn angegeben, wird dieses Bild als Endbild des Videos verwendet. Kann mit
first_frame_image für die Steuerung von Erst- und Endbild kombiniert werden.Liste mittlerer Schlüsselbilder, bis zu 6. Jedes Element hat die folgende Struktur:
Omni-spezifische Felder
Liste der Referenzbilder (alle Elemente müssen denselben
type haben). Jedes Element hat die folgende Struktur:Liste der Referenzvideos, bis zu 1. Jedes Element hat die folgende Struktur:
Unterstützte Szenarien
Die folgenden Szenarien werden sowohl vonskyreels-v4-fast als auch skyreels-v4-std unterstützt:
| Szenario | Modus | Erforderliche Felder | Typischer Anwendungsfall |
|---|---|---|---|
| Text-to-Video | T2V | prompt | Rein textgesteuert, schnelle Konzeptaufnahmen |
| Image-to-Video — Erstes Einzelbild | I2V | first_frame_image | Standbild zu Video mit definiertem Anfangsbild |
| Image-to-Video — Letztes Einzelbild | I2V | end_frame_image | Festlegung des Schlussbildes |
| Image-to-Video — Schlüsselbilder | I2V | mid_frame_images (1~6) | Erstes + letztes + mittlere Schlüsselbilder für präzises Timing |
| Omni Einzel-/Multi-Subjekt | Omni | ref_images (type=image) | Figurenkonsistenz, Multi-Subjekt-Framing |
| Omni Raster-Collage | Omni | ref_images (type=grid, 1 Bild) | Schritt-für-Schritt-Prozessvideos (Tutorials, Rezepte, Demos) |
| Omni Bewegungsreferenz | Omni | ref_videos (type=reference) | Bewegung, Subjekt oder Stil eines Referenzvideos reproduzieren |
| Omni Videoverlängerung | Omni | ref_videos (type=extend) | Vorhandenes Video mit neuem Inhalt fortsetzen |
| Omni Audiosynchronisation | Omni | ref_images (type=image) + audio_url | Digitale Sprecher-Erzählung, audiogesteuerte Lippensynchronisation |
Parameter-Einschränkungen
Bei Verletzung einer der folgenden Bedingungen wird die Anfrage mit einer 422-Antwort abgelehnt, es erfolgt keine Abrechnung:| Parameter | Einschränkung |
|---|---|
prompt | Maximal 1280 Tokens |
duration | [3, 15] Sekunden; bei ref_videos.type=reference durch Länge des Referenzvideos überschrieben (max. 10s) |
resolution | Nur 480p / 720p / 1080p |
aspect_ratio | 16:9 / 4:3 / 1:1 / 9:16 / 3:4; ignoriert in I2V; ignoriert, wenn Omni ref_videos enthält |
mid_frame_images | Bis zu 6; time_stamp muss -1 oder innerhalb (0, duration) sein |
ref_images insgesamt | Alle Elemente müssen denselben type haben; können nicht mit I2V-Feldern koexistieren |
ref_images.type=grid | Listenlänge muss = 1 sein; image_urls muss 1 Bild enthalten |
ref_images.type=image | Listenlänge 1image_urls 1 |
ref_images.audio_url | Nur unterstützt bei type=image, Audio ≤ 15 Sekunden |
ref_videos | Bis zu 1; video_url MP4 / MOV, ≤ 15 Sekunden |
ref_videos.type=reference | Überschreibt angeforderten duration (max. 10s), kann mit ref_images.type=image kombiniert werden, übernimmt standardmäßig das Audio des Eingabevideos |
ref_videos.type=extend | Abrechnung nach angefordertem duration; kann nicht mit ref_images kombiniert werden |
Feld tag | Muss mit @ beginnen und im prompt vorkommen |
| I2V / Omni-Ausschluss | I2V-Felder und Omni-Felder können nicht zusammen verwendet werden |
Antwort
Statuscode der Antwort, 200 bei Erfolg
Datenarray der Antwort
Anfragebeispiele
Fall 1: Text-zu-Video (minimal)
Fall 2: Text-zu-Video (vollständige Parameter)
Fall 3: Bild-zu-Video — Erstes Einzelbild
Fall 4: Bild-zu-Video — Erstes/Letztes Einzelbild + mittlere Schlüsselbilder
Fall 5: Omni — Einzelne Subjektreferenz
Fall 6: Omni — Mehrere Subjekte + Video-Bewegungsreferenz
Fall 7: Omni — Raster-Collage
Fall 8: Omni — Videoverlängerung (extend)
Fall 9: Omni — Audiosynchronisation (sprachgesteuert)
Aufgabenergebnisse abfragenDie Videogenerierung ist eine asynchrone Aufgabe, die nach der Übermittlung eine
task_id zurückgibt. Verwenden Sie den Endpunkt Aufgabenstatus abrufen, um den Generierungsfortschritt und die Ergebnisse abzufragen.