Zum Hauptinhalt springen
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "skyreels-v4-fast",
    "prompt": "A serene forest at sunset with golden light filtering through the trees.",
    "duration": 5,
    "resolution": "1080p",
    "aspect_ratio": "16:9",
    "prompt_optimizer": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KPEY5H3NQ2W8D7T6VB3F9GR4"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "skyreels-v4-fast",
    "prompt": "A serene forest at sunset with golden light filtering through the trees.",
    "duration": 5,
    "resolution": "1080p",
    "aspect_ratio": "16:9",
    "prompt_optimizer": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KPEY5H3NQ2W8D7T6VB3F9GR4"
    }
  ]
}

Autorisierung

Authorization
string
erforderlich
Alle API-Endpunkte erfordern eine Bearer-Token-AuthentifizierungAPI-Key abrufen:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenFügen Sie ihn zum Request-Header hinzu:
Authorization: Bearer YOUR_API_KEY

Generierungsmodi

SkyReels V4 wählt den passenden Modus automatisch anhand der Anfragefelder — kein mode-Feld erforderlich:
ModusAuslöserFunktion
T2V (Text-to-Video)Nur prompt + allgemeine FelderRein textgesteuerte Generierung
I2V (Image-to-Video)Eines von first_frame_image / end_frame_image / mid_frame_imagesSteuerung erstes/letztes/Schlüsselbild
Omni (Multimodale Referenz)Eines von ref_images / ref_videosSubjektreferenz, Raster-Collage, Bewegungsreferenz, Videoverlängerung, Audiosynchronisation
Strikte gegenseitige Ausschließlichkeit: I2V-Felder (first_frame_image / end_frame_image / mid_frame_images) und Omni-Felder (ref_images / ref_videos) können nicht zusammen verwendet werden, andernfalls wird 422 zurückgegeben.
@tag-Mechanismus: Bei Verwendung von mid_frame_images / ref_images / ref_videos muss jedes Element ein tag deklarieren, das mit @ beginnt (z. B. @image1, @Actor-1, @video1), und dieser tag muss im prompt vorkommen.Stellen Sie sich prompt als „Drehbuch” und tag als „Zeiger auf eine Figur” für bestimmte Assets (Bilder / Videos) vor. Ein Prompt wie "@Actor-1 walks into the scene of @video1" weist das System beispielsweise an, das mit @Actor-1 verknüpfte Referenzbildsubjekt und die mit @video1 verknüpfte Bewegungsreferenz in den Generierungsprozess einzufügen.

Anfrageparameter

Allgemeine Felder

model
string
erforderlich
Zwei Modellstufen stehen zur Verfügung:
ModellPositionierungAnwendungsfälle
skyreels-v4-fastGeschwindigkeit zuerstSchnelle Vorschauen, Batch-Generierung, Alltagsinhalte
skyreels-v4-stdQualität zuerst (ca. 25~30 % teurer als Fast)Schlüsselaufnahmen, hohe Detailanforderungen, finale Lieferung
Das Feld model muss explizit angegeben werden — kein Standardwert.
Der Preis hängt stark von der Auflösung und der Verwendung von ref_videos ab: 1080p ist deutlich teurer als 480p / 720p; Varianten mit ref_videos (Videoeingabe) kosten ca. das 1,5- bis 2-fache im Vergleich zu denen ohne. Die gleichzeitige Audio- und Videoausgabe wird noch nicht unterstützt.
prompt
string
erforderlich
Text-Prompt, maximal 1280 TokensBeschreiben Sie Szenen, Subjekte, Aktionen und Stile detailliert für bessere Generierungsergebnisse.Bei Verwendung von ref_images / ref_videos / mid_frame_images muss der entsprechende @tag (z. B. @Actor-1, @video1, @image1) im prompt enthalten sein.Beispiel: "@Actor-1 walks through a neon-lit street at night."
duration
integer
Standard:"5"
Dauer des Ausgabevideos (Sekunden)
  • Bereich: [3, 15]
  • Standard: 5
Wenn ref_videos.type=reference angegeben wird, wird duration durch die Länge des Referenzvideos überschrieben (maximal 10 Sekunden).
resolution
string
Standard:"1080p"
VideoauflösungOptionen:
  • 480p
  • 720p
  • 1080p (Standard)
aspect_ratio
string
Standard:"16:9"
SeitenverhältnisOptionen:
  • 16:9 (Standard)
  • 4:3
  • 1:1
  • 9:16
  • 3:4
aspect_ratio wird im I2V-Modus ignoriert (das Ausgabeverhältnis wird durch das Eingabebild bestimmt); ebenfalls ignoriert, wenn Omni mit ref_videos kombiniert wird.
prompt_optimizer
boolean
Standard:"true"
Soll der Prompt automatisch optimiert werden?Bei Aktivierung optimiert das System Ihren Prompt automatisch für bessere Generierungsergebnisse.

I2V-spezifische Felder

first_frame_image
string
URL des ersten Einzelbildes (jpg / jpeg / png / gif / bmp)Wenn angegeben, wird dieses Bild als Anfangsbild des Videos verwendet.
end_frame_image
string
URL des letzten Einzelbildes (jpg / jpeg / png / gif / bmp)Wenn angegeben, wird dieses Bild als Endbild des Videos verwendet. Kann mit first_frame_image für die Steuerung von Erst- und Endbild kombiniert werden.
mid_frame_images
object[]
Liste mittlerer Schlüsselbilder, bis zu 6. Jedes Element hat die folgende Struktur:

Omni-spezifische Felder

ref_images
object[]
Liste der Referenzbilder (alle Elemente müssen denselben type haben). Jedes Element hat die folgende Struktur:
ref_videos
object[]
Liste der Referenzvideos, bis zu 1. Jedes Element hat die folgende Struktur:

Unterstützte Szenarien

Die folgenden Szenarien werden sowohl von skyreels-v4-fast als auch skyreels-v4-std unterstützt:
SzenarioModusErforderliche FelderTypischer Anwendungsfall
Text-to-VideoT2VpromptRein textgesteuert, schnelle Konzeptaufnahmen
Image-to-Video — Erstes EinzelbildI2Vfirst_frame_imageStandbild zu Video mit definiertem Anfangsbild
Image-to-Video — Letztes EinzelbildI2Vend_frame_imageFestlegung des Schlussbildes
Image-to-Video — SchlüsselbilderI2Vmid_frame_images (1~6)Erstes + letztes + mittlere Schlüsselbilder für präzises Timing
Omni Einzel-/Multi-SubjektOmniref_images (type=image)Figurenkonsistenz, Multi-Subjekt-Framing
Omni Raster-CollageOmniref_images (type=grid, 1 Bild)Schritt-für-Schritt-Prozessvideos (Tutorials, Rezepte, Demos)
Omni BewegungsreferenzOmniref_videos (type=reference)Bewegung, Subjekt oder Stil eines Referenzvideos reproduzieren
Omni VideoverlängerungOmniref_videos (type=extend)Vorhandenes Video mit neuem Inhalt fortsetzen
Omni AudiosynchronisationOmniref_images (type=image) + audio_urlDigitale Sprecher-Erzählung, audiogesteuerte Lippensynchronisation

Parameter-Einschränkungen

Bei Verletzung einer der folgenden Bedingungen wird die Anfrage mit einer 422-Antwort abgelehnt, es erfolgt keine Abrechnung:
ParameterEinschränkung
promptMaximal 1280 Tokens
duration[3, 15] Sekunden; bei ref_videos.type=reference durch Länge des Referenzvideos überschrieben (max. 10s)
resolutionNur 480p / 720p / 1080p
aspect_ratio16:9 / 4:3 / 1:1 / 9:16 / 3:4; ignoriert in I2V; ignoriert, wenn Omni ref_videos enthält
mid_frame_imagesBis zu 6; time_stamp muss -1 oder innerhalb (0, duration) sein
ref_images insgesamtAlle Elemente müssen denselben type haben; können nicht mit I2V-Feldern koexistieren
ref_images.type=gridListenlänge muss = 1 sein; image_urls muss 1 Bild enthalten
ref_images.type=imageListenlänge 13; Länge jedes image_urls 15
ref_images.audio_urlNur unterstützt bei type=image, Audio ≤ 15 Sekunden
ref_videosBis zu 1; video_url MP4 / MOV, ≤ 15 Sekunden
ref_videos.type=referenceÜberschreibt angeforderten duration (max. 10s), kann mit ref_images.type=image kombiniert werden, übernimmt standardmäßig das Audio des Eingabevideos
ref_videos.type=extendAbrechnung nach angefordertem duration; kann nicht mit ref_images kombiniert werden
Feld tagMuss mit @ beginnen und im prompt vorkommen
I2V / Omni-AusschlussI2V-Felder und Omni-Felder können nicht zusammen verwendet werden

Antwort

code
integer
Statuscode der Antwort, 200 bei Erfolg
data
array
Datenarray der Antwort

Anfragebeispiele

Fall 1: Text-zu-Video (minimal)

{
  "model": "skyreels-v4-fast",
  "prompt": "A serene forest at sunset with golden light filtering through the trees."
}

Fall 2: Text-zu-Video (vollständige Parameter)

{
  "model": "skyreels-v4-std",
  "prompt": "A serene forest at sunset.",
  "duration": 5,
  "resolution": "720p",
  "aspect_ratio": "16:9",
  "prompt_optimizer": true
}

Fall 3: Bild-zu-Video — Erstes Einzelbild

{
  "model": "skyreels-v4-fast",
  "prompt": "Slowly pull the camera back to reveal the entire scene.",
  "first_frame_image": "https://example.com/start.png",
  "duration": 5
}

Fall 4: Bild-zu-Video — Erstes/Letztes Einzelbild + mittlere Schlüsselbilder

{
  "model": "skyreels-v4-std",
  "prompt": "The King summons a flying dragon. @image1 The dragon lowers. The King mounts and flies away.",
  "duration": 8,
  "resolution": "1080p",
  "first_frame_image": "https://example.com/k2v_0.png",
  "end_frame_image":   "https://example.com/k2v_2.png",
  "mid_frame_images": [
    { "tag": "@image1", "image_url": "https://example.com/k2v_1.png", "time_stamp": 3 }
  ]
}

Fall 5: Omni — Einzelne Subjektreferenz

{
  "model": "skyreels-v4-fast",
  "prompt": "@Actor-1 walks through a neon-lit street at night.",
  "ref_images": [
    { "tag": "@Actor-1", "type": "image", "image_urls": ["https://example.com/actor.jpg"] }
  ]
}

Fall 6: Omni — Mehrere Subjekte + Video-Bewegungsreferenz

{
  "model": "skyreels-v4-fast",
  "prompt": "The man from @image_1 imitates the move on the left in @video_1. The woman from @image_2 imitates the right side.",
  "duration": 5,
  "ref_images": [
    { "tag": "@image_1", "type": "image", "image_urls": ["https://example.com/a.png"] },
    { "tag": "@image_2", "type": "image", "image_urls": ["https://example.com/b.png"] }
  ],
  "ref_videos": [
    { "tag": "@video_1", "type": "reference", "video_url": "https://example.com/motion.mp4" }
  ]
}
In diesem Fall wird ref_videos.type=reference verwendet, daher wird der angeforderte duration durch die tatsächliche Länge des Referenzvideos überschrieben (maximal 10 Sekunden). Auch wenn hier "duration": 5 übergeben wird, richtet sich die endgültige Videolänge nach dem Referenzvideo.

Fall 7: Omni — Raster-Collage

{
  "model": "skyreels-v4-fast",
  "prompt": "Create a video showing how to make tomato and egg noodles based on @image1.",
  "ref_images": [
    { "tag": "@image1", "type": "grid", "image_urls": ["https://example.com/recipe_grid.png"] }
  ]
}

Fall 8: Omni — Videoverlängerung (extend)

{
  "model": "skyreels-v4-fast",
  "prompt": "Video extended @video1, someone walks over and sits on the sofa.",
  "duration": 8,
  "ref_videos": [
    { "tag": "@video1", "type": "extend", "video_url": "https://example.com/source.mp4" }
  ]
}

Fall 9: Omni — Audiosynchronisation (sprachgesteuert)

{
  "model": "skyreels-v4-std",
  "prompt": "@Actor-1 speaks with a calm tone.",
  "ref_images": [
    {
      "tag": "@Actor-1",
      "type": "image",
      "image_urls": ["https://example.com/actor.jpg"],
      "audio_url":  "https://example.com/voice.mp3"
    }
  ]
}
Aufgabenergebnisse abfragenDie Videogenerierung ist eine asynchrone Aufgabe, die nach der Übermittlung eine task_id zurückgibt. Verwenden Sie den Endpunkt Aufgabenstatus abrufen, um den Generierungsfortschritt und die Ergebnisse abzufragen.