Zum Hauptinhalt springen
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.7",
    "prompt": "A coastal road at sunset, slow-motion camera push-in, cinematic feel",
    "resolution": "1080P",
    "duration": 8,
    "size": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.7",
    "prompt": "A coastal road at sunset, slow-motion camera push-in, cinematic feel",
    "resolution": "1080P",
    "duration": 8,
    "size": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Autorisierung

Authorization
string
erforderlich
Alle API-Endpunkte erfordern eine Bearer-Token-AuthentifizierungAPI-Key abrufen:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenFügen Sie ihn zum Request-Header hinzu:
Authorization: Bearer YOUR_API_KEY

Modus-Routing

wan2.7 ist ein einheitlicher Einstieg für Text-to-Video und Image-to-Video. Das Backend ermittelt den Modus automatisch anhand der eingehenden Parameter. Beide Modi werden identisch abgerechnet:
BedingungRoutet zuModusbeschreibung
Eines von image_urls / image_with_roles / video_urls wird übergebenImage-to-VideoErstes Einzelbild / Erstes-letztes Einzelbild / Videofortsetzung
Keiner der oben genannten Parameter wird übergebenText-to-VideoVideo rein aus Textbeschreibung generieren

Anfrageparameter

model
string
erforderlich
Name des Videogenerierungsmodells, fest auf wan2.7
prompt
string
Beschreibung des Videoinhalts, bis zu 5000 Zeichen
  • Text-to-Video-Modus (wenn kein Bild/Video übergeben wird): erforderlich
  • Image-to-Video-Modus: optional, aber empfohlen zur Steuerung von Kamerabewegung und Aktionen
Beispiel: "A cat chasing butterflies on the grass, bright sunshine, slow motion"
image_urls
array<string>
Array von Bild-URLs. Wird dieses Feld angegeben, wird automatisch der Image-to-Video-Modus aktiviert
  • 1 Bild: Erstes Einzelbild zu Video
  • 2 Bilder: Erstes-letztes Einzelbild zu Video (1. = erstes Einzelbild, 2. = letztes Einzelbild)
Verwenden Sie entweder dieses Feld oder image_with_roles
image_urls steht in Konflikt mit audio_url; sie können nicht gleichzeitig angegeben werden
image_with_roles
array<object>
Array von Bildern mit Rollen, Alternative zu image_urls, zur exakten Angabe der Rolle jedes BildesFelder jedes Objekts:
  • url (string): Bild-URL (unterstützt http/https)
  • role (string): Bildrolle, first_frame / last_frame, Standard first_frame
Beispiel:
[
  { "url": "https://cdn.example.com/start.jpg", "role": "first_frame" },
  { "url": "https://cdn.example.com/end.jpg", "role": "last_frame" }
]
image_with_roles steht in Konflikt mit audio_url; sie können nicht gleichzeitig angegeben werden
video_urls
array<string>
Array von Video-URLs. Wird dieses Feld angegeben, wird der Modus Videofortsetzung aktiviert (es wird nur das 1. Video verwendet)
video_urls steht in Konflikt mit audio_url; sie können nicht gleichzeitig angegeben werden
Videobeschränkungen:
  • Format: mp4, mov
  • Dauer: 2–10s
  • Auflösung: Breite und Höhe im Bereich [240, 4096] Pixel
  • Seitenverhältnis: 1:8 – 8:1
  • Dateigröße: bis zu 100 MB
negative_prompt
string
Negativer Prompt zur Beschreibung unerwünschter Inhalte, bis zu 500 ZeichenBeispiel: "blurry, distorted, low quality"
resolution
string
Standard:"1080P"
VideoauflösungOptionen:
  • 720P – Standard
  • 1080P – Hohe Auflösung (Standard)
duration
integer
Standard:"5"
Videodauer (Sekunden)Unterstützter Bereich: 2 ~ 15 SekundenStandard: 5
size
string
Standard:"16:9"
Seitenverhältnis, nur im Text-to-Video-Modus wirksam (wenn kein Bild/Video übergeben wird)Unterstützte Formate:
  • 16:9 – Querformat Breitbild (Standard)
  • 9:16 – Hochformat
  • 1:1 – Quadrat
  • 4:3 – Querformat
  • 3:4 – Hochformat
Dieser Parameter wird im Image-to-Video-Modus ignoriert; das Seitenverhältnis wird automatisch durch das Eingabebild bestimmt
audio_url
string
URL einer benutzerdefinierten Audiospur
  • Text-to-Video-Modus: wird als Hintergrundmusik verwendet
  • Image-to-Video-Modus: wird als steuerndes Audio verwendet, synchronisiert mit den Aktionen im Bild
Format: wav / mp3, Dauer 2–30 Sekunden, Dateigröße ≤ 15 MB
audio_url steht in Konflikt mit video_urls, image_urls und image_with_roles; sie können nicht gleichzeitig angegeben werden
prompt_extend
boolean
Standard:"true"
Soll die intelligente Prompt-Umschreibung aktiviert werden?Verbessert die Ergebnisse für kurze Prompts deutlich, erhöht aber die VerarbeitungszeitStandard: true
watermark
boolean
Standard:"false"
Soll dem generierten Video ein „AI Generated”-Wasserzeichen hinzugefügt werden?
  • true: Wasserzeichen hinzufügen
  • false: kein Wasserzeichen (Standard)
seed
integer
Ganzzahliger Seed zur Steuerung der Zufälligkeit des generierten InhaltsWertebereich: Ganzzahl ≥ 0
  • Bei identischen Anfragen erzeugt das Modell unterschiedliche Ergebnisse, wenn unterschiedliche Seed-Werte empfangen werden (z. B. ohne Seed)
  • Bei identischen Anfragen erzeugt das Modell ähnliche Ergebnisse, wenn derselbe Seed-Wert empfangen wird, eine exakte Übereinstimmung ist jedoch nicht garantiert

Antwort

code
integer
Statuscode der Antwort, 200 bei Erfolg
data
array
Datenarray der Antwort

Anwendungsfälle

Fall 1: Text-zu-Video (einfachste Anfrage)

{
  "model": "wan2.7",
  "prompt": "A coastal road at sunset, slow-motion camera push-in, cinematic feel"
}

Fall 2: Text-zu-Video (vollständige Parameter)

{
  "model": "wan2.7",
  "prompt": "A cat chasing butterflies on the grass, bright sunshine, slow motion",
  "negative_prompt": "blurry, distorted, low quality",
  "resolution": "1080P",
  "duration": 8,
  "size": "16:9",
  "audio_url": "https://cdn.example.com/bgm.mp3",
  "prompt_extend": true,
  "watermark": false,
  "seed": 42
}

Fall 3: Erstes Einzelbild zu Video

{
  "model": "wan2.7",
  "prompt": "The character slowly stands up and walks toward the camera",
  "image_urls": ["https://cdn.example.com/person.jpg"],
  "resolution": "1080P",
  "duration": 8
}

Fall 4: Erstes-letztes Einzelbild zu Video

{
  "model": "wan2.7",
  "prompt": "The camera pans slowly from the beach to the mountaintop",
  "image_urls": [
    "https://cdn.example.com/beach.jpg",
    "https://cdn.example.com/mountain.jpg"
  ],
  "resolution": "1080P",
  "duration": 10
}
Bei 2 Bildern: Das 1. ist das erste Einzelbild, das 2. das letzte. Sie können auch image_with_roles für eine präzise Angabe verwenden.

Fall 5: Videofortsetzung

{
  "model": "wan2.7",
  "prompt": "Continue walking forward, camera follows",
  "video_urls": ["https://cdn.example.com/clip.mp4"],
  "resolution": "1080P",
  "duration": 8
}

Fall 6: Bild + steuerndes Audio

{
  "model": "wan2.7",
  "prompt": "The character moves to the rhythm of the music",
  "image_urls": ["https://cdn.example.com/dancer.jpg"],
  "audio_url": "https://cdn.example.com/beat.mp3",
  "resolution": "1080P",
  "duration": 8
}

Leitfaden zur Moduswahl

AnforderungEmpfohlene Vorgehensweise
Video nur aus Text generierenNur prompt übergeben (kein Bild/Video)
Ein Bild „lebendig” machen1 Bild an image_urls übergeben
Anfangs- und Endbild steuern2 Bilder an image_urls übergeben (erstes + letztes)
Ein vorhandenes Video verlängernVideo an video_urls übergeben
Bild zur Musik bewegen lassenBild + audio_url übergeben
Aufgabenergebnisse abfragenDie Videogenerierung ist eine asynchrone Aufgabe, die nach der Übermittlung eine task_id zurückgibt. Verwenden Sie den Endpunkt Aufgabenstatus abrufen, um den Generierungsfortschritt und die Ergebnisse abzufragen.