Zum Hauptinhalt springen
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-3.0-turbo",
    "prompt": "Ein Corgi rennt am Strand entlang, filmische Atmosphäre, Dämmerungslicht",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-3.0-turbo",
    "prompt": "Ein Corgi rennt am Strand entlang, filmische Atmosphäre, Dämmerungslicht",
    "aspect_ratio": "16:9",
    "resolution": "1080p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Authentifizierung

Authorization
string
erforderlich
Alle Schnittstellen erfordern eine Authentifizierung mittels Bearer TokenAPI-Schlüssel erhalten:Besuchen Sie die Verwaltungsseite für API-Schlüssel, um Ihren API-Schlüssel zu erhaltenFügen Sie ihn bei der Verwendung dem Anfrage-Header hinzu:
Authorization: Bearer YOUR_API_KEY

Anfrageparameter

model
string
erforderlich
Name des VideogenerierungsmodellsUnterstützte Modelle:
  • kling-3.0-turbo - Kling 3.0 Turbo
prompt
string
erforderlich
Text-PromptDas Upstream-Limit liegt bei höchstens 3072 Zeichen, empfohlen werden höchstens 2500 Zeichen.Beispiel: "Ein Corgi rennt am Strand entlang, filmische Atmosphäre, Dämmerungslicht"
first_frame_image
string
Unterstützt Bild-URL oder Base64.
Upstream-Beschränkungen für das erste Bild:
  • Format: .jpg / .jpeg / .png
  • Größe: ≤ 50MB
  • Breite und Höhe: ≥ 300px
  • Seitenverhältnis: 1:2.5 ~ 2.5:1
aspect_ratio
string
Standard:"16:9"
Seitenverhältnis des VideosMögliche Werte:
  • 16:9 - Querformat
  • 9:16 - Hochformat
  • 1:1 - Quadratisch
Standardwert: 16:9
Gilt nur für Text-zu-Video. Bei Bild-zu-Video ist dieses Feld wirkungslos; das Videoverhältnis wird durch das erste Bild bestimmt.
resolution
string
Standard:"720p"
VideoauflösungMögliche Werte:
  • 720p
  • 1080p
Standardwert: 720p
duration
integer
Standard:"5"
Videolänge (Sekunden)Wertebereich: 3-15 (mindestens 3 Sekunden, höchstens 15 Sekunden)Standardwert: 5⚠️ Hinweis: Es muss eine reine Zahl eingegeben werden (z. B. 6), ohne Anführungszeichen, andernfalls tritt ein Fehler auf
watermark
boolean
Ob ein Wasserzeichen hinzugefügt werden sollWird nur dann an den Upstream weitergegeben, wenn es explizit übergeben wird; wird es nicht übergeben, wird kein Wasserzeichen hinzugefügt.

Text-zu-Video vs. Bild-zu-Video

Das System erkennt automatisch den Generierungsmodus anhand dessen, ob ein first_frame_image bereitgestellt wird: Mit erstem Bild wird Bild-zu-Video, ohne erstes Bild wird Text-zu-Video verwendet; der Benutzer muss dies nicht explizit angeben.
ParameterText-zu-VideoBild-zu-Video
prompt✅ Erforderlich✅ Optional (bleibt leer, Generierung ausschließlich anhand des ersten Bildes)
first_frame_image❌ Nicht übergeben✅ Erforderlich
aspect_ratio✅ Optional❌ Wirkungslos (Verhältnis wird durch das erste Bild bestimmt)
resolution✅ Optional✅ Optional
duration✅ Optional (3-15)✅ Optional (3-15)
watermark✅ Optional✅ Optional

Antwort

code
integer
Antwortstatuscode, bei Erfolg 200
data
array
Zurückgegebenes Datenarray

Anwendungsfälle

Szenario 1: Text-zu-Video (1080P)

{
  "model": "kling-3.0-turbo",
  "prompt": "Ein Corgi rennt am Strand entlang, filmische Atmosphäre, Dämmerungslicht",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 5
}

Szenario 2: Text-zu-Video (Hochformat 720P)

{
  "model": "kling-3.0-turbo",
  "prompt": "Kreuzung in Shibuya, Tokio, regnerische Nacht, Neonlichter spiegeln sich auf dem nassen Boden, Passanten gehen mit aufgespannten Regenschirmen vorbei",
  "aspect_ratio": "9:16",
  "resolution": "720p",
  "duration": 10
}

Szenario 3: Bild-zu-Video (erstes Bild)

{
  "model": "kling-3.0-turbo",
  "prompt": "Die Kamera fährt langsam heran, die Person lächelt",
  "first_frame_image": "https://cdn.example.com/first.jpg",
  "resolution": "720p",
  "duration": 5
}

Szenario 4: Reine Bild-zu-Video-Generierung (ohne Prompt)

{
  "model": "kling-3.0-turbo",
  "first_frame_image": "https://cdn.example.com/first.jpg",
  "resolution": "1080p",
  "duration": 5
}

Szenario 5: Multi-Shot-Storyboard (Text-zu-Video)

{
  "model": "kling-3.0-turbo",
  "prompt": "Einstellung 1,2,Corgi rennt am Strand; Einstellung 2,3,Kamera fährt heran, Person lächelt;",
  "aspect_ratio": "16:9",
  "resolution": "1080p",
  "duration": 5
}
Task-Ergebnis abfragenDie Videogenerierung ist ein asynchroner Task; nach der Übermittlung wird eine task_id zurückgegeben. Verwenden Sie die Schnittstelle Task-Status abrufen, um den Fortschritt und das Ergebnis der Generierung abzufragen.