HappyHorse 1.0
HappyHorse 1.0 Videogenerierung
- Videogenerierungsmodell Alibaba Cloud Bailian HappyHorse 1.0 (einheitlicher Einstieg, Auto-Routing über ein einziges Modell)
- Automatisches Routing nach Parametern: T2V (nur prompt) / I2V (first_frame_image) / R2V (image_urls) / EDIT (video_url)
- Unterstützt Auflösungen 720P/1080P und jede ganzzahlige Dauer von 3 bis 15 Sekunden
- Abrechnung nur nach Auflösung × Dauer (Sekunden), unabhängig von der Funktion
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
Alle API-Endpunkte erfordern eine Bearer-Token-AuthentifizierungAPI-Key abrufen:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenFügen Sie ihn zum Request-Header hinzu:
Modus-Routing
happyhorse-1.0 ist der einheitliche Einstieg für Text-to-Video / Image-to-Video / Reference-Image-to-Video / Video Edit. Das Backend ermittelt den Modus automatisch anhand der eingehenden Parameter. Alle Modi werden nach derselben Regel abgerechnet (nur Auflösung × Sekunden):
| Übergebene Felder | Routet zu | Modusbeschreibung |
|---|---|---|
Nur prompt | Text-to-Video (T2V) | Video rein aus Text generieren |
prompt + first_frame_image | Image-to-Video (I2V) | Animation aus einem Erstbild |
prompt + image_urls (1–9 Bilder) | Reference-Image-to-Video (R2V) | Neue Szene aus Referenzbildern generieren |
prompt + video_url (optional image_urls 0–5 als Stilreferenzen / audio_setting) | Video Edit (EDIT) | Quellvideo umschreiben / umstilisieren |
video_url > first_frame_image > image_urls > nur prompt.
Regeln zur gegenseitigen Ausschließlichkeit: Die drei Medienfelder (first_frame_image / image_urls / video_url) sind paarweise gegenseitig ausschließend. Die einzige gültige Kombination ist video_url + image_urls (EDIT-Modus + Referenzbilder). Werden zwei sich ausschließende Felder übergeben, wird 400 mixed_media_not_allowed zurückgegeben.
Anfrageparameter
Name des Videogenerierungsmodells, fest auf
happyhorse-1.0Beschreibung des Videoinhalts, bis zu 2500 Zeichen; darf keine Sondertoken enthalten
- T2V- / R2V- / EDIT-Modi: erforderlich
- I2V-Modus: optional, aber empfohlen zur Steuerung von Kamerabewegung und Aktionen
"A little girl walking down the road, cinematic feel"Erstes Einzelbild, löst I2V (Image-to-Video) aus. Unterstützt URL oder base64 (
data:image/<mime>;base64,<payload>, das Gateway lädt es automatisch in OSS hoch)Schließt sich gegenseitig aus mit image_urls / video_urlAnforderungen an das Erstbild:
- Format: JPEG / JPG / PNG / BMP / WEBP
- Kurze Seite: ≥ 300 px
- Seitenverhältnis:
1:2.5bis2.5:1 - Dateigröße: ≤ 10 MB
Bilder-Array:
- R2V-Modus (nur
image_urlsangegeben): 1–9 Bilder, dienen als Subjekt-/Stilreferenzen zur Generierung einer neuen Szene - EDIT-Modus (zusammen mit
video_urlangegeben): 0–5 Bilder, dienen als Stilreferenz
first_frame_image; kann mit video_url kombiniert werdenAnforderungen an Referenzbilder:
- Format: JPEG / JPG / PNG / BMP / WEBP
- Kurze Seite: empfohlen ≥ 720p
- Seitenverhältnis: kurz / lang ≥ 0,4
- Dateigröße: ≤ 10 MB
- Anzahl: R2V muss 1–9 sein; EDIT bis zu 5
URL des Quellvideos, löst EDIT (Video Edit) aus. Base64 wird nicht unterstützt — geben Sie einen HTTP/HTTPS-Direktlink anSchließt sich gegenseitig aus mit
first_frame_image; kann mit image_urls (≤ 5) kombiniert werdenAnforderungen an das Quellvideo:
- Dauer: 3–60 Sekunden (> 15s wird vom Upstream automatisch von 0 bis 15s gekürzt)
- Auflösung: mindestens 480p, kurze Seite ≥ 360
- Seitenverhältnis:
1:8bis8:1 - Format: MP4 / MOV (H.264 empfohlen)
- Bildrate: > 8 fps
- Dateigröße: ≤ 100 MB
Audio-Einstellung, nur im EDIT-Modus wirksam (
video_url muss übergeben werden)Optionen:auto– Audio automatisch generieren (Standard)origin– Audiospur des Quellvideos beibehalten
Videoauflösung (beeinflusst die Abrechnung)Optionen:
720P– Standard1080P– Hohe Auflösung (Standard)
Videodauer in Sekunden (beeinflusst die Abrechnung)Unterstützter Bereich: jede Ganzzahl von
3 bis 15Standard: 5SeitenverhältnisUnterstützte Formate:
16:9– Querformat Breitbild (Standard)9:16– Hochformat1:1– Quadrat4:3– Querformat3:4– Hochformat
Soll dem generierten Video ein Wasserzeichen hinzugefügt werden?
true: Wasserzeichen hinzufügenfalse: kein Wasserzeichen (Standard)
Zufallsseed zur Steuerung der Zufälligkeit des generierten InhaltsWertebereich:
[0, 2147483647]. Wenn weggelassen, wird ein zufälliger Seed verwendet.- Bei identischen Anfragen erzeugt das Modell unterschiedliche Ergebnisse, wenn unterschiedliche Seed-Werte empfangen werden (z. B. ohne Seed)
- Bei identischen Anfragen erzeugt das Modell ähnliche Ergebnisse, wenn derselbe Seed-Wert empfangen wird, eine exakte Übereinstimmung ist jedoch nicht garantiert
Antwort
Statuscode der Antwort, 200 bei Erfolg
Datenarray der Antwort
Anwendungsfälle
Fall 1: Text-zu-Video T2V (einfachste Anfrage)
Fall 2: Text-zu-Video T2V (vollständige Parameter)
Fall 3: Bild-zu-Video I2V (first_frame_image)
Fall 4: Referenz-Bild-zu-Video R2V (mehrere Referenzen)
Fall 5: Video Edit EDIT (Originalton beibehalten + Stilreferenz)
Fall 6: 720P zur Kosteneinsparung
Leitfaden zur Moduswahl
| Anforderung | Empfohlene Vorgehensweise |
|---|---|
| Video nur aus Text generieren | Nur prompt übergeben (T2V) |
| Ein Bild „lebendig” machen (als Erstbild verwenden) | first_frame_image übergeben (I2V) |
| Eine neue Szene aus einer Sammlung von Referenzbildern generieren | image_urls übergeben (1–9, R2V) |
| Ein vorhandenes Video umschreiben / umstilisieren | video_url übergeben (EDIT), optional mit image_urls (0–5) als Stilreferenzen kombinieren |
| Kosten sparen | resolution: "720P" verwenden |
Tipps zur Nutzung
- Logik des einheitlichen Einstiegs: Die Eingabefelder bestimmen den Modus. Beachten Sie, dass die drei Medienfelder (
first_frame_image/image_urls/video_url) paarweise gegenseitig ausschließend sind sizewirkt nur in T2V/R2V: In den Modi I2V / EDIT wirdsizeignoriert — das Ausgabe-Seitenverhältnis wird durch das Eingabemedium bestimmt- Dauer: 5–10 Sekunden ist der optimale Bereich. Zu kurz führt zu ruckartiger Bewegung; zu lang erhöht die Upstream-Verarbeitungszeit erheblich
- Qualität des Erstbildes: klar, gut komponiert, Subjekt zentriert — verbessert die I2V-Ausgabe deutlich
- Prompt-Formulierung: Beschreiben Sie Bewegung / Kamera / Atmosphäre (z. B. „slow push-in, cinematic, warm tones”) für bessere Ergebnisse als rein statische Szenenbeschreibungen
- EDIT-Eingangsvideo: > 15 Sekunden wird vom Upstream automatisch von 0 bis 15s gekürzt. Wenn Sie andere Abschnitte benötigen, schneiden Sie das Video zuerst selbst zu
Aufgabenergebnisse abfragenDie Videogenerierung ist eine asynchrone Aufgabe, die nach der Übermittlung eine
task_id zurückgibt. Verwenden Sie den Endpunkt Aufgabenstatus abrufen, um den Generierungsfortschritt und die Ergebnisse abzufragen.