HappyHorse 1.0
Génération vidéo HappyHorse 1.0
- Modèle de génération vidéo Alibaba Cloud Bailian HappyHorse 1.0 (point d’entrée unifié, routage automatique sur un seul modèle)
- Routage automatique selon les paramètres : T2V (prompt seul) / I2V (first_frame_image) / R2V (image_urls) / EDIT (video_url)
- Prend en charge les résolutions 720P/1080P et toute durée entière de 3 à 15 secondes
- Facturation uniquement selon résolution × durée (secondes), indépendamment de la capacité
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisation
Tous les endpoints API requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Routage des modes
happyhorse-1.0 est le point d’entrée unifié pour Text-to-Video / Image-to-Video / Reference-Image-to-Video / Video Edit. Le backend détermine automatiquement le mode en fonction des paramètres entrants. Tous les modes sont facturés selon la même règle (résolution × secondes uniquement) :
| Champs transmis | Route vers | Description du mode |
|---|---|---|
prompt seul | Text-to-Video (T2V) | Génère une vidéo purement à partir de texte |
prompt + first_frame_image | Image-to-Video (I2V) | Animer à partir d’une image de première trame |
prompt + image_urls (1–9 images) | Reference-Image-to-Video (R2V) | Générer une nouvelle scène à partir d’images de référence |
prompt + video_url (optionnellement image_urls 0–5 comme références de style / audio_setting) | Video Edit (EDIT) | Réécrire / restyliser une vidéo source |
video_url > first_frame_image > image_urls > prompt seul.
Règles d’exclusion mutuelle : les trois champs média (first_frame_image / image_urls / video_url) sont mutuellement exclusifs par paires. La seule combinaison valide est video_url + image_urls (mode EDIT + images de référence). Transmettre deux champs mutuellement exclusifs renvoie 400 mixed_media_not_allowed.
Paramètres de la requête
Nom du modèle de génération vidéo, fixé à
happyhorse-1.0Description du contenu de la vidéo, jusqu’à 2500 caractères ; ne peut pas contenir de tokens spéciaux
- Modes T2V / R2V / EDIT : obligatoire
- Mode I2V : optionnel, mais recommandé pour guider les mouvements de caméra et les actions
"A little girl walking down the road, cinematic feel"Image de première trame, déclenche I2V (Image-to-Video). Prend en charge URL ou base64 (
data:image/<mime>;base64,<payload>, la passerelle la téléverse automatiquement sur OSS)Mutuellement exclusif avec image_urls / video_urlExigences pour l’image de première trame :
- Format : JPEG / JPG / PNG / BMP / WEBP
- Côté court : ≥ 300 px
- Rapport d’aspect :
1:2.5à2.5:1 - Taille de fichier : ≤ 10 Mo
Tableau d’images :
- Mode R2V (seul
image_urlsfourni) : 1–9 images, utilisées comme références de sujet/style pour générer une nouvelle scène - Mode EDIT (fourni avec
video_url) : 0–5 images, utilisées comme référence de style
first_frame_image ; peut être combiné avec video_urlExigences pour les images de référence :
- Format : JPEG / JPG / PNG / BMP / WEBP
- Côté court : ≥ 720p recommandé
- Rapport d’aspect : court / long ≥ 0,4
- Taille de fichier : ≤ 10 Mo
- Quantité : R2V doit être 1–9 ; EDIT jusqu’à 5
URL de la vidéo source, déclenche EDIT (Video Edit). Base64 n’est pas pris en charge — fournissez un lien direct HTTP/HTTPSMutuellement exclusif avec
first_frame_image ; peut être combiné avec image_urls (≤ 5)Exigences pour la vidéo source :
- Durée : 3–60 secondes (> 15s sera automatiquement tronqué par l’amont de 0 à 15s)
- Résolution : minimum 480p, côté court ≥ 360
- Rapport d’aspect :
1:8à8:1 - Format : MP4 / MOV (H.264 recommandé)
- Fréquence d’images : > 8 fps
- Taille de fichier : ≤ 100 Mo
Réglage audio, uniquement effectif en mode EDIT (doit transmettre
video_url)Options :auto— générer automatiquement l’audio (par défaut)origin— conserver la piste audio de la vidéo source
Résolution de la vidéo (affecte la facturation)Options :
720P— standard1080P— haute définition (par défaut)
Durée de la vidéo en secondes (affecte la facturation)Plage prise en charge : tout entier de
3 à 15Par défaut : 5Rapport d’aspectFormats pris en charge :
16:9— écran large paysage (par défaut)9:16— portrait1:1— carré4:3— paysage3:4— portrait
Ajouter un filigrane à la vidéo générée
true: ajouter un filigranefalse: ne pas ajouter de filigrane (par défaut)
Graine aléatoire utilisée pour contrôler le caractère aléatoire du contenu généréPlage de valeurs :
[0, 2147483647]. Si omise, une graine aléatoire est utilisée.- Pour des requêtes identiques, le modèle génère des résultats différents lorsqu’il reçoit des valeurs de graine différentes (par exemple, omettre la graine)
- Pour des requêtes identiques, le modèle génère des résultats similaires lorsqu’il reçoit la même valeur de graine, mais une cohérence exacte n’est pas garantie
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Cas d’utilisation
Cas 1 : Texte vers vidéo T2V (requête la plus simple)
Cas 2 : Texte vers vidéo T2V (paramètres complets)
Cas 3 : Image vers vidéo I2V (first_frame_image)
Cas 4 : Référence-Image vers vidéo R2V (références multiples)
Cas 5 : Video Edit EDIT (conserver l’audio original + référence de style)
Cas 6 : 720P pour économiser
Guide de sélection du mode
| Besoin | Approche recommandée |
|---|---|
| Générer une vidéo uniquement à partir de texte | Transmettre uniquement prompt (T2V) |
| Donner « vie » à une image (l’utiliser comme première trame) | Transmettre first_frame_image (I2V) |
| Générer une nouvelle scène à partir d’un ensemble d’images de référence | Transmettre image_urls (1–9, R2V) |
| Réécrire / restyliser une vidéo existante | Transmettre video_url (EDIT), combiner éventuellement avec image_urls (0–5) comme références de style |
| Économiser | Utiliser resolution: "720P" |
Conseils d’utilisation
- Logique du point d’entrée unifié : les champs d’entrée déterminent le mode. Notez que les trois champs média (
first_frame_image/image_urls/video_url) sont mutuellement exclusifs par paires sizen’a d’effet qu’en T2V/R2V : dans les modes I2V / EDIT,sizeest ignoré — le rapport d’aspect de sortie est déterminé par le média d’entrée- Durée : 5–10 secondes est la plage optimale. Trop court entraîne des mouvements saccadés ; trop long augmente significativement le temps de traitement amont
- Qualité de l’image de première trame : claire, bien composée, sujet centré — améliore significativement le résultat I2V
- Rédaction du prompt : décrivez le mouvement / la caméra / l’atmosphère (par exemple, « slow push-in, cinematic, warm tones ») pour de meilleurs résultats que des descriptions purement statiques de la scène
- Vidéo d’entrée EDIT : > 15 secondes sera automatiquement tronquée par l’amont de 0 à 15s. Si vous avez besoin d’autres segments, découpez d’abord la vidéo vous-même
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.