HappyHorse
Génération vidéo HappyHorse 1.1
- Modèle de génération vidéo Alibaba Cloud Bailian HappyHorse 1.1 (point d’entrée unifié, routage automatique sur un seul modèle)
- Routage automatique selon les paramètres : T2V (prompt seul) / I2V (first_frame_image) / R2V (image_urls)
- Prend en charge les résolutions 720P/1080P et toute durée entière de 3 à 15 secondes
- Facturation uniquement selon résolution × durée (secondes), indépendamment de la capacité
POST
Autorisation
Tous les endpoints API requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Routage des modes
happyhorse-1.1 est le point d’entrée unifié pour Text-to-Video / Image-to-Video / Reference-Image-to-Video. Le backend détermine automatiquement le mode en fonction des paramètres entrants. Tous les modes sont facturés selon la même règle (résolution × secondes uniquement) :
| Champs transmis | Route vers | Description du mode |
|---|---|---|
prompt seul | Text-to-Video (T2V) | Génère une vidéo purement à partir de texte |
prompt + first_frame_image | Image-to-Video (I2V) | Animer à partir d’une image de première trame |
prompt + image_urls (1–9 images) | Reference-Image-to-Video (R2V) | Générer une nouvelle scène à partir d’images de référence |
first_frame_image > image_urls > prompt seul.
Règles d’exclusion mutuelle : les deux champs média (first_frame_image / image_urls) sont mutuellement exclusifs. Transmettre les deux champs mutuellement exclusifs en même temps renvoie 400 mixed_media_not_allowed.
Paramètres de la requête
Nom du modèle de génération vidéo, fixé à
happyhorse-1.1Description du contenu de la vidéo, jusqu’à 2500 caractères ; ne peut pas contenir de tokens spéciauxExemple :
"A little girl walking down the road, cinematic feel"Image de première trame, déclenche I2V (Image-to-Video). Prend en charge URL ou base64 (
data:image/<mime>;base64,<payload>, la passerelle la téléverse automatiquement sur OSS)Mutuellement exclusif avec image_urlsExigences pour l’image de première trame :
- Format : JPEG / JPG / PNG / BMP / WEBP
- Côté court : ≥ 300 px
- Rapport d’aspect :
1:2.5à2.5:1 - Taille de fichier : ≤ 10 Mo
Tableau d’images (mode R2V) : 1–9 images, utilisées comme références de sujet/style pour générer une nouvelle scènePrend en charge URL ou base64Mutuellement exclusif avec
first_frame_imageExigences pour les images de référence :
- Format : JPEG / JPG / PNG / BMP / WEBP
- Côté court : ≥ 720p recommandé
- Rapport d’aspect : court / long ≥ 0,4
- Taille de fichier : ≤ 10 Mo
- Quantité : 1–9 images
Résolution de la vidéo (affecte la facturation)Options :
720P— standard1080P— haute définition (par défaut)
Durée de la vidéo en secondes (affecte la facturation)Plage prise en charge : tout entier de
3 à 15Par défaut : 5Rapport d’aspectFormats pris en charge :
16:9— écran large paysage (par défaut)9:16— portrait1:1— carré4:3— paysage3:4— portrait
Ajouter un filigrane à la vidéo générée
true: ajouter un filigranefalse: ne pas ajouter de filigrane (par défaut)
Graine aléatoire utilisée pour contrôler le caractère aléatoire du contenu généréPlage de valeurs :
[0, 2147483647]. Si omise, une graine aléatoire est utilisée.- Pour des requêtes identiques, le modèle génère des résultats différents lorsqu’il reçoit des valeurs de graine différentes (par exemple, omettre la graine)
- Pour des requêtes identiques, le modèle génère des résultats similaires lorsqu’il reçoit la même valeur de graine, mais une cohérence exacte n’est pas garantie
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Cas d’utilisation
Cas 1 : Texte vers vidéo T2V (requête la plus simple)
Cas 2 : Texte vers vidéo T2V (paramètres complets)
Cas 3 : Image vers vidéo I2V (first_frame_image)
Cas 4 : Référence-Image vers vidéo R2V (références multiples)
Cas 5 : 720P pour économiser
Guide de sélection du mode
| Besoin | Approche recommandée |
|---|---|
| Générer une vidéo uniquement à partir de texte | Transmettre uniquement prompt (T2V) |
| Donner « vie » à une image (l’utiliser comme première trame) | Transmettre first_frame_image (I2V) |
| Générer une nouvelle scène à partir d’un ensemble d’images de référence | Transmettre image_urls (1–9, R2V) |
| Économiser | Utiliser resolution: "720P" |
Conseils d’utilisation
- Logique du point d’entrée unifié : les champs d’entrée déterminent le mode. Notez que les deux champs média (
first_frame_image/image_urls) sont mutuellement exclusifs sizen’a d’effet qu’en T2V/R2V : dans le mode I2V,sizeest ignoré — le rapport d’aspect de sortie est déterminé par le média d’entrée- Durée : 5–10 secondes est la plage optimale. Trop court entraîne des mouvements saccadés ; trop long augmente significativement le temps de traitement amont
- Qualité de l’image de première trame : claire, bien composée, sujet centré — améliore significativement le résultat I2V
- Rédaction du prompt : décrivez le mouvement / la caméra / l’atmosphère (par exemple, « slow push-in, cinematic, warm tones ») pour de meilleurs résultats que des descriptions purement statiques de la scène
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.