SkyReels V4
Génération vidéo SkyReels V4
- Deux niveaux de modèle : Fast (optimisé pour la vitesse) et Std (optimisé pour la qualité)
- Trois modes routés automatiquement selon les champs de la requête : Text-to-Video (T2V), Image-to-Video (I2V), Référence multimodale (Omni)
- Résolutions 480p / 720p / 1080p, durée 3 ~ 15 secondes
- Fonctionnalités avancées : première/dernière trame/trame clé, images de référence, vidéos de référence, collage en grille, extension de vidéo, synchronisation audio
- Mode de traitement asynchrone, renvoie un ID de tâche pour une requête ultérieure
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisation
Tous les endpoints API requièrent une authentification par Bearer TokenObtenez votre API Key :Visitez la page de gestion des API Keys pour obtenir votre API KeyAjoutez-la à l’en-tête de la requête :
Modes de génération
SkyReels V4 sélectionne automatiquement le bon mode en fonction des champs de la requête — aucun champmode n’est nécessaire :
| Mode | Déclencheur | Capacité |
|---|---|---|
| T2V (Text-to-Video) | Uniquement prompt + champs généraux | Génération purement textuelle |
| I2V (Image-to-Video) | L’un de first_frame_image / end_frame_image / mid_frame_images | Contrôle de la première/dernière/trames clés |
| Omni (Référence multimodale) | L’un de ref_images / ref_videos | Référence de sujet, collage en grille, référence de mouvement, extension de vidéo, synchronisation audio |
Mécanisme
@tag : lors de l’utilisation de mid_frame_images / ref_images / ref_videos, chaque élément doit déclarer un tag commençant par @ (par exemple, @image1, @Actor-1, @video1), et ce tag doit apparaître dans le prompt.Considérez le prompt comme un « script » et le tag comme un « pointeur de personnage » vers des ressources spécifiques (images / vidéos). Par exemple, un prompt tel que "@Actor-1 walks into the scene of @video1" indique au système d’injecter dans le processus de génération le sujet de l’image de référence associé à @Actor-1 et la référence de mouvement associée à @video1.Paramètres de la requête
Champs généraux
Deux niveaux de modèle sont disponibles :
| Modèle | Positionnement | Cas d’utilisation |
|---|---|---|
skyreels-v4-fast | Priorité à la vitesse | Aperçus rapides, génération par lots, contenu quotidien |
skyreels-v4-std | Priorité à la qualité (prix 25~30 % plus élevé que Fast) | Plans clés, exigences de détail élevées, livraison formelle |
Prompt textuel, 1280 tokens maximumDécrivez les scènes, sujets, actions et styles en détail pour de meilleurs résultats.Lors de l’utilisation de
ref_images / ref_videos / mid_frame_images, le prompt doit contenir le @tag correspondant (par exemple, @Actor-1, @video1, @image1).Exemple : "@Actor-1 walks through a neon-lit street at night."Durée de la vidéo de sortie (secondes)
- Plage :
[3, 15] - Par défaut :
5
Résolution de la vidéoOptions :
480p720p1080p(par défaut)
Rapport d’aspectOptions :
16:9(par défaut)4:31:19:163:4
Optimiser automatiquement le promptLorsqu’activé, le système optimise automatiquement votre prompt pour de meilleurs résultats.
Champs spécifiques à I2V
URL de l’image de première trame (jpg / jpeg / png / gif / bmp)Lorsqu’elle est fournie, cette image est utilisée comme trame initiale de la vidéo.
URL de l’image de dernière trame (jpg / jpeg / png / gif / bmp)Lorsqu’elle est fournie, cette image est utilisée comme trame finale de la vidéo. Peut être combinée avec
first_frame_image pour contrôler les trames de début et de fin.Liste des trames clés intermédiaires, jusqu’à 6. Chaque élément a la structure suivante :
Champs spécifiques à Omni
Liste des images de référence (tous les éléments doivent partager le même
type). Chaque élément a la structure suivante :Liste des vidéos de référence, jusqu’à 1. Chaque élément a la structure suivante :
Scénarios pris en charge
Les scénarios suivants sont pris en charge à la fois parskyreels-v4-fast et skyreels-v4-std :
| Scénario | Mode | Champs requis | Cas d’utilisation typique |
|---|---|---|---|
| Text-to-Video | T2V | prompt | Purement textuel, plans conceptuels rapides |
| Image-to-Video — Première trame | I2V | first_frame_image | Image fixe vers vidéo avec une trame de départ spécifiée |
| Image-to-Video — Dernière trame | I2V | end_frame_image | Spécifie la trame de fin |
| Image-to-Video — Trames clés | I2V | mid_frame_images (1 ~ 6) | Première + dernière + trames clés intermédiaires pour un rythme précis |
| Omni mono/multi-sujet | Omni | ref_images (type=image) | Cohérence des personnages, cadrage multi-sujets |
| Omni collage en grille | Omni | ref_images (type=grid, 1 image) | Vidéos de processus étape par étape (tutoriels, recettes, démos) |
| Omni référence de mouvement | Omni | ref_videos (type=reference) | Reproduire le mouvement, le sujet ou le style d’une vidéo de référence |
| Omni extension de vidéo | Omni | ref_videos (type=extend) | Continuer une vidéo existante avec un nouveau contenu |
| Omni synchronisation audio | Omni | ref_images (type=image) + audio_url | Narration de personnage numérique, synchronisation labiale pilotée par audio |
Contraintes des paramètres
La violation de l’une des contraintes suivantes entraîne le rejet de la requête avec une réponse 422, aucune facturation n’a lieu :| Paramètre | Contrainte |
|---|---|
prompt | Max 1280 tokens |
duration | [3, 15] secondes ; remplacé par la durée de la vidéo de référence (max 10s) lorsque ref_videos.type=reference |
resolution | Uniquement 480p / 720p / 1080p |
aspect_ratio | 16:9 / 4:3 / 1:1 / 9:16 / 3:4 ; ignoré en I2V ; ignoré lorsque Omni utilise ref_videos |
mid_frame_images | Jusqu’à 6 ; time_stamp doit être -1 ou dans (0, duration) |
ref_images global | Tous les éléments doivent partager le même type ; ne peut pas coexister avec des champs I2V |
ref_images.type=grid | Longueur de liste doit = 1 ; image_urls doit contenir 1 image |
ref_images.type=image | Longueur de liste 1 ~ 3 ; longueur de chaque image_urls 1 ~ 5 |
ref_images.audio_url | Uniquement pris en charge lorsque type=image, audio ≤ 15 secondes |
ref_videos | Jusqu’à 1 ; video_url MP4 / MOV, ≤ 15 secondes |
ref_videos.type=reference | Remplace le duration demandé (max 10s), peut être combiné avec ref_images.type=image, conserve par défaut l’audio de la vidéo d’entrée |
ref_videos.type=extend | Facturé selon le duration demandé ; ne peut pas être combiné avec ref_images |
Champ tag | Doit commencer par @ et apparaître dans le prompt |
| Exclusion I2V / Omni | Les champs I2V et Omni ne peuvent pas être utilisés ensemble |
Réponse
Code de statut de la réponse, 200 en cas de succès
Tableau de données de la réponse
Exemples de requêtes
Cas 1 : Texte vers vidéo (minimal)
Cas 2 : Texte vers vidéo (paramètres complets)
Cas 3 : Image vers vidéo — Première trame
Cas 4 : Image vers vidéo — Première/Dernière trame + trames clés intermédiaires
Cas 5 : Omni — Référence à un sujet unique
Cas 6 : Omni — Multi-sujets + référence de mouvement vidéo
Cas 7 : Omni — Collage en grille
Cas 8 : Omni — Extension de vidéo (extend)
Cas 9 : Omni — Synchronisation audio (piloté par voix)
Interroger les résultats de la tâcheLa génération vidéo est une tâche asynchrone qui renvoie un
task_id lors de la soumission. Utilisez l’endpoint Obtenir le statut de la tâche pour interroger la progression et les résultats de la génération.