SkyReels V4
SkyReels V4 動画生成
- Fast(速度優先)と Std(品質優先)の 2 段階モデルを提供
- テキストから動画(T2V)、画像から動画(I2V)、マルチモーダル参照(Omni)の 3 モードをリクエストフィールドから自動ルーティング
- 480p / 720p / 1080p 解像度、3 ~ 15 秒の長さをサポート
- 先頭フレーム / 末尾フレーム / キーフレーム、参照画像、参照動画、グリッドコラージュ、動画拡張、音声同期などの高度な機能をサポート
- 非同期処理モード、タスク ID を返して後続の照会に使用
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
認証
生成モード
SkyReels V4 はリクエストフィールドに応じて自動的に対応モードへルーティングします。mode フィールドを指定する必要はありません:
| モード | トリガー条件 | 機能 |
|---|---|---|
| T2V(テキストから動画) | prompt と共通フィールドのみ | 純粋なテキスト駆動生成 |
| I2V(画像から動画) | first_frame_image / end_frame_image / mid_frame_images のいずれか | 先頭・末尾・キーフレーム制御 |
| Omni(マルチモーダル参照) | ref_images / ref_videos のいずれか | 被写体参照、グリッドコラージュ、モーション参照、動画拡張、音声同期 |
@tag メカニズム:mid_frame_images / ref_images / ref_videos を使用する際、各要素は @ で始まる tag(例:@image1、@Actor-1、@video1)を宣言し、その tag は 必ず prompt 内に出現する必要があります。prompt を「脚本」、tag を具体的な素材(画像 / 動画)を指す「キャラクターポインタ」と考えてください。例えば prompt に "@Actor-1 が @video1 のシーンに入る" と書くと、システムは @Actor-1 に対応する参照画像の被写体と @video1 に対応する動作参照を生成過程に注入します。リクエストパラメータ
共通フィールド
以下の 2 つの段階をサポート:
| モデル | 位置付け | 適用シーン |
|---|---|---|
skyreels-v4-fast | 速度優先 | クイックプレビュー、バッチ生成、日常コンテンツ |
skyreels-v4-std | 品質優先(Fast より 25~30% 高価) | キーシーン、高詳細要件、正式納品 |
テキストプロンプト、最大 1280 tokensシーン、被写体、動作、スタイルなどを詳しく記述すると、より良い生成結果が得られます。
ref_images / ref_videos / mid_frame_images を使用する場合、prompt には対応する @tag(例:@Actor-1、@video1、@image1)を必ず含める必要があります。例:"@Actor-1 walks through a neon-lit street at night."出力動画の長さ(秒)
- 範囲:
[3, 15] - デフォルト:
5
動画解像度選択肢:
480p720p1080p(デフォルト)
アスペクト比選択肢:
16:9(デフォルト)4:31:19:163:4
プロンプトを自動最適化するかどうか有効にすると、システムが自動的にプロンプトを最適化し、より良い生成結果を得られるようにします。
I2V 専用フィールド
動画の先頭フレーム画像 URL(jpg / jpeg / png / gif / bmp)指定すると、この画像が動画の 先頭画面 として使用されます。
動画の末尾フレーム画像 URL(jpg / jpeg / png / gif / bmp)指定すると、この画像が動画の 末尾画面 として使用されます。
first_frame_image と組み合わせて先頭・末尾フレーム制御が可能です。中間キーフレームリスト、最大 6 個。各要素の構造は以下のとおり:
Omni 専用フィールド
参照画像リスト(すべての要素の
type は一致する必要があります)。各要素の構造は以下のとおり:参照動画リスト、最大 1 個。各要素の構造は以下のとおり:
サポートされる生成シーン
以下のシーンはskyreels-v4-fast と skyreels-v4-std の 両方 でサポートされます:
| シーン | モード | 必須パラメータ | 代表的な用途 |
|---|---|---|---|
| テキストから動画 | T2V | prompt | テキスト駆動でコンセプトショットを素早く生成 |
| 画像から動画 - 先頭フレーム | I2V | first_frame_image | 静止画を動画化、開始画面を指定 |
| 画像から動画 - 末尾フレーム | I2V | end_frame_image | 動画の終了画面を指定 |
| 画像から動画 - キーフレーム | I2V | mid_frame_images(1~6) | 先頭+末尾+中間キーフレームで分鏡ペースを精密制御 |
| Omni 単一/複数被写体参照 | Omni | ref_images(type=image) | キャラクター一貫性、複数被写体の同時登場 |
| Omni グリッドコラージュ | Omni | ref_images(type=grid、1 枚) | ステップ解説動画(チュートリアル、レシピ、操作デモ) |
| Omni モーション参照 | Omni | ref_videos(type=reference) | 参照動画の動作、被写体、スタイルを再現 |
| Omni 動画拡張 | Omni | ref_videos(type=extend) | 既存動画から続きを生成 |
| Omni 音声同期 | Omni | ref_images(type=image)+ audio_url | デジタルヒューマンナレーション、音声駆動リップシンク |
パラメータ制約
以下の制約に違反した場合、リクエストは拒否され 422 を返します。課金は発生しません:| パラメータ | 制約 |
|---|---|
prompt | 最大 1280 tokens |
duration | [3, 15] 秒;ref_videos.type=reference 時は参照動画の長さで上書き(上限 10 秒) |
resolution | 480p / 720p / 1080p のみ |
aspect_ratio | 16:9 / 4:3 / 1:1 / 9:16 / 3:4;I2V では無視;Omni が ref_videos を伴う場合も無視 |
mid_frame_images | 最大 6 個;time_stamp は -1 または (0, duration) 範囲内 |
ref_images 全体 | リスト内の type は一致する必要あり;I2V フィールドと共存不可 |
ref_images.type=grid | リスト長は必ず = 1;image_urls は 1 枚必須 |
ref_images.type=image | リスト長 1~3;各 image_urls 長 1~5 |
ref_images.audio_url | type=image のみサポート、音声 ≤ 15 秒 |
ref_videos | 最大 1 個;video_url MP4 / MOV、≤ 15 秒 |
ref_videos.type=reference | リクエストの duration を上書き(最大 10 秒)、ref_images.type=image と組み合わせ可能、デフォルトで入力動画の音声を引き継ぐ |
ref_videos.type=extend | リクエストの duration で課金;ref_images と組み合わせ不可 |
tag フィールド | @ で始まり、prompt 内に出現する必要あり |
| I2V / Omni 排他 | I2V フィールドと Omni フィールドは同時使用不可 |
レスポンス
レスポンスステータスコード、成功時は 200
レスポンスデータ配列
リクエスト例
ケース 1:テキストから動画(最小)
ケース 2:テキストから動画(完全パラメータ)
ケース 3:画像から動画 - 先頭フレーム
ケース 4:画像から動画 - 先頭・末尾フレーム + 中間キーフレーム
ケース 5:Omni - 単一被写体参照
ケース 6:Omni - 複数被写体 + 動画モーション参照
ケース 7:Omni - グリッドコラージュ(grid)
ケース 8:Omni - 動画拡張(extend)
ケース 9:Omni - 声紋付き(音声同期)
タスク結果の照会動画生成は非同期タスクで、提出後に
task_id が返されます。タスク状態取得 エンドポイントを使用して生成の進捗と結果を照会してください。