Kling v3 Omni
Kling v3 Omni 動画生成
- 非同期処理モード、タスクIDを返してその後の照会に使用
- 統一されたテキストから動画/画像から動画インターフェース、画像参照構文をサポート
- スタンダードモード(720P)、プロフェッショナルモード(1080P)と 4K モードをサポート
- image_N 画像参照構文でプロンプト内から画像を参照
- 音声付き動画の生成をサポート(video_list と排他)
POST
認証
リクエストパラメータ
動画生成モデル名サポートされているモデル:
kling-v3-omni- Kling v3 Omni(統一インターフェース)
ポジティブテキストプロンプト
<<<image_N>>> 構文で image_urls 内の画像を参照できます。N は 1 から始まります。例:"<<<image_1>>>の人物がカメラに向かって手を振る"画像が提供されているがプロンプトに
<<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。不要なコンテンツを除外するためのネガティブプロンプト。最大長は 2500 文字です。
生成モードオプション:
std- スタンダードモード(720P)pro- プロフェッショナルモード(1080P)4k- 4K 超高精細モード
stdデフォルト:
5
動画の長さ(秒)値の範囲:3-15(最短3秒、最長15秒)⚠️ 注意: 純粋な数値(例:6)を入力してください。引用符を付けるとエラーが発生します動画のアスペクト比オプション:
16:9- 横向き9:16- 縦向き1:1- 正方形
16:9画像参照用の画像URL配列プロンプト内で
<<<image_N>>> 構文を使用して対応する画像を参照します(N は 1 から開始)例:["https://example.com/photo.jpg"]役割付き画像配列。画像から動画では推奨です。各項目の形式:
{ "url": "...", "role": "..." }first_frame:先頭フレームlast_frame:末尾フレームreference:参照画像
参照動画リスト(URL方式)、最大 1 本まで。
refer_type で種類を区別します:base:編集対象動画(デフォルト)feature:特徴参照動画
keep_original_sound で元音声の保持可否を設定します:no:保持しない(デフォルト)yes:元音声を保持する
マルチショット分鏡モードを有効化するかどうか。
分鏡方式:
customize(カスタム)/ intelligence(インテリジェント)。multi_shot=true の場合は必須です。分鏡リスト。各項目は
{ index, prompt, duration }。- 最小 1 分鏡、最大 6 分鏡
- 各分鏡の
durationは整数かつ 1 以上 - 全分鏡の
duration合計はトップレベルdurationと一致 indexは 1 から始まり連続増加multi_shot=trueかつshot_type=customizeの場合は必須
参照主体リスト。最大 3 主体まで。以下をサポート:説明:
name、description、element_input_urlsでその場作成
- その場作成では
name、description、element_input_urlsが必須 element_input_urls:主体ごとに 2〜4 枚(1 枚目は正面、残りは参照)prompt内で@nameを使って参照(例:"@element_dog と @element_cat が芝生で追いかける")
ウォーターマークを追加するかどうか
音声付き動画を生成するかどうか
パラメータの相互制約と境界
image_urlsとimage_with_rolesは二者択一mode=4kはkling-v3-omniで利用可能- 末尾フレームのみ入力(先頭なし)は不正
- 先頭/末尾フレームと動画編集は相互排他:
video_list.refer_type=base(または未指定)の場合は先頭/末尾フレーム不可 video_listがある場合、audioは無視されますvideo_listは最大 1 本multi_promptは最大 6 分鏡、indexは 1 から連続増加
画像参照構文
Omni モデルは<<<image_N>>> 構文を使用してプロンプト内で画像を参照し、統一されたテキストから動画/画像から動画体験を提供します:
| 構文 | 説明 |
|---|---|
<<<image_1>>> | image_urls 配列の1番目の画像を参照 |
<<<image_2>>> | image_urls 配列の2番目の画像を参照 |
自動参照:
image_urls が提供されているがプロンプトに <<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。レスポンス
レスポンスステータスコード、成功時は200
レスポンスデータ配列
使用シーン
シーン 1:テキストから動画(スタンダードモード)
シーン 2:画像参照(単一画像)
シーン 3:複数画像参照
シーン 4:画像提供で明示的な参照なし(自動追加)
システムは自動的にプロンプトの先頭に<<<image_1>>>を追加し、"<<<image_1>>>人物がゆっくり振り返って微笑む"と同等になります。
シーン 5:音声付き動画の生成
注意:audioとvideo_listは互いに排他的です。video_listに値がある場合、audioパラメータは不要です。
タスク結果の照会動画生成は非同期タスクです。送信後に
task_id が返されます。タスクステータスの取得 エンドポイントで生成の進捗と結果を照会できます。