Kling v3
Kling v3 動画生成
- 非同期処理モード、タスクIDを返してその後の照会に使用
- テキストから動画、画像から動画(先頭フレーム/先頭・末尾フレーム制御)をサポート
- スタンダードモード(720P)、プロフェッショナルモード(1080P)、4Kモードをサポート
- 3〜15秒の動画尺をサポート
- 音声付き動画の生成をサポート
POST
認証
リクエストパラメータ
動画生成モデル名サポートされているモデル:
kling-v3- Kling v3(推奨)
テキストプロンプトシーン、アクション、スタイルなどを詳しく記述すると、より良い生成結果が得られます。英語のプロンプトを推奨します。例:
"a golden retriever running on the beach, sunset, cinematic"ネガティブプロンプト、不要なコンテンツを除外するために使用例:
"ぼやけ, 低画質, 歪み"生成モードオプション:
std- スタンダードモード(720P)pro- プロフェッショナルモード(1080P)4k- 4Kモード
stdデフォルト:
5
動画の長さ(秒)値の範囲:3-15(最短3秒、最長15秒)⚠️ 注意: 純粋な数値(例:6)を入力してください。引用符を付けるとエラーが発生します動画のアスペクト比オプション:
16:9- 横向き9:16- 縦向き1:1- 正方形
16:9画像から動画生成用の画像URL配列
- 1枚:先頭フレームとして使用
- 2枚:自動的に先頭フレーム + 末尾フレームに割り当て
["https://example.com/first.jpg"]ウォーターマークを追加するかどうか
音声付き動画を生成するかどうか
マルチショットモードを有効にするかどうか。
truefalse
分鏡方式:
customize / intelligence。multi_shot=true の場合は必須です。各ショットの情報(プロンプト、長さなど)。
index、prompt、duration でショット順序・内容・長さを定義します。- 最小 1 ショット、最大 6 ショット
- 各ショット内容の最大長は 512
- 各ショットの長さは 1 以上かつタスク総時間以下
- 全ショットの長さ合計はトップレベル
durationと一致
multi_shot=true かつ shot_type=customize の場合は必須です。参照主体リスト。最大 3 主体まで。説明:
name、description、element_input_urlsで現場作成可能
- 現場作成時は
name、description、element_input_urlsが必須 element_input_urls:主体ごとに 2〜4 枚(1 枚目は正面、残りは参照)promptで@name形式参照(例:"@element_dog と @element_cat が芝生で追いかける")
パラメータの制約と境界
mode=4kはkling-v3で使用可能image_urlsは最大 2 枚(1 枚: 先頭、2 枚: 先頭+末尾)- 末尾フレームのみ入力は無効(先頭フレームが必要)
multi_shot=trueの場合、トップレベルpromptは省略可能multi_promptは最大 6 ショット、indexは 1 から連続
機能サポートマトリクス
| タイプ | 機能 | std 5秒 | std 10秒 | std 15秒 | pro 5秒 | pro 10秒 |
|---|---|---|---|---|---|---|
| テキストから動画 | 動画生成 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 画像から動画 | 動画生成 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 画像から動画 | 先頭フレーム | ✅ | ✅ | ✅ | ✅ | ✅ |
| 画像から動画 | 末尾フレーム | ✅ | ✅ | ✅ | ✅ | ✅ |
テキストから動画 vs 画像から動画
image_urls の有無でシステムが自動的にモードを判定します:画像なしはテキストから動画、画像ありは画像から動画。
| パラメータ | テキストから動画 | 画像から動画 |
|---|---|---|
prompt | ✅ 必須 | ✅ 必須 |
image_urls | ❌ 不要 | ✅ 必須(1-2枚) |
negative_prompt | ✅ 任意 | ✅ 任意 |
mode | ✅ 任意 | ✅ 任意 |
duration | ✅ 任意(3-15) | ✅ 任意(3-15) |
aspect_ratio | ✅ 任意 | ⚠️ 画像比率で上書きされる場合あり |
watermark | ✅ 任意 | ✅ 任意 |
audio | ✅ 任意 | ✅ 任意 |
レスポンス
レスポンスステータスコード、成功時は200
レスポンスデータ配列
使用シーン
シーン 1:テキストから動画(スタンダードモード)
シーン 2:テキストから動画(プロモード + ネガティブプロンプト)
シーン 3:テキストから動画(15秒)
シーン 4:画像から動画(先頭フレーム)
シーン 5:画像から動画(先頭 + 末尾フレーム制御)
シーン 6:音声付き動画の生成
シーン 7:マルチショット分鏡(customize、15 秒、音声付き縦画面)
タスク結果の照会動画生成は非同期タスクです。送信後に
task_id が返されます。タスクステータスの取得 エンドポイントで生成の進捗と結果を照会できます。