curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'

{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

Kling v3 Omni

Kling v3 Omni 動画生成

非同期処理モード、タスクIDを返してその後の照会に使用
統一されたテキストから動画/画像から動画インターフェース、画像参照構文をサポート
スタンダードモード（720P）、プロフェッショナルモード（1080P）と 4K モードをサポート
image_N 画像参照構文でプロンプト内から画像を参照
音声付き動画の生成をサポート（video_list と排他）

POST

videos

generations

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'

{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'

{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

認証

Authorization

string

必須

すべてのAPIエンドポイントはBearer Token認証が必要ですAPIキーの取得：APIキー管理ページにアクセスしてAPIキーを取得してくださいリクエストヘッダーに追加：

Authorization: Bearer YOUR_API_KEY

リクエストパラメータ

model

string

必須

動画生成モデル名サポートされているモデル：

kling-v3-omni - Kling v3 Omni（統一インターフェース）

prompt

string

必須

ポジティブテキストプロンプト<<<image_N>>> 構文で image_urls 内の画像を参照できます。N は 1 から始まります。例："<<<image_1>>>の人物がカメラに向かって手を振る"

画像が提供されているがプロンプトに <<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。

negative_prompt

string

不要なコンテンツを除外するためのネガティブプロンプト。最大長は 2500 文字です。

mode

string

デフォルト:"std"

生成モードオプション：

std - スタンダードモード（720P）
pro - プロフェッショナルモード（1080P）
4k - 4K 超高精細モード

デフォルト：std

duration

integer

デフォルト:"5"

デフォルト：5 動画の長さ（秒）値の範囲：3-15（最短3秒、最長15秒）⚠️ 注意： 純粋な数値（例：6）を入力してください。引用符を付けるとエラーが発生します

aspect_ratio

string

デフォルト:"16:9"

動画のアスペクト比オプション：

16:9 - 横向き
9:16 - 縦向き
1:1 - 正方形

デフォルト：16:9

image_urls

array<url>

画像参照用の画像URL配列プロンプト内で <<<image_N>>> 構文を使用して対応する画像を参照します（N は 1 から開始）例：["https://example.com/photo.jpg"]

画像URLは公開アクセス可能で、ホットリンク保護がないものである必要があります
画像から動画モードでは、aspect_ratio が画像の実際の比率で上書きされる場合があります

image_with_roles

array<object>

役割付き画像配列。画像から動画では推奨です。各項目の形式：{ "url": "...", "role": "..." }

first_frame：先頭フレーム
last_frame：末尾フレーム
reference：参照画像

image_urls と image_with_roles は二者択一で、同時に渡さないでください。

参照動画リスト（URL方式）、最大 1 本まで。refer_type で種類を区別します：

base：編集対象動画（デフォルト）
feature：特徴参照動画

keep_original_sound で元音声の保持可否を設定します：

no：保持しない（デフォルト）
yes：元音声を保持する

リクエスト形式：

"video_list":[
  { "video_url": "video_url", "refer_type": "base", "keep_original_sound": "no" }
]

video_url は空にできず、動画URLはアクセス可能である必要があります
refer_type=base の場合：
- 動画の開始/終了フレームは定義できません
- 参照動画は 3-10 秒である必要があります
- 生成動画の長さはアップロードした動画に従います
refer_type=feature かつ video_url が空でない場合：
- image_urls には先頭フレーム画像のみアップロードできます
動画要件：MP4/MOV のみ対応；長さは 3 秒以上；解像度は 720px-2160px；フレームレートは 24-60fps（出力は 24fps）；サイズは 200MB 以下

multi_shot

boolean

デフォルト:"false"

マルチショット分鏡モードを有効化するかどうか。

shot_type

string

分鏡方式：customize（カスタム）/ intelligence（インテリジェント）。multi_shot=true の場合は必須です。

multi_prompt

array<object>

分鏡リスト。各項目は { index, prompt, duration }。

最小 1 分鏡、最大 6 分鏡
各分鏡の duration は整数かつ 1 以上
全分鏡の duration 合計はトップレベル duration と一致
index は 1 から始まり連続増加
multi_shot=true かつ shot_type=customize の場合は必須

例：

[
  { "index": 1, "prompt": "a happy dog in running@element_cat", "duration": 3 },
  { "index": 2, "prompt": "a happy dog play with a cat@element_dog", "duration": 3 }
]

element_list

array<object>

参照主体リスト。最大 3 主体まで。以下をサポート：

name、description、element_input_urls でその場作成

一般的な形式：

[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]

説明：

その場作成では name、description、element_input_urls が必須
element_input_urls：主体ごとに 2〜4 枚（1 枚目は正面、残りは参照）
prompt 内で @name を使って参照（例："@element_dog と @element_cat が芝生で追いかける"）

watermark

boolean

ウォーターマークを追加するかどうか

audio

boolean

デフォルト:"false"

音声付き動画を生成するかどうか

このパラメータは video_list と互いに排他的です。video_list に値がある場合、audio パラメータは不要です。

パラメータの相互制約と境界

image_urls と image_with_roles は二者択一
mode=4k は kling-v3-omni で利用可能
末尾フレームのみ入力（先頭なし）は不正
先頭/末尾フレームと動画編集は相互排他：video_list.refer_type=base（または未指定）の場合は先頭/末尾フレーム不可
video_list がある場合、audio は無視されます
video_list は最大 1 本
multi_prompt は最大 6 分鏡、index は 1 から連続増加

画像参照構文

Omni モデルは <<<image_N>>> 構文を使用してプロンプト内で画像を参照し、統一されたテキストから動画/画像から動画体験を提供します：

構文	説明
`<<<image_1>>>`	`image_urls` 配列の1番目の画像を参照
`<<<image_2>>>`	`image_urls` 配列の2番目の画像を参照

自動参照：image_urls が提供されているがプロンプトに <<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。

レスポンス

code

integer

レスポンスステータスコード、成功時は200

data

array

レスポンスデータ配列

表示配列要素

status

string

タスクステータス、初回送信時は submitted

task_id

string

タスクの一意識別子、タスクステータスと結果の照会に使用

使用シーン

シーン 1：テキストから動画（スタンダードモード）

{
  "model": "kling-v3-omni",
  "prompt": "a golden retriever running on the beach, sunset, cinematic",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

シーン 2：画像参照（単一画像）

{
  "model": "kling-v3-omni",
  "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "pro",
  "duration": 5
}

シーン 3：複数画像参照

{
  "model": "kling-v3-omni",
  "prompt": "<<<image_1>>>のキャラクターが<<<image_2>>>のシーンに向かって歩く",
  "image_urls": [
    "https://example.com/character.jpg",
    "https://example.com/scene.jpg"
  ],
  "mode": "pro",
  "duration": 5
}

シーン 4：画像提供で明示的な参照なし（自動追加）

{
  "model": "kling-v3-omni",
  "prompt": "人物がゆっくり振り返って微笑む",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "std",
  "duration": 5
}

システムは自動的にプロンプトの先頭に <<<image_1>>> を追加し、"<<<image_1>>>人物がゆっくり振り返って微笑む" と同等になります。

シーン 5：音声付き動画の生成

{
  "model": "kling-v3-omni",
  "prompt": "枝の上でさえずる黄色いカナリア",
  "audio": true,
  "mode": "std",
  "duration": 5
}

注意：audio と video_list は互いに排他的です。video_list に値がある場合、audio パラメータは不要です。

タスク結果の照会動画生成は非同期タスクです。送信後に task_id が返されます。タスクステータスの取得エンドポイントで生成の進捗と結果を照会できます。

Kling v3 動画生成 Kling Video O1 動画生成

​認証

​リクエストパラメータ

​パラメータの相互制約と境界

​画像参照構文

​レスポンス

​使用シーン

​シーン 1：テキストから動画（スタンダードモード）

​シーン 2：画像参照（単一画像）

​シーン 3：複数画像参照

​シーン 4：画像提供で明示的な参照なし（自動追加）

​シーン 5：音声付き動画の生成

認証

リクエストパラメータ

パラメータの相互制約と境界

画像参照構文

レスポンス

使用シーン

シーン 1：テキストから動画（スタンダードモード）

シーン 2：画像参照（単一画像）

シーン 3：複数画像参照

シーン 4：画像提供で明示的な参照なし（自動追加）

シーン 5：音声付き動画の生成