メインコンテンツへスキップ
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "kling-v3-omni",
    "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
    "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
    "mode": "std",
    "duration": 5,
    "aspect_ratio": "16:9"
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_xxxxxxxxxx"
    }
  ]
}

認証

Authorization
string
必須
すべてのAPIエンドポイントはBearer Token認証が必要ですAPIキーの取得:APIキー管理ページにアクセスしてAPIキーを取得してくださいリクエストヘッダーに追加:
Authorization: Bearer YOUR_API_KEY

リクエストパラメータ

model
string
必須
動画生成モデル名サポートされているモデル:
  • kling-v3-omni - Kling v3 Omni(統一インターフェース)
prompt
string
必須
ポジティブテキストプロンプト<<<image_N>>> 構文で image_urls 内の画像を参照できます。N は 1 から始まります。例:"<<<image_1>>>の人物がカメラに向かって手を振る"
画像が提供されているがプロンプトに <<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。
negative_prompt
string
不要なコンテンツを除外するためのネガティブプロンプト。最大長は 2500 文字です。
mode
string
デフォルト:"std"
生成モードオプション:
  • std - スタンダードモード(720P)
  • pro - プロフェッショナルモード(1080P)
  • 4k - 4K 超高精細モード
デフォルト:std
duration
integer
デフォルト:"5"
デフォルト:5 動画の長さ(秒)値の範囲:3-15(最短3秒、最長15秒)⚠️ 注意: 純粋な数値(例:6)を入力してください。引用符を付けるとエラーが発生します
aspect_ratio
string
デフォルト:"16:9"
動画のアスペクト比オプション:
  • 16:9 - 横向き
  • 9:16 - 縦向き
  • 1:1 - 正方形
デフォルト:16:9
image_urls
array<url>
画像参照用の画像URL配列プロンプト内で <<<image_N>>> 構文を使用して対応する画像を参照します(N は 1 から開始)例:["https://example.com/photo.jpg"]
  • 画像URLは公開アクセス可能で、ホットリンク保護がないものである必要があります
  • 画像から動画モードでは、aspect_ratio が画像の実際の比率で上書きされる場合があります
image_with_roles
array<object>
役割付き画像配列。画像から動画では推奨です。各項目の形式:{ "url": "...", "role": "..." }
  • first_frame:先頭フレーム
  • last_frame:末尾フレーム
  • reference:参照画像
image_urlsimage_with_roles は二者択一で、同時に渡さないでください。
video_list
array
参照動画リスト(URL方式)、最大 1 本まで。refer_type で種類を区別します:
  • base:編集対象動画(デフォルト)
  • feature:特徴参照動画
keep_original_sound で元音声の保持可否を設定します:
  • no:保持しない(デフォルト)
  • yes:元音声を保持する
リクエスト形式:
"video_list":[
  { "video_url": "video_url", "refer_type": "base", "keep_original_sound": "no" }
]
  • video_url は空にできず、動画URLはアクセス可能である必要があります
  • refer_type=base の場合:
    • 動画の開始/終了フレームは定義できません
    • 参照動画は 3-10 秒である必要があります
    • 生成動画の長さはアップロードした動画に従います
  • refer_type=feature かつ video_url が空でない場合:
    • image_urls には先頭フレーム画像のみアップロードできます
  • 動画要件:MP4/MOV のみ対応;長さは 3 秒以上;解像度は 720px-2160px;フレームレートは 24-60fps(出力は 24fps);サイズは 200MB 以下
multi_shot
boolean
デフォルト:"false"
マルチショット分鏡モードを有効化するかどうか。
shot_type
string
分鏡方式:customize(カスタム)/ intelligence(インテリジェント)。multi_shot=true の場合は必須です。
multi_prompt
array<object>
分鏡リスト。各項目は { index, prompt, duration }
  • 最小 1 分鏡、最大 6 分鏡
  • 各分鏡の duration は整数かつ 1 以上
  • 全分鏡の duration 合計はトップレベル duration と一致
  • index は 1 から始まり連続増加
  • multi_shot=true かつ shot_type=customize の場合は必須
例:
[
  { "index": 1, "prompt": "a happy dog in running@element_cat", "duration": 3 },
  { "index": 2, "prompt": "a happy dog play with a cat@element_dog", "duration": 3 }
]
element_list
array<object>
参照主体リスト。最大 3 主体まで。以下をサポート:
  • namedescriptionelement_input_urls でその場作成
一般的な形式:
[
  {
    "name": "element_dog",
    "description": "a golden retriever, fluffy fur, friendly expression",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  },
  {
    "name": "element_cat",
    "description": "an orange tabby cat, round face, bright eyes",
    "element_input_urls": [
      "https://example.com/image1.png",
      "https://example.com/image2.png"
    ]
  }
]
説明:
  • その場作成では namedescriptionelement_input_urls が必須
  • element_input_urls:主体ごとに 2〜4 枚(1 枚目は正面、残りは参照)
  • prompt 内で @name を使って参照(例:"@element_dog と @element_cat が芝生で追いかける"
watermark
boolean
ウォーターマークを追加するかどうか
audio
boolean
デフォルト:"false"
音声付き動画を生成するかどうか
このパラメータは video_list と互いに排他的です。video_list に値がある場合、audio パラメータは不要です。

パラメータの相互制約と境界

  • image_urlsimage_with_roles は二者択一
  • mode=4kkling-v3-omni で利用可能
  • 末尾フレームのみ入力(先頭なし)は不正
  • 先頭/末尾フレームと動画編集は相互排他:video_list.refer_type=base(または未指定)の場合は先頭/末尾フレーム不可
  • video_list がある場合、audio は無視されます
  • video_list は最大 1 本
  • multi_prompt は最大 6 分鏡、index は 1 から連続増加

画像参照構文

Omni モデルは <<<image_N>>> 構文を使用してプロンプト内で画像を参照し、統一されたテキストから動画/画像から動画体験を提供します:
構文説明
<<<image_1>>>image_urls 配列の1番目の画像を参照
<<<image_2>>>image_urls 配列の2番目の画像を参照
自動参照image_urls が提供されているがプロンプトに <<<image_N>>> 参照がない場合、システムは自動的にプロンプトの先頭に <<<image_1>>> を追加します。

レスポンス

code
integer
レスポンスステータスコード、成功時は200
data
array
レスポンスデータ配列

使用シーン

シーン 1:テキストから動画(スタンダードモード)

{
  "model": "kling-v3-omni",
  "prompt": "a golden retriever running on the beach, sunset, cinematic",
  "mode": "std",
  "duration": 5,
  "aspect_ratio": "16:9"
}

シーン 2:画像参照(単一画像)

{
  "model": "kling-v3-omni",
  "prompt": "<<<image_1>>>の人物がカメラに向かって手を振る",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "pro",
  "duration": 5
}

シーン 3:複数画像参照

{
  "model": "kling-v3-omni",
  "prompt": "<<<image_1>>>のキャラクターが<<<image_2>>>のシーンに向かって歩く",
  "image_urls": [
    "https://example.com/character.jpg",
    "https://example.com/scene.jpg"
  ],
  "mode": "pro",
  "duration": 5
}

シーン 4:画像提供で明示的な参照なし(自動追加)

{
  "model": "kling-v3-omni",
  "prompt": "人物がゆっくり振り返って微笑む",
  "image_urls": ["https://upload.apimart.ai/f/models/9998230426123070-e9d6af04-cb5e-4731-8ae7-abf144cb0d29-9998230586368386-29641169-f698-4ab9-9b6d-380899e6521e-9998230593110693-c1741a3a-.webp"],
  "mode": "std",
  "duration": 5
}
システムは自動的にプロンプトの先頭に <<<image_1>>> を追加し、"<<<image_1>>>人物がゆっくり振り返って微笑む" と同等になります。

シーン 5:音声付き動画の生成

{
  "model": "kling-v3-omni",
  "prompt": "枝の上でさえずる黄色いカナリア",
  "audio": true,
  "mode": "std",
  "duration": 5
}
注意audiovideo_list は互いに排他的です。video_list に値がある場合、audio パラメータは不要です。
タスク結果の照会動画生成は非同期タスクです。送信後に task_id が返されます。タスクステータスの取得 エンドポイントで生成の進捗と結果を照会できます。