happyhorse-1.0 はテキストから動画 / 画像から動画 / 参照画像から動画 / 動画編集の統一エンドポイントです。バックエンドが受信したパラメータに基づいて自動的にモードを判定します。全モードは統一ルール(解像度 × 秒)で課金されます:
| 渡すフィールド | ルーティング先 | モード説明 |
|---|---|---|
prompt のみ | テキストから動画(T2V) | テキスト説明のみから動画生成 |
prompt + first_frame_image | 画像から動画(I2V) | 画像を先頭フレームとして動かす |
prompt + image_urls(1〜9 枚) | 参照画像から動画(R2V) | 一連の参照画像から新しいシーンを生成 |
prompt + video_url(任意で image_urls 0〜5 枚をスタイル参照 / audio_setting) | 動画編集(EDIT) | 元動画の改変・スタイル変換 |
video_url > first_frame_image > image_urls > prompt のみ。
フィールド排他ルール:3 つのメディアフィールド(first_frame_image / image_urls / video_url)はペアで相互排他です。唯一の有効な組み合わせは video_url + image_urls(EDIT モード + 参照画像)です。排他フィールドを同時指定すると 400 mixed_media_not_allowed が返されます。
happyhorse-1.0 で固定"道を歩く少女、映画のような映像"data:image/<mime>;base64,<payload>、ゲートウェイが自動的に OSS にアップロード)に対応image_urls / video_url と相互排他1:2.5 〜 2.5:1image_urls のみ指定):1〜9 枚、被写体/スタイル参照として新しいシーンを生成video_url と併せて指定):0〜5 枚、スタイル参照画像として使用first_frame_image と相互排他、video_url とは併用可能first_frame_image と相互排他、image_urls(≤ 5 枚)とは併用可能1:8 〜 8:1video_url の指定が必須)選択肢:auto - 自動生成音声(デフォルト)origin - 元動画の音声トラックを保持720P - 標準1080P - 高解像度(デフォルト)3〜15 の任意の整数デフォルト:516:9 - 横向きワイド(デフォルト)9:16 - 縦向き1:1 - 正方形4:3 - 横向き3:4 - 縦向きtrue:ウォーターマークを追加(デフォルト)false:追加しない[0, 2147483647]。省略時はランダム| 要件 | 推奨方法 |
|---|---|
| テキストのみから動画生成 | prompt のみ指定(T2V) |
| 画像を”動かす”(先頭フレームとして使用) | first_frame_image を指定(I2V) |
| 一連の参照画像から新しいシーンを生成 | image_urls(1〜9 枚、R2V)を指定 |
| 既存動画の改変・スタイル変換 | video_url(EDIT)を指定、image_urls 0〜5 枚をスタイル参照として併用可 |
| 料金節約 | resolution: "720P" を指定 |
first_frame_image / image_urls / video_url)はペアで相互排他ですsize は T2V/R2V のみ有効:I2V / EDIT モードでは size が無視され、出力アスペクト比は入力メディアにより決定されますtask_id が返されます。タスクステータス取得 エンドポイントで生成進捗と結果を取得してください。