GPT-Image-2
GPT-Image-2 公式チャネル 画像生成
- OpenAI 公式
gpt-image-2モデル、/v1/images/generations互換プロトコルベース - 非同期処理モード、
task_idを返却して後続クエリで使用 - テキストから画像 / 画像から画像 / インペインティング(mask)の 3-in-1
- 新規
resolutionティアフィールド、1K / 2K / 4K の選択をサポート - 15 種の比率をサポートし、1K / 2K / 4K ティアで利用できます
- 1 リクエストあたり最大 4 枚、参照画像は最大 16 枚
gpt-image-1.5-officialとパラメータが 95% 一致、移行はモデル名の変更のみで完了
POST
Authorizations
すべてのエンドポイントは Bearer Token による認証が必要ですAPI キーの取得:API キー管理ページ にアクセスして API キーを取得してください使用時はリクエストヘッダーに以下を追加:
Body
画像生成モデル名
gpt-image-2-official に固定(OpenAI 公式 gpt-image-2 モデル)画像生成のテキスト記述
- 日本語・英語・中国語をサポート、詳細な記述を推奨
- 送信前にプラットフォームのセンシティブワード / セーフティレビューを通過します。違反内容は即座にエラーを返します
画像の比率対外的には比率値を使用し、システム内部で
resolution に基づいて具体的なピクセルに自動マッピングされます。以下の比率をサポート、さらに auto を指定するとサーバー側で適切な比率を自動選択します:auto- 自動(prompt / 参照画像に基づきサーバー側が比率を選択)1:1- 正方形(デフォルト、SNS アバター / ロゴ)3:2- 横構図(一眼レフでよく使われる比率)2:3- 縦構図(縦長ポスター)4:3- 横構図(クラシックモニター / スライド)3:4- 縦構図5:4- 横構図4:5- 縦構図(Instagram 縦型投稿)16:9- 横構図(ワイド動画サムネイル)9:16- 縦構図(スマホフルスクリーン / ショート動画カバー)2:1- 横構図(Web バナー)1:2- 縦構図3:1- 横構図(ウルトラワイドバナー)1:3- 縦構図(超縦長ポスター)21:9- 横構図(映画ウルトラワイド)9:21- 縦構図
1881x836 / 887x1774 のようなピクセルサイズも直接指定できます。解像度ティア(新規フィールド)実際の出力解像度を制御します。
1k- 1024 ベースライン、日常利用でコスト効率が良い(デフォルト)2k- 2048 ベースライン、ポスター / 高精細用途に適する4k- 3840 ベースライン、下記マッピング表の 15 種の比率をサポート
画像品質
auto- 自動(デフォルト、通常lowに相当)low- 高速で低コスト、ラフスケッチで十分medium- バランス型high- 最高精度(4K + high は 120 秒以上かかる場合あり)
背景モード
auto- 自動(デフォルト)opaque- 不透明transparent- ⚠️ gpt-image-2-official は透過背景をサポートしません。指定してもシステムは静かにautoにダウングレードします
モデレーション強度
auto- デフォルトモデレーション強度low- より緩やかなモデレーション
出力フォーマット
png- デフォルトjpeg- ファイルサイズが小さいwebp- モダンブラウザ向け最適
出力圧縮レベル、範囲
0-100jpeg/webpのみ有効
生成する画像の枚数範囲:
1 ~ 4参照画像 URL 配列
マスク画像 URL、インペインティング用
image_urlsと併用する必要があります
サイズ × 解像度マッピング表
size × resolution → OpenAI 実ピクセル(15 比率 × 3 ティア):
| size | 1k | 2k | 4k |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
3:2 | 1536×1024 | 2048×1360 | 3520×2336 |
2:3 | 1024×1536 | 1360×2048 | 2336×3520 |
4:3 | 1024×768 | 2048×1536 | 3312×2480 |
3:4 | 768×1024 | 1536×2048 | 2480×3312 |
5:4 | 1280×1024 | 2560×2048 | 3216×2576 |
4:5 | 1024×1280 | 2048×2560 | 2576×3216 |
16:9 | 1536×864 | 2048×1152 | 3840×2160 |
9:16 | 864×1536 | 1152×2048 | 2160×3840 |
2:1 | 2048×1024 | 2688×1344 | 3840×1920 |
1:2 | 1024×2048 | 1344×2688 | 1920×3840 |
3:1 | 1881×836 / 1536×512 | 3072×1024 | 3840×1280 |
1:3 | 887×1774 / 512×1536 | 1024×3072 | 1280×3840 |
21:9 | 2016×864 | 2688×1152 | 3840×1648 |
9:21 | 864×2016 | 1152×2688 | 1648×3840 |
備考:一部のサイズは 16 の倍数とピクセル上限に基づいて近似マッピングされます。例:3:2/2:3@ 2K は 2048×1360、21:9@ 4K は 3840×1648 です。実際のピクセルは表の値を基準にしてください。
使用シナリオ例
テキストから画像(最小リクエスト)Response
レスポンスステータスコード
レスポンスデータ配列
タスク結果のクエリ
提出成功後にtask_id が返されます。GET /v1/tasks/{task_id} でタスク状態をポーリングしてください。詳細は タスククエリ API を参照。
成功レスポンス例
submitted → in_progress → completed / failed。
画像の取得:data.result.images[0].url[0]。
ポーリングの推奨事項
- 初回クエリの遅延:提出後 10~20 秒待ってから最初のクエリを実行
- クエリ間隔:3~5 秒推奨
- タイムアウトの目安:
high + 2k/4kの組み合わせは最大 130 秒かかります。クライアントタイムアウトは ≥ 180 秒を推奨 - バッチクエリ:複数タスクを同時にクエリする場合は
POST /v1/tasks/batchを使用