テキストシリーズ
OpenAI マルチモーダル Responses API
- OpenAI Responses API形式と完全互換
- テキストと画像を使用したマルチモーダル入力をサポート
- ツール拡張をサポート:Web検索、ファイル検索、関数呼び出し、リモートMCP
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Authorizations
Body
モデル名サポートされるモデル:
gpt-5- OpenAI最新マルチモーダルモデルGPT-4o-image- GPT-4最適化マルチモーダルモデルgpt-4-vision- GPT-4ビジョン理解モデル- さらに多くのモデルが近日公開予定…
入力コンテンツリスト入力配列、各項目には
role と content の2つのフィールドが含まれます。💡 クイック入力(Try itエリア):- ”+ Add an item” をクリックして入力項目を追加
roleに入力:user(ユーザーメッセージ)、assistant(AI応答)、またはsystem(システムプロンプト)contentにコンテンツブロックを追加(テキストと画像を含められます)
出力のランダム性を制御、範囲は0-2
- 低い値 (例: 0.2) は出力をより決定的にします
- 高い値 (例: 1.8) は出力をよりランダムにします
生成する最大トークン数モデルによって最大制限が異なりますので、特定のモデルのドキュメントを参照してください
ストリーミング出力を使用するかどうか
true: ストリームレスポンス (SSE形式)false: 完全なレスポンスを一度に返す
Nucleusサンプリングパラメータ、範囲は0-1生成されるテキストの多様性を制御します。temperatureと交互に使用することをお勧めしますデフォルト: 1.0
モデル機能を拡張するためのツールリストサポートされるツールタイプ:
- Web検索 (
web_search): リアルタイムインターネット情報検索 - ファイル検索 (
file_search): アップロードされたファイルコンテンツの検索 - 関数呼び出し (
function): カスタム関数の呼び出し - リモートMCP (
remote_mcp): リモートModel Context Protocolサービスへの接続
[{"type": "web_search"}]Response
レスポンスの一意の識別子
オブジェクトタイプ、
responseに固定作成タイムスタンプ
使用された実際のモデル名
生成されたレスポンスリスト
トークン使用統計
使用例
テキストのみの入力
Web検索ツールの使用
cURL例
画像理解
複数画像分析
Base64エンコード画像
ファイル検索ツールの使用
関数呼び出しの使用
リモートMCPの使用
複数ツールの組み合わせ
コンテンツタイプ仕様
input_text
テキスト入力タイプ プロパティ:type:"input_text"に固定text: テキストコンテンツ (文字列)
input_image
画像入力タイプ プロパティ:type:"input_image"に固定image_url: 画像URLまたはBase64エンコードされたデータURI
- JPEG
- PNG
- GIF
- WebP
- 最大ファイルサイズ: 20MB
- 推奨解像度: 2048x2048ピクセル以下
ツール使用の詳細
Web検索
Web検索ツールを使用すると、モデルがリアルタイムのインターネット情報にアクセスできます。 設定例:- 最新ニュースと時事問題の照会
- リアルタイムデータの取得 (株価、天気、為替レートなど)
- 最新の技術文書の検索
- 事実情報の確認
ファイル検索
ファイル検索ツールを使用すると、モデルがアップロードされたドキュメント内の関連情報を検索できます。 設定例:- 社内文書の分析
- 技術仕様とマニュアルの検索
- 契約書と法的文書の照会
- ナレッジベースQ&Aシステム
関数呼び出し
カスタム関数を定義して、モデルが外部APIを呼び出したり特定の操作を実行したりできるようにします。 完全な設定例:name: 関数名 (必須)description: 関数の説明 (必須)parameters: JSON Schema形式を使用したパラメータ定義type: パラメータタイプproperties: パラメータプロパティ定義required: 必須パラメータリスト
- サードパーティAPIの呼び出し
- データベースクエリの実行
- ビジネスプロセスのトリガー
- 内部システムとの統合
リモートMCP
リモートModel Context Protocol (MCP) サービスに接続してモデル機能を拡張します。 設定例:url: MCPサーバーアドレス (必須)auth_token: 認証トークン (オプション)timeout: タイムアウト(秒)、デフォルトは30秒
- エンタープライズレベルのAIサービスへの接続
- ドメイン固有モデルの使用
- 保護されたデータソースへのアクセス
- 分散AIシステム統合
ツールレスポンス形式
モデルがツールを使用すると、レスポンス形式にツール呼び出し情報が含まれます:- モデルがユーザー入力を受信
- ツールが必要かどうかを分析
- 必要な場合、ツール呼び出しリクエストを返す
- クライアントがツール呼び出しを実行
- ツール結果をモデルに返す
- モデルが最終レスポンスを生成
重要な注意事項
-
画像URL要件:
- 公開的にアクセス可能なURLである必要があります
- またはBase64エンコードされたData URI形式を使用
-
トークン課金:
- 画像は解像度に応じてトークンを消費します
- 高解像度画像はコスト最適化のために自動的にサイズ調整されます
- ツール呼び出しも追加トークンを消費します
-
コンテンツの順序:
- コンテンツ配列内の要素の順序がモデルの理解に影響します
- テキスト指示を最初に、次に画像を配置することをお勧めします
-
マルチモーダルの組み合わせ:
- 1つのリクエストで複数のテキストと画像を混在させることができます
- コンテキストの一貫性を保つマルチターン会話をサポートします
-
ツール使用の制限:
- 複数のツールを同時に使用する場合、モデルが最も適切なツールをインテリジェントに選択します
- 関数呼び出しには明確な関数定義とパラメータの説明が必要です
- Web検索結果は地域と時間によって制限される場合があります
-
API互換性:
- OpenAI Responses API形式と完全に互換性があります
- 既存のOpenAIコードをシームレスに移行できます
- すべてのOpenAIツール拡張機能をサポートします