Seri Teks
OpenAI Multimodal Responses API
- Sepenuhnya kompatibel dengan format OpenAI Responses API
- Mendukung input multimodal berupa teks dan gambar
- Mendukung ekstensi tool: pencarian web, pencarian file, pemanggilan fungsi, dan remote MCP
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Otorisasi
##Semua API memerlukan autentikasi Bearer Token##Dapatkan API Key:Kunjungi Halaman Manajemen API Key untuk mendapatkan API Key AndaTambahkan ke header request:
Body
Nama modelModel yang didukung meliputi:
gpt-5- Model multimodal terbaru OpenAIGPT-4o-image- Model multimodal GPT-4 yang dioptimalkangpt-4-vision- Model GPT-4 untuk pemahaman vision- Model lainnya segera hadir…
Daftar konten inputArray input; setiap item berisi field
role dan content.💡 Pengisian cepat (area Try it):- Klik ”+ Add an item” untuk menambahkan item input
- Input
role:user(pesan pengguna),assistant(respons AI), atausystem(prompt sistem) - Tambahkan blok konten di
content(dapat mencakup teks dan gambar)
Mengontrol keacakan output, rentang 0-2
- Nilai yang lebih rendah (misalnya 0,2) membuat output lebih deterministik
- Nilai yang lebih tinggi (misalnya 1,8) membuat output lebih acak
Jumlah maksimum token yang akan dibuatSetiap model memiliki batas maksimum yang berbeda; lihat dokumentasi model terkait
Apakah akan menggunakan output streaming
true: Respons streaming (format SSE)false: Mengembalikan respons lengkap sekaligus
Parameter nucleus sampling, rentang 0-1Mengontrol keragaman teks yang dihasilkan; sebaiknya digunakan sebagai alternatif temperatureDefault: 1.0
Daftar tool untuk memperluas kemampuan modelJenis tool yang didukung:
- Web Search (
web_search): Pencarian informasi internet real-time - File Search (
file_search): Mencari konten file yang diunggah - Function Calling (
function): Memanggil fungsi kustom - Remote MCP (
remote_mcp): Terhubung ke layanan Model Context Protocol jarak jauh
[{"type": "web_search"}]Respons
Pengidentifikasi unik untuk respons
Jenis objek, tetap sebagai
responseTimestamp pembuatan
Nama model aktual yang digunakan
Daftar balasan yang dihasilkan
Statistik penggunaan token
Contoh Penggunaan
Input Teks Saja
Menggunakan Tool Web Search
cURL Example
Pemahaman Gambar
Analisis Multi-Gambar
Gambar yang Dikodekan Base64
Menggunakan Tool File Search
Menggunakan Function Calling
Menggunakan Remote MCP
Menggabungkan Beberapa Tool
Spesifikasi Jenis Konten
input_text
Jenis input teks Properti:type: Tetap sebagai"input_text"text: Konten teks (string)
input_image
Jenis input gambar Properti:type: Tetap sebagai"input_image"image_url: URL gambar atau data URI yang dikodekan Base64
- JPEG
- PNG
- GIF
- WebP
- Ukuran file maksimum: 20MB
aspect_ratioyang disarankan: tidak lebih dari 2048x2048 piksel
Detail Penggunaan Tool
Web Search
Tool web search memungkinkan model mengakses informasi internet real-time. Contoh konfigurasi:- Menanyakan berita terbaru dan peristiwa terkini
- Mendapatkan data real-time (saham, cuaca, nilai tukar, dan sebagainya)
- Mencari dokumentasi teknis terbaru
- Memverifikasi informasi faktual
File Search
Tool file search memungkinkan model mencari informasi relevan dalam dokumen yang diunggah. Contoh konfigurasi:- Menganalisis dokumen internal perusahaan
- Mencari spesifikasi teknis dan manual
- Menanyakan kontrak dan dokumen hukum
- Sistem tanya jawab basis pengetahuan
Function Calling
Definisikan fungsi kustom agar model dapat memanggil API eksternal atau menjalankan operasi tertentu. Contoh konfigurasi lengkap:name: Nama fungsi (wajib)description: Deskripsi fungsi (wajib)parameters: Definisi parameter menggunakan format JSON Schematype: Jenis parameterproperties: Definisi properti parameterrequired: Daftar parameter wajib
- Memanggil API pihak ketiga
- Menjalankan kueri basis data
- Memicu proses bisnis
- Berintegrasi dengan sistem internal
Remote MCP
Terhubung ke layanan Model Context Protocol (MCP) jarak jauh untuk memperluas kemampuan model. Contoh konfigurasi:url: Alamat server MCP (wajib)auth_token: Token autentikasi (opsional)timeout: Timeout dalam detik, default 30 detik
- Terhubung ke layanan AI tingkat enterprise
- Menggunakan model khusus domain
- Mengakses sumber data terlindungi
- Integrasi sistem AI terdistribusi
Format Respons Tool
Saat model menggunakan tool, format respons akan menyertakan informasi pemanggilan tool:- Model menerima input pengguna
- Menganalisis apakah tool diperlukan
- Jika diperlukan, mengembalikan request pemanggilan tool
- Klien menjalankan pemanggilan tool
- Mengembalikan hasil tool ke model
- Model menghasilkan respons akhir
Catatan Penting
-
Persyaratan URL gambar:
- Harus berupa URL yang dapat diakses publik
- Atau gunakan format Data URI yang dikodekan Base64
-
Penagihan token:
- Gambar mengonsumsi token berdasarkan
aspect_ratio - Gambar dengan
aspect_ratiotinggi akan diubah ukurannya secara otomatis untuk mengoptimalkan biaya - Pemanggilan tool juga mengonsumsi token tambahan
- Gambar mengonsumsi token berdasarkan
-
Urutan konten:
- Urutan elemen dalam array konten memengaruhi pemahaman model
- Disarankan menempatkan instruksi teks terlebih dahulu, lalu gambar
-
Kombinasi multimodal:
- Dapat mencampur beberapa teks dan gambar dalam satu request
- Mendukung percakapan multi-giliran dengan koherensi konteks
-
Batasan penggunaan tool:
- Saat beberapa tool digunakan sekaligus, model akan memilih tool yang paling sesuai secara cerdas
- Function calling memerlukan definisi fungsi dan deskripsi parameter yang jelas
- Hasil web search dapat dibatasi oleh wilayah dan waktu
-
Kompatibilitas API:
- Sepenuhnya kompatibel dengan format OpenAI Responses API
- Memigrasikan kode OpenAI yang sudah ada dengan lancar
- Mendukung semua fitur ekstensi tool OpenAI