Langsung ke konten utama
POST
/
v1
/
audio
/
transcriptions
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=en' \
  --form 'response_format=json'
{
  "text": "This is a transcribed text from the test audio."
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=en' \
  --form 'response_format=json'
{
  "text": "This is a transcribed text from the test audio."
}

Otorisasi

Authorization
string
wajib
Semua antarmuka memerlukan autentikasi Bearer TokenDapatkan API Key:Kunjungi Halaman Manajemen API Key untuk mendapatkan API Key AndaTambahkan ke header request:
Authorization: Bearer YOUR_API_KEY

Body

⚠️ Pengujian online (Try it) tidak didukung untuk endpoint iniKarena keterbatasan unggahan file, silakan uji menggunakan:
  • Apifox / Postman - Ubah secara manual file parameter menjadi jenis file setelah impor
  • cURL - Lihat contoh kode di sebelah kanan
  • SDK - Gunakan contoh SDK dalam berbagai bahasa
file
string
wajib
File audio yang akan ditranskripsikan (jenis file)⚠️ Catatan: Saat menguji dengan Apifox atau alat serupa:
  1. Setelah impor, ubah jenis parameter ini secara manual menjadi file
  2. Pastikan Content-Type request adalah multipart/form-data
Format yang didukung: mp3, mp4, mpeg, mpga, m4a, wav, webmUkuran file maksimum: 25 MB
model
string
default:"whisper-1"
wajib
Nama model pengenalan suaraContoh: "whisper-1"
language
string
Kode bahasa audio (format ISO-639-1)Menentukan bahasa dapat meningkatkan akurasi dan kecepatanBahasa yang didukung mencakup: zh (Bahasa Mandarin), en (Bahasa Inggris), ja (Bahasa Jepang), ko (Bahasa Korea), dan 99 bahasa lainnyaContoh: "en"
prompt
string
Prompt teks opsional untuk memandu gaya transkripsi atau melanjutkan dari audio sebelumnyaMaksimum 224 token
response_format
string
default:"json"
Format outputFormat yang didukung:
  • json - Format JSON (hanya teks)
  • text - Teks polos
  • srt - Format subtitle SRT
  • verbose_json - Format JSON terperinci (mencakup timestamp dan metadata)
  • vtt - Format subtitle WebVTT
temperature
number
default:"0"
Sampling temperature, rentang 0 hingga 1Nilai yang lebih tinggi (seperti 0.8) membuat output lebih acak, nilai yang lebih rendah (seperti 0.2) membuatnya lebih deterministik dan konsisten

Response

text
string
Konten teks hasil transkripsi
task
string
Jenis tugas, tetap sebagai transcribeHanya dikembalikan pada format verbose_json
language
string
Kode bahasa yang terdeteksi atau ditentukanHanya dikembalikan pada format verbose_json
duration
number
Durasi audio (detik)Hanya dikembalikan pada format verbose_json
segments
array
Array segmen teksHanya dikembalikan pada format verbose_json