メインコンテンツへスキップ
POST
https://api.apimart.ai
/
v1
/
audio
/
transcriptions
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=ja' \
  --form 'response_format=json'
{
  "text": "これはテスト音声の文字起こしテキストです。"
}
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=ja' \
  --form 'response_format=json'
{
  "text": "これはテスト音声の文字起こしテキストです。"
}

Authorizations

Authorization
string
required
すべてのインターフェースでBearer Token認証が必要ですAPI Keyの取得:API Key管理ページにアクセスしてAPI Keyを取得してくださいリクエストヘッダーに追加:
Authorization: Bearer YOUR_API_KEY

リクエストボディ

⚠️ このエンドポイントはオンラインテスト(Try it)に対応していませんファイルアップロードの制限により、以下の方法でテストしてください:
  • Apifox / Postman - インポート後、手動で file パラメータをファイルタイプに変更
  • cURL - 右側のコード例を参照
  • SDK - 各言語のSDKサンプルコードを使用
file
string
required
文字起こしする音声ファイル(ファイルタイプ)⚠️ 注意:Apifoxなどのツールでテストする場合:
  1. インポート後、このパラメータタイプを手動で file に変更してください
  2. リクエストのContent-Typeが multipart/form-data であることを確認してください
対応形式:mp3, mp4, mpeg, mpga, m4a, wav, webm最大ファイルサイズ:25 MB
model
string
default:"whisper-1"
required
音声認識モデル名例:"whisper-1"
language
string
音声の言語コード(ISO-639-1形式)言語を指定すると精度と速度が向上します対応言語:zh(中国語)、en(英語)、ja(日本語)、ko(韓国語)など99言語例:"ja"
prompt
string
文字起こしスタイルをガイドするためのオプションテキストプロンプト最大224トークン
response_format
string
default:"json"
出力形式対応形式:
  • json - JSON形式(テキストのみ)
  • text - プレーンテキスト
  • srt - SRT字幕形式
  • verbose_json - 詳細JSON形式(タイムスタンプとメタデータを含む)
  • vtt - WebVTT字幕形式
temperature
number
default:"0"
サンプリング温度、範囲0〜1高い値(0.8など)は出力をよりランダムにし、低い値(0.2など)はより確定的で一貫性のあるものにします

Response

text
string
文字起こしされたテキスト内容
task
string
タスクタイプ、transcribeで固定verbose_json形式でのみ返されます
language
string
検出または指定された言語コードverbose_json形式でのみ返されます
duration
number
音声の長さ(秒)verbose_json形式でのみ返されます
segments
array
テキストセグメントの配列verbose_json形式でのみ返されます