curl --request POST \
--url https://api.apimart.ai/v1/audio/transcriptions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: multipart/form-data' \
--form 'file=@/path/to/audio.mp3' \
--form 'model=whisper-1' \
--form 'language=ja' \
--form 'response_format=json'
{
"text": "これはテスト音声の文字起こしテキストです。"
}
Authorizations
すべてのインターフェースでBearer Token認証が必要ですAPI Keyの取得:API Key管理ページにアクセスしてAPI Keyを取得してくださいリクエストヘッダーに追加:Authorization: Bearer YOUR_API_KEY
リクエストボディ
⚠️ このエンドポイントはオンラインテスト(Try it)に対応していませんファイルアップロードの制限により、以下の方法でテストしてください:
- Apifox / Postman - インポート後、手動で
file パラメータをファイルタイプに変更
- cURL - 右側のコード例を参照
- SDK - 各言語のSDKサンプルコードを使用
文字起こしする音声ファイル(ファイルタイプ)⚠️ 注意:Apifoxなどのツールでテストする場合:
- インポート後、このパラメータタイプを手動で
file に変更してください
- リクエストのContent-Typeが
multipart/form-data であることを確認してください
対応形式:mp3, mp4, mpeg, mpga, m4a, wav, webm最大ファイルサイズ:25 MB
model
string
default:"whisper-1"
required
音声認識モデル名例:"whisper-1"
音声の言語コード(ISO-639-1形式)言語を指定すると精度と速度が向上します対応言語:zh(中国語)、en(英語)、ja(日本語)、ko(韓国語)など99言語例:"ja"
文字起こしスタイルをガイドするためのオプションテキストプロンプト最大224トークン
出力形式対応形式:
json - JSON形式(テキストのみ)
text - プレーンテキスト
srt - SRT字幕形式
verbose_json - 詳細JSON形式(タイムスタンプとメタデータを含む)
vtt - WebVTT字幕形式
サンプリング温度、範囲0〜1高い値(0.8など)は出力をよりランダムにし、低い値(0.2など)はより確定的で一貫性のあるものにします
Response
タスクタイプ、transcribeで固定verbose_json形式でのみ返されます
検出または指定された言語コードverbose_json形式でのみ返されます
音声の長さ(秒)verbose_json形式でのみ返されます
テキストセグメントの配列verbose_json形式でのみ返されます