메인 콘텐츠로 건너뛰기
POST
https://api.apimart.ai
/
v1
/
audio
/
transcriptions
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=ko' \
  --form 'response_format=json'
{
  "text": "이것은 테스트 오디오의 변환된 텍스트입니다."
}
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=ko' \
  --form 'response_format=json'
{
  "text": "이것은 테스트 오디오의 변환된 텍스트입니다."
}

Authorizations

Authorization
string
required
모든 인터페이스에 Bearer Token 인증이 필요합니다API Key 받기:API Key 관리 페이지를 방문하여 API Key를 받으세요요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY

요청 본문

⚠️ 이 엔드포인트는 온라인 테스트(Try it)를 지원하지 않습니다파일 업로드 제한으로 인해 다음 방법으로 테스트하세요:
  • Apifox / Postman - 가져온 후 file 매개변수를 수동으로 파일 타입으로 변경
  • cURL - 오른쪽 코드 예제 참조
  • SDK - 각 언어의 SDK 예제 코드 사용
file
string
required
변환할 오디오 파일 (파일 타입)⚠️ 참고: Apifox 등의 도구로 테스트할 때:
  1. 가져온 후 이 매개변수 타입을 수동으로 file로 변경하세요
  2. 요청 Content-Type이 multipart/form-data인지 확인하세요
지원 형식: mp3, mp4, mpeg, mpga, m4a, wav, webm최대 파일 크기: 25 MB
model
string
default:"whisper-1"
required
음성 인식 모델 이름예: "whisper-1"
language
string
오디오의 언어 코드 (ISO-639-1 형식)언어를 지정하면 정확도와 속도가 향상됩니다지원 언어: zh (중국어), en (영어), ja (일본어), ko (한국어) 등 99개 언어예: "ko"
prompt
string
변환 스타일을 안내하기 위한 선택적 텍스트 프롬프트최대 224 토큰
response_format
string
default:"json"
출력 형식지원 형식:
  • json - JSON 형식 (텍스트만)
  • text - 일반 텍스트
  • srt - SRT 자막 형식
  • verbose_json - 상세 JSON 형식 (타임스탬프 및 메타데이터 포함)
  • vtt - WebVTT 자막 형식
temperature
number
default:"0"
샘플링 온도, 범위 0~1높은 값 (0.8 등)은 출력을 더 무작위로 만들고, 낮은 값 (0.2 등)은 더 확정적이고 일관되게 만듭니다

Response

text
string
변환된 텍스트 내용
task
string
작업 유형, transcribe로 고정verbose_json 형식에서만 반환됩니다
language
string
감지되거나 지정된 언어 코드verbose_json 형식에서만 반환됩니다
duration
number
오디오 길이 (초)verbose_json 형식에서만 반환됩니다
segments
array
텍스트 세그먼트 배열verbose_json 형식에서만 반환됩니다