Passer au contenu principal
POST
/
v1
/
audio
/
transcriptions
curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=en' \
  --form 'response_format=json'
{
  "text": "This is a transcribed text from the test audio."
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/audio/transcriptions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form 'file=@/path/to/audio.mp3' \
  --form 'model=whisper-1' \
  --form 'language=en' \
  --form 'response_format=json'
{
  "text": "This is a transcribed text from the test audio."
}

Autorisations

Authorization
string
requis
Toutes les interfaces requièrent une authentification par Bearer TokenObtenir une clé API :Rendez-vous sur la page de gestion des clés API pour obtenir votre clé APIAjoutez-la à l’en-tête de la requête :
Authorization: Bearer YOUR_API_KEY

Corps de la requête

⚠️ Les tests en ligne (Try it) ne sont pas pris en charge pour cet endpointEn raison des limitations de téléversement de fichiers, veuillez utiliser pour vos tests :
  • Apifox / Postman — après l’import, modifiez manuellement le paramètre file en type fichier
  • cURL — référez-vous aux exemples de code à droite
  • SDK — utilisez les exemples de SDK dans les différents langages
file
string
requis
Fichier audio à transcrire (type File)⚠️ Remarque : lorsque vous testez avec Apifox ou des outils similaires :
  1. Après l’import, modifiez manuellement le type de ce paramètre en file
  2. Vérifiez que le Content-Type de la requête est bien multipart/form-data
Formats pris en charge : mp3, mp4, mpeg, mpga, m4a, wav, webmTaille maximale du fichier : 25 Mo
model
string
défaut:"whisper-1"
requis
Nom du modèle de reconnaissance vocaleExemple : "whisper-1"
language
string
Code de la langue de l’audio (format ISO-639-1)Spécifier la langue peut améliorer la précision et la vitesseLes langues prises en charge incluent : zh (chinois), en (anglais), ja (japonais), ko (coréen) et 99 autres languesExemple : "en"
prompt
string
Invite textuelle facultative pour guider le style de transcription ou poursuivre un audio précédentMaximum 224 tokens
response_format
string
défaut:"json"
Format de sortieFormats pris en charge :
  • json — format JSON (texte uniquement)
  • text — texte brut
  • srt — format de sous-titres SRT
  • verbose_json — format JSON détaillé (inclut les horodatages et les métadonnées)
  • vtt — format de sous-titres WebVTT
temperature
number
défaut:"0"
Température d’échantillonnage, plage de 0 à 1Les valeurs plus élevées (comme 0,8) rendent la sortie plus aléatoire, les valeurs plus basses (comme 0,2) la rendent plus déterministe et cohérente

Réponse

text
string
Contenu textuel transcrit
task
string
Type de tâche, toujours défini sur transcribeRenvoyé uniquement au format verbose_json
language
string
Code de langue détecté ou spécifiéRenvoyé uniquement au format verbose_json
duration
number
Durée de l’audio (en secondes)Renvoyée uniquement au format verbose_json
segments
array
Tableau de segments de texteRenvoyé uniquement au format verbose_json