Перейти к основному содержанию
POST
/
v1
/
audio
/
speech
curl --request POST \
  --url https://api.apimart.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-4o-mini-tts",
    "input": "The quick brown fox jumps over the lazy dog.",
    "voice": "alloy",
    "response_format": "opus",
    "speed": 1.0
  }' \
  --output speech.opus
Binary audio data stream

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-4o-mini-tts",
    "input": "The quick brown fox jumps over the lazy dog.",
    "voice": "alloy",
    "response_format": "opus",
    "speed": 1.0
  }' \
  --output speech.opus
Binary audio data stream

Авторизация

Authorization
string
обязательно
Все API требуют аутентификации по Bearer TokenПолучение API-ключа:Перейдите на страницу управления API-ключами, чтобы получить свой API-ключДобавьте его в заголовок запроса:
Authorization: Bearer YOUR_API_KEY

Тело запроса

model
string
по умолчанию:"gpt-4o-mini-tts"
обязательно
Название модели TTSДоступные модели:
  • gpt-4o-mini-tts — модель GPT-4o Mini TTS
Пример: "gpt-4o-mini-tts"
input
string
обязательно
Текст для преобразования в речьМаксимальная длина: 4096 символовПример: "The quick brown fox jumps over the lazy dog."
voice
string
обязательно
Выбор голосаДоступные голоса:
  • alloy — нейтральный, сбалансированный голос
  • echo — мужской, спокойный голос
  • fable — британский, повествовательный голос
  • onyx — мужской, низкий голос
  • nova — женский, энергичный голос
  • shimmer — женский, мягкий голос
Пример: "alloy"
response_format
string
по умолчанию:"wav"
обязательно
Формат вывода аудиоПоддерживаемые форматы:
  • wav — формат WAV без сжатия (по умолчанию)
  • opus — формат Opus, для потоковой передачи через интернет
  • aac — формат AAC
  • flac — формат FLAC, сжатие без потерь
  • pcm — формат PCM, необработанные аудиоданные
Пример: "wav"
speed
number
по умолчанию:"1.0"
Скорость воспроизведения речиДиапазон: от 0.25 до 4.0
  • 0.25 — самая медленная скорость (1/4x)
  • 1.0 — обычная скорость (по умолчанию)
  • 4.0 — самая быстрая скорость (4x)
Пример: 1.0

Ответ

В случае успеха возвращается двоичный поток аудиоданных, который можно сохранить как аудиофайл или воспроизвести напрямую. В случае ошибки возвращается информация об ошибке в формате JSON, включая код ошибки, сообщение и тип.