Текстовая серия
OpenAI Multimodal Responses API
- Полная совместимость с форматом OpenAI Responses API
- Поддержка мультимодального ввода: текст и изображения
- Поддержка расширений-инструментов: веб-поиск, поиск по файлам, function calling, удалённый MCP
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Авторизация
##Все API требуют аутентификации Bearer Token##Получение API-ключа:Откройте страницу управления API-ключами, чтобы получить ваш API-ключДобавьте в заголовок запроса:
Body
Название моделиПоддерживаемые модели:
gpt-5— новейшая мультимодальная модель OpenAIGPT-4o-image— оптимизированная мультимодальная модель GPT-4gpt-4-vision— модель GPT-4 с пониманием изображений- Скоро будут добавлены новые модели…
Список входных данныхВходной массив, каждый элемент содержит поля
role и content.💡 Быстрое заполнение (область «Try it»):- Нажмите «+ Add an item», чтобы добавить элемент ввода
- В поле
roleвведите:user(сообщение пользователя),assistant(ответ AI) илиsystem(системная подсказка) - В поле
contentдобавьте блоки контента (могут включать текст и изображения)
Управляет случайностью вывода, диапазон 0–2
- Меньшие значения (например, 0.2) делают вывод более детерминированным
- Большие значения (например, 1.8) делают вывод более случайным
Максимальное количество генерируемых токеновУ разных моделей разные максимальные лимиты, обратитесь к документации конкретной модели
Использовать ли потоковый вывод
true: потоковый ответ (формат SSE)false: вернуть полный ответ за один раз
Параметр ядровой выборки (nucleus sampling), диапазон 0–1Управляет разнообразием генерируемого текста, рекомендуется использовать его как альтернативу temperatureПо умолчанию: 1.0
Список инструментов для расширения возможностей моделиПоддерживаемые типы инструментов:
- Веб-поиск (
web_search): поиск актуальной информации в интернете - Поиск по файлам (
file_search): поиск по содержимому загруженных файлов - Function Calling (
function): вызов пользовательских функций - Удалённый MCP (
remote_mcp): подключение к удалённым сервисам Model Context Protocol
[{"type": "web_search"}]Response
Уникальный идентификатор ответа
Тип объекта, фиксированное значение
responseВременная метка создания
Фактически использованное название модели
Список сгенерированных ответов
Статистика использования токенов
Примеры использования
Только текстовый ввод
Использование инструмента веб-поиска
cURL Example
Понимание изображений
Анализ нескольких изображений
Изображение в кодировке Base64
Использование инструмента поиска по файлам
Использование Function Calling
Использование удалённого MCP
Комбинирование нескольких инструментов
Спецификации типов контента
input_text
Тип текстового ввода Свойства:type: фиксированное значение"input_text"text: текстовое содержимое (строка)
input_image
Тип ввода изображения Свойства:type: фиксированное значение"input_image"image_url: URL изображения или Base64-кодированный data URI
- JPEG
- PNG
- GIF
- WebP
- Максимальный размер файла: 20 МБ
- Рекомендуемое разрешение: не более 2048x2048 пикселей
Подробности использования инструментов
Веб-поиск
Инструмент веб-поиска позволяет модели получать актуальную информацию из интернета. Пример конфигурации:- Запрос последних новостей и текущих событий
- Получение данных в реальном времени (акции, погода, курсы валют и т. д.)
- Поиск актуальной технической документации
- Проверка фактической информации
Поиск по файлам
Инструмент поиска по файлам позволяет модели искать релевантную информацию в загруженных документах. Пример конфигурации:- Анализ внутрикорпоративных документов
- Поиск по техническим спецификациям и руководствам
- Запросы по договорам и юридическим документам
- Системы вопросов и ответов на базе знаний
Function Calling
Определение пользовательских функций позволяет модели вызывать внешние API или выполнять конкретные операции. Полный пример конфигурации:name: имя функции (обязательно)description: описание функции (обязательно)parameters: определение параметров в формате JSON Schematype: тип параметраproperties: определения свойств параметровrequired: список обязательных параметров
- Вызов сторонних API
- Выполнение запросов к базе данных
- Запуск бизнес-процессов
- Интеграция с внутренними системами
Удалённый MCP
Подключение к удалённым сервисам Model Context Protocol (MCP) для расширения возможностей модели. Пример конфигурации:url: адрес MCP-сервера (обязательно)auth_token: токен аутентификации (необязательно)timeout: таймаут в секундах, по умолчанию 30 секунд
- Подключение к корпоративным AI-сервисам
- Использование специализированных моделей
- Доступ к защищённым источникам данных
- Интеграция с распределёнными AI-системами
Формат ответа при использовании инструментов
Когда модель использует инструменты, формат ответа будет содержать информацию о вызове инструментов:- Модель получает пользовательский ввод
- Анализирует, нужны ли инструменты
- При необходимости возвращает запрос на вызов инструмента
- Клиент выполняет вызов инструмента
- Возвращает результаты инструмента модели
- Модель формирует окончательный ответ
Важные замечания
-
Требования к URL изображений:
- Должен быть публично доступным URL
- Или использовать формат Base64-кодированного Data URI
-
Тарификация токенов:
- Изображения расходуют токены в зависимости от их разрешения
- Изображения с высоким разрешением автоматически уменьшаются для оптимизации стоимости
- Вызовы инструментов также потребляют дополнительные токены
-
Порядок контента:
- Порядок элементов в массиве content влияет на понимание моделью
- Рекомендуется сначала располагать текстовые инструкции, затем изображения
-
Мультимодальные комбинации:
- В одном запросе можно смешивать несколько текстов и изображений
- Поддерживаются многошаговые диалоги с сохранением контекста
-
Ограничения использования инструментов:
- При одновременном использовании нескольких инструментов модель интеллектуально выбирает наиболее подходящий
- Function calling требует чёткого определения функций и описания параметров
- Результаты веб-поиска могут быть ограничены регионом и временем
-
Совместимость API:
- Полная совместимость с форматом OpenAI Responses API
- Бесшовная миграция существующего кода OpenAI
- Поддержка всех функций расширения инструментов OpenAI