GPT-Image-2
Генерация изображений GPT-Image-2 (официальный канал)
- Официальная модель OpenAI
gpt-image-2, основанная на совместимом протоколе/v1/images/generations - Асинхронная обработка, возвращается
task_idдля последующих запросов - Text-to-image / image-to-image / inpainting (mask) — всё в одном
- Новое поле уровня
resolution— выбор 1K / 2K / 4K - 15 соотношений сторон во всех уровнях 1K / 2K / 4K
- До 4 изображений за запрос, до 16 эталонных изображений
- Совпадение параметров с
gpt-image-1.5-officialна 95% — для миграции достаточно сменить имя модели
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Авторизация
Все конечные точки требуют аутентификации Bearer TokenПолучение API-ключа:Перейдите на страницу управления API-ключами, чтобы получить ваш API-ключВключите его в заголовок запроса:
Body
Название модели генерации изображенийФиксируется как
gpt-image-2-official (официальная модель OpenAI gpt-image-2)Текстовое описание для генерации изображения
- Поддерживается английский и китайский, рекомендуются подробные описания
- Перед отправкой контент проходит модерацию / проверку безопасности — нарушения отклоняются немедленно
Соотношение сторон изображенияВнешне используются значения соотношений; внутри они автоматически сопоставляются с реальными пикселями согласно
resolution.Поддерживаемые соотношения плюс auto, чтобы сервер автоматически выбрал подходящее соотношение:auto— Автоматически (сервер выбирает соотношение по prompt / эталонным изображениям)1:1— Квадрат (по умолчанию, аватары соцсетей / логотипы)3:2— Горизонтальное (распространённое соотношение DSLR)2:3— Вертикальное (вертикальные постеры)4:3— Горизонтальное (классические мониторы / слайд-шоу)3:4— Вертикальное5:4— Горизонтальное4:5— Вертикальное (вертикальная публикация Instagram)16:9— Горизонтальное (превью широкоформатных видео)9:16— Вертикальное (полный экран телефона / обложка короткого видео)2:1— Горизонтальное (веб-баннер)1:2— Вертикальное3:1— Горизонтальное (сверхширокий баннер)1:3— Вертикальное (очень высокий постер)21:9— Горизонтальное (кинематографический сверхширокий)9:21— Вертикальное
1881x836 / 887x1774.Уровень разрешения (новое поле)Управляет фактической чёткостью вывода.
1k— База 1024, экономичный вариант для повседневного использования (по умолчанию)2k— База 2048, подходит для постеров / нужд высокой чёткости4k— База 3840, поддерживает 15 соотношений из таблицы сопоставления ниже
Качество изображения
auto— Автоматически (по умолчанию, обычно эквивалентноlow)low— Быстро и экономично, достаточно для черновых набросковmedium— Сбалансированноhigh— Максимальная точность (4K + high может занимать более 120 с)
Режим фона
auto— Автоматически (по умолчанию)opaque— Непрозрачныйtransparent— ⚠️ gpt-image-2-official не поддерживает прозрачные фоны; система молча понижает доauto
Строгость модерации
auto— Стандартная строгость модерацииlow— Более мягкая модерация
Выходной формат
png— По умолчаниюjpeg— Меньшие файлыwebp— Оптимально для современных браузеров
Уровень сжатия вывода, диапазон
0–100- Действует только для
jpeg/webp
Количество генерируемых изображенийДиапазон:
1 ~ 4Массив URL эталонных изображений
URL маски, используется для inpainting
- Должен использоваться вместе с
image_urls
Сопоставление Size × Resolution
size × resolution → реальные пиксели OpenAI (15 соотношений × 3 уровня):
| size | 1k | 2k | 4k |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
3:2 | 1536×1024 | 2048×1360 | 3520×2336 |
2:3 | 1024×1536 | 1360×2048 | 2336×3520 |
4:3 | 1024×768 | 2048×1536 | 3312×2480 |
3:4 | 768×1024 | 1536×2048 | 2480×3312 |
5:4 | 1280×1024 | 2560×2048 | 3216×2576 |
4:5 | 1024×1280 | 2048×2560 | 2576×3216 |
16:9 | 1536×864 | 2048×1152 | 3840×2160 |
9:16 | 864×1536 | 1152×2048 | 2160×3840 |
2:1 | 2048×1024 | 2688×1344 | 3840×1920 |
1:2 | 1024×2048 | 1344×2688 | 1920×3840 |
3:1 | 1881×836 / 1536×512 | 3072×1024 | 3840×1280 |
1:3 | 887×1774 / 512×1536 | 1024×3072 | 1280×3840 |
21:9 | 2016×864 | 2688×1152 | 3840×1648 |
9:21 | 864×2016 | 1152×2688 | 1648×3840 |
Примечание: Некоторые размеры приближены к кратным 16 и ограничениям по пикселям, например3:2/2:3@ 2K — это 2048×1360, а21:9@ 4K — 3840×1648. В качестве источника истины используйте фактические пиксели из таблицы.
Примеры использования
Text-to-image (минимальный запрос)Response
Код состояния ответа
Массив данных ответа
Запрос результатов задачи
После успешной отправки возвращаетсяtask_id. Опрашивайте статус задачи через GET /v1/tasks/{task_id}, подробнее см. в API запроса задач.
Пример успешного ответа
submitted → in_progress → completed / failed.
Доступ к изображению: data.result.images[0].url[0].
Рекомендации по опросу
- Задержка перед первым запросом: подождите 10–20 секунд после отправки перед первым запросом
- Интервал запросов: рекомендуется 3–5 секунд
- Ориентир по таймауту: комбинации
high + 2k/4kмогут занимать до 130 секунд; рекомендуется клиентский таймаут ≥ 180 секунд - Пакетный запрос: для запроса нескольких задач за раз используйте
POST /v1/tasks/batch