GPT-Image-2
Generación de imágenes con GPT-Image-2 canal oficial
- Modelo oficial
gpt-image-2de OpenAI, basado en el protocolo compatible/v1/images/generations - Procesamiento asíncrono, devuelve
task_idpara consultas posteriores - Texto a imagen / imagen a imagen / inpainting (máscara) — todo en uno
- Nuevo campo de nivel
resolution— selección de 1K / 2K / 4K - 15 proporciones admitidas en los niveles 1K / 2K / 4K
- Hasta 4 imágenes por solicitud, hasta 16 imágenes de referencia
- 95% de alineación de parámetros con
gpt-image-1.5-official— la migración solo requiere cambiar el nombre del modelo
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorizaciones
Todos los endpoints requieren autenticación con Bearer TokenObtenga su API Key:Visite la página de gestión de API Keys para obtener su API KeyInclúyala en el encabezado de la solicitud:
Body
Nombre del modelo de generación de imágenesFijo en
gpt-image-2-official (modelo oficial gpt-image-2 de OpenAI)Descripción textual para la generación de la imagen
- Admite inglés y chino, se recomiendan descripciones detalladas
- Moderación de contenido / revisión de seguridad antes del envío — las violaciones se rechazan inmediatamente
Proporción de la imagenExternamente usa valores de proporción; internamente se mapean a píxeles reales según
resolution.Proporciones admitidas, más auto para dejar que el servidor elija una proporción adecuada automáticamente:auto- Automática (el servidor elige una proporción según el prompt / imágenes de referencia)1:1- Cuadrada (predeterminada, avatares sociales / logos)3:2- Horizontal (proporción común de DSLR)2:3- Vertical (pósters verticales)4:3- Horizontal (monitor clásico / presentación de diapositivas)3:4- Vertical5:4- Horizontal4:5- Vertical (publicación vertical de Instagram)16:9- Horizontal (miniatura de video panorámico)9:16- Vertical (pantalla completa de móvil / portada de video corto)2:1- Horizontal (banner web)1:2- Vertical3:1- Horizontal (banner ultra panorámico)1:3- Vertical (póster extra alto)21:9- Horizontal (cinematográfico ultra panorámico)9:21- Vertical
1881x836 / 887x1774.Nivel de resolución (nuevo campo)Controla la nitidez real de la salida.
1k- Línea base 1024, rentable para uso diario (predeterminado)2k- Línea base 2048, adecuado para pósters / necesidades de alta definición4k- Línea base 3840, admite las 15 proporciones de la tabla de mapeo siguiente
Calidad de la imagen
auto- Automática (predeterminado, normalmente equivale alow)low- Rápida y económica, suficiente para bocetosmedium- Equilibradahigh- Precisión máxima (4K + high puede tardar >120s)
Modo de fondo
auto- Automático (predeterminado)opaque- Opacotransparent- ⚠️ gpt-image-2-official no admite fondos transparentes; el sistema lo degrada silenciosamente aauto
Nivel de moderación
auto- Nivel de moderación predeterminadolow- Moderación más permisiva
Formato de salida
png- Predeterminadojpeg- Archivos más pequeñoswebp- Óptimo para navegadores modernos
Nivel de compresión de salida, rango
0-100- Solo efectivo para
jpeg/webp
Número de imágenes a generarRango:
1 ~ 4Array de URLs de imágenes de referencia
URL de la imagen de máscara, usada para inpainting
- Debe usarse junto con
image_urls
Mapeo Size × Resolution
size × resolution → píxeles reales de OpenAI (15 proporciones × 3 niveles):
| size | 1k | 2k | 4k |
|---|---|---|---|
1:1 | 1024×1024 | 2048×2048 | 2880×2880 |
3:2 | 1536×1024 | 2048×1360 | 3520×2336 |
2:3 | 1024×1536 | 1360×2048 | 2336×3520 |
4:3 | 1024×768 | 2048×1536 | 3312×2480 |
3:4 | 768×1024 | 1536×2048 | 2480×3312 |
5:4 | 1280×1024 | 2560×2048 | 3216×2576 |
4:5 | 1024×1280 | 2048×2560 | 2576×3216 |
16:9 | 1536×864 | 2048×1152 | 3840×2160 |
9:16 | 864×1536 | 1152×2048 | 2160×3840 |
2:1 | 2048×1024 | 2688×1344 | 3840×1920 |
1:2 | 1024×2048 | 1344×2688 | 1920×3840 |
3:1 | 1881×836 / 1536×512 | 3072×1024 | 3840×1280 |
1:3 | 887×1774 / 512×1536 | 1024×3072 | 1280×3840 |
21:9 | 2016×864 | 2688×1152 | 3840×1648 |
9:21 | 864×2016 | 1152×2688 | 1648×3840 |
Nota: Algunas dimensiones se aproximan en función de múltiplos de 16 y límites de píxeles, como3:2/2:3@ 2K siendo 2048×1360 y21:9@ 4K siendo 3840×1648. Use los píxeles reales de la tabla como fuente de verdad.
Ejemplos de uso
Texto a imagen (solicitud mínima)Response
Código de estado de la respuesta
Array de datos de la respuesta
Consulta de resultados de la tarea
Tras un envío correcto, se devuelve untask_id. Consulte el estado de la tarea mediante GET /v1/tasks/{task_id}, consulte la API de consulta de tareas para más detalles.
Ejemplo de respuesta exitosa
submitted → in_progress → completed / failed.
Acceso a la imagen: data.result.images[0].url[0].
Recomendaciones de polling
- Retraso de la consulta inicial: Espere de 10 a 20 segundos tras el envío antes de la primera consulta
- Intervalo de consulta: Se recomiendan de 3 a 5 segundos
- Referencia de timeout: Las combinaciones
high + 2k/4kpueden tardar hasta 130 segundos; se recomienda un timeout del cliente ≥ 180 segundos - Consulta por lotes: Para consultar varias tareas a la vez, use
POST /v1/tasks/batch