Série Texte
OpenAI Multimodal Responses API
- Entièrement compatible avec le format de l’API OpenAI Responses
- Prend en charge l’entrée multimodale avec texte et images
- Prend en charge les extensions d’outils : recherche web, recherche de fichiers, function calling, MCP distant
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisations
##Toutes les API nécessitent une authentification par Bearer Token##Obtenir la clé API :Rendez-vous sur la page de gestion des clés API pour obtenir votre clé APIAjouter dans l’en-tête de la requête :
Body
Nom du modèleLes modèles pris en charge incluent :
gpt-5— dernier modèle multimodal d’OpenAIGPT-4o-image— modèle multimodal GPT-4 optimiségpt-4-vision— modèle GPT-4 de compréhension d’images- D’autres modèles à venir prochainement…
Liste des contenus d’entréeTableau d’entrée, chaque élément contient les champs
role et content.💡 Remplissage rapide (zone « Try it ») :- Cliquez sur « + Add an item » pour ajouter un élément d’entrée
- Saisissez dans
role:user(message utilisateur),assistant(réponse de l’IA) ousystem(invite système) contentajouter des blocs de contenu (peuvent inclure du texte et des images)
Contrôle l’aléa de la sortie, plage 0–2
- Les valeurs plus faibles (par ex. 0.2) rendent la sortie plus déterministe
- Les valeurs plus élevées (par ex. 1.8) rendent la sortie plus aléatoire
Nombre maximal de tokens à générerLes différents modèles ont des limites maximales différentes, veuillez consulter la documentation du modèle concerné
Utiliser ou non la sortie en streaming
true: réponse en streaming (format SSE)false: renvoyer la réponse complète en une seule fois
Paramètre d’échantillonnage par noyau (nucleus sampling), plage 0–1Contrôle la diversité du texte généré, recommandé comme alternative à temperaturePar défaut : 1.0
Liste d’outils pour étendre les capacités du modèleTypes d’outils pris en charge :
- Recherche web (
web_search) : recherche d’informations sur Internet en temps réel - Recherche de fichiers (
file_search) : recherche dans le contenu des fichiers téléversés - Function Calling (
function) : appel de fonctions personnalisées - MCP distant (
remote_mcp) : connexion à des services distants Model Context Protocol
[{"type": "web_search"}]Response
Identifiant unique de la réponse
Type d’objet, fixé à
responseHorodatage de création
Nom du modèle réellement utilisé
Liste des réponses générées
Statistiques d’utilisation des tokens
Exemples d’utilisation
Entrée texte uniquement
Utilisation de l’outil de recherche web
cURL Example
Compréhension d’images
Analyse multi-images
Image encodée en Base64
Utilisation de l’outil de recherche de fichiers
Utilisation du Function Calling
Utilisation du MCP distant
Combinaison de plusieurs outils
Spécifications des types de contenu
input_text
Type d’entrée texte Propriétés :type: fixé à"input_text"text: contenu textuel (chaîne)
input_image
Type d’entrée image Propriétés :type: fixé à"input_image"image_url: URL de l’image ou Data URI encodé en Base64
- JPEG
- PNG
- GIF
- WebP
- Taille maximale du fichier : 20 Mo
- Résolution recommandée : pas plus de 2048x2048 pixels
Détails d’utilisation des outils
Recherche web
L’outil de recherche web permet au modèle d’accéder aux informations Internet en temps réel. Exemple de configuration :- Consulter les dernières actualités et événements en cours
- Obtenir des données en temps réel (actions, météo, taux de change, etc.)
- Rechercher la dernière documentation technique
- Vérifier des informations factuelles
Recherche de fichiers
L’outil de recherche de fichiers permet au modèle de rechercher des informations pertinentes dans les documents téléversés. Exemple de configuration :- Analyser les documents internes de l’entreprise
- Rechercher dans les spécifications techniques et manuels
- Requêtes sur les contrats et documents juridiques
- Systèmes de questions-réponses sur base de connaissances
Function Calling
Définissez des fonctions personnalisées pour permettre au modèle d’appeler des API externes ou d’effectuer des opérations spécifiques. Exemple de configuration complet :name: nom de la fonction (obligatoire)description: description de la fonction (obligatoire)parameters: définition des paramètres au format JSON Schematype: type de paramètreproperties: définitions des propriétés des paramètresrequired: liste des paramètres obligatoires
- Appel d’API tierces
- Exécution de requêtes en base de données
- Déclenchement de processus métier
- Intégration avec des systèmes internes
MCP distant
Connexion à des services distants Model Context Protocol (MCP) pour étendre les capacités du modèle. Exemple de configuration :url: adresse du serveur MCP (obligatoire)auth_token: jeton d’authentification (optionnel)timeout: délai d’expiration en secondes, par défaut 30 secondes
- Connexion à des services IA d’entreprise
- Utilisation de modèles spécifiques à un domaine
- Accès à des sources de données protégées
- Intégration de systèmes IA distribués
Format de réponse lors de l’utilisation d’outils
Lorsque le modèle utilise des outils, le format de réponse inclut les informations d’appel d’outil :- Le modèle reçoit l’entrée utilisateur
- Analyse si des outils sont nécessaires
- Si oui, renvoie une requête d’appel d’outil
- Le client exécute l’appel d’outil
- Renvoie les résultats de l’outil au modèle
- Le modèle génère la réponse finale
Remarques importantes
-
Exigences relatives aux URL d’images :
- Doit être une URL publiquement accessible
- Ou utiliser le format Data URI encodé en Base64
-
Facturation des tokens :
- Les images consomment des tokens selon leur résolution
- Les images en haute résolution sont automatiquement redimensionnées pour optimiser les coûts
- Les appels d’outils consomment également des tokens supplémentaires
-
Ordre du contenu :
- L’ordre des éléments dans le tableau content influence la compréhension du modèle
- Il est recommandé de placer d’abord les instructions textuelles, puis les images
-
Combinaisons multimodales :
- Plusieurs textes et images peuvent être mélangés dans une même requête
- Prise en charge des conversations multi-tours avec cohérence du contexte
-
Limitations d’utilisation des outils :
- Lors de l’utilisation simultanée de plusieurs outils, le modèle sélectionne intelligemment l’outil le plus approprié
- Le function calling nécessite des définitions de fonctions et des descriptions de paramètres claires
- Les résultats de la recherche web peuvent être limités par région et par période
-
Compatibilité API :
- Entièrement compatible avec le format de l’API OpenAI Responses
- Migration transparente du code OpenAI existant
- Prend en charge toutes les fonctionnalités d’extension d’outils OpenAI