Textserie
OpenAI Multimodal Responses API
- Vollständig kompatibel mit dem Format der OpenAI Responses API
- Unterstützt multimodale Eingabe mit Text und Bildern
- Unterstützt Tool-Erweiterungen: Websuche, Dateisuche, Function Calling, Remote MCP
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
##Alle APIs erfordern eine Bearer-Token-Authentifizierung##API-Key erhalten:Besuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenIm Anfrage-Header hinzufügen:
Body
ModellnameUnterstützte Modelle umfassen:
gpt-5– neuestes multimodales Modell von OpenAIGPT-4o-image– optimiertes multimodales GPT-4-Modellgpt-4-vision– GPT-4-Modell mit Bildverständnis- Weitere Modelle folgen in Kürze …
Liste der EingabeinhalteEingabe-Array, jedes Element enthält die Felder
role und content.💡 Schnellausfüllen (Try-it-Bereich):- Klicken Sie auf „+ Add an item”, um ein Eingabeelement hinzuzufügen
- Eingabe
role:user(Benutzernachricht),assistant(KI-Antwort) odersystem(Systemanweisung) contentContent-Blöcke hinzufügen (kann Text und Bilder enthalten)
Steuert die Zufälligkeit der Ausgabe, Bereich 0–2
- Niedrigere Werte (z. B. 0.2) führen zu deterministischerer Ausgabe
- Höhere Werte (z. B. 1.8) führen zu zufälligerer Ausgabe
Maximale Anzahl der zu generierenden TokensVerschiedene Modelle haben unterschiedliche maximale Grenzwerte, bitte beachten Sie die jeweilige Modelldokumentation
Ob Streaming-Ausgabe verwendet werden soll
true: Streaming-Antwort (SSE-Format)false: vollständige Antwort auf einmal zurückgeben
Nucleus-Sampling-Parameter, Bereich 0–1Steuert die Vielfalt des generierten Texts, empfohlen als Alternative zu temperatureStandard: 1.0
Tool-Liste zur Erweiterung der ModellfähigkeitenUnterstützte Tool-Typen:
- Websuche (
web_search): Echtzeit-Suche nach Internet-Informationen - Dateisuche (
file_search): Suche im Inhalt hochgeladener Dateien - Function Calling (
function): Aufruf benutzerdefinierter Funktionen - Remote MCP (
remote_mcp): Verbindung zu Remote-Diensten des Model Context Protocol
[{"type": "web_search"}]Response
Eindeutiger Identifikator der Antwort
Objekttyp, fest
responseZeitstempel der Erstellung
Der tatsächlich verwendete Modellname
Liste der generierten Antworten
Statistik zur Token-Nutzung
Anwendungsbeispiele
Nur-Text-Eingabe
Verwendung des Websuche-Tools
cURL Example
Bildverständnis
Analyse mehrerer Bilder
Base64-codiertes Bild
Verwendung des Dateisuche-Tools
Verwendung von Function Calling
Verwendung von Remote MCP
Kombination mehrerer Tools
Spezifikationen der Content-Typen
input_text
Texteingabe-Typ Eigenschaften:type: fest"input_text"text: Textinhalt (String)
input_image
Bildeingabe-Typ Eigenschaften:type: fest"input_image"image_url: Bild-URL oder Base64-codiertes Data-URI
- JPEG
- PNG
- GIF
- WebP
- Maximale Dateigröße: 20 MB
- Empfohlenes Seitenverhältnis: nicht mehr als 2048x2048 Pixel
Details zur Tool-Nutzung
Websuche
Das Websuche-Tool ermöglicht es dem Modell, in Echtzeit auf Internet-Informationen zuzugreifen. Konfigurationsbeispiel:- Abruf der neuesten Nachrichten und aktuellen Ereignisse
- Echtzeit-Daten erhalten (Aktien, Wetter, Wechselkurse usw.)
- Suche nach aktueller technischer Dokumentation
- Überprüfung von Faktinformationen
Dateisuche
Das Dateisuche-Tool ermöglicht es dem Modell, relevante Informationen in hochgeladenen Dokumenten zu suchen. Konfigurationsbeispiel:- Analyse interner Unternehmensdokumente
- Suche in technischen Spezifikationen und Handbüchern
- Abfragen zu Verträgen und Rechtsdokumenten
- Q&A-Systeme auf Wissensbasis
Function Calling
Definieren Sie benutzerdefinierte Funktionen, damit das Modell externe APIs aufrufen oder bestimmte Operationen ausführen kann. Vollständiges Konfigurationsbeispiel:name: Funktionsname (erforderlich)description: Funktionsbeschreibung (erforderlich)parameters: Parameterdefinition im JSON-Schema-Formattype: Parametertypproperties: Definitionen der Parametereigenschaftenrequired: Liste der erforderlichen Parameter
- Aufruf von Drittanbieter-APIs
- Ausführen von Datenbankabfragen
- Auslösen von Geschäftsprozessen
- Integration mit internen Systemen
Remote MCP
Verbindung zu Remote-Diensten des Model Context Protocol (MCP) zur Erweiterung der Modellfähigkeiten. Konfigurationsbeispiel:url: MCP-Serveradresse (erforderlich)auth_token: Authentifizierungs-Token (optional)timeout: Timeout in Sekunden, Standard 30 Sekunden
- Verbindung zu KI-Diensten auf Enterprise-Ebene
- Verwendung domänenspezifischer Modelle
- Zugriff auf geschützte Datenquellen
- Integration verteilter KI-Systeme
Antwortformat bei Tool-Nutzung
Wenn das Modell Tools verwendet, enthält das Antwortformat Informationen zum Tool-Aufruf:- Modell erhält Benutzereingabe
- Analysiert, ob Tools benötigt werden
- Falls ja, gibt eine Tool-Aufrufanforderung zurück
- Client führt den Tool-Aufruf aus
- Gibt die Tool-Ergebnisse an das Modell zurück
- Modell generiert die endgültige Antwort
Wichtige Hinweise
-
Anforderungen an Bild-URLs:
- Muss eine öffentlich zugängliche URL sein
- Oder im Base64-codierten Data-URI-Format
-
Token-Abrechnung:
- Bilder verbrauchen Tokens entsprechend ihrer Auflösung
- Bilder mit hoher Auflösung werden automatisch verkleinert, um Kosten zu optimieren
- Tool-Aufrufe verbrauchen ebenfalls zusätzliche Tokens
-
Reihenfolge des Inhalts:
- Die Reihenfolge der Elemente im content-Array beeinflusst das Verständnis des Modells
- Empfohlen, Textanweisungen zuerst zu platzieren, dann Bilder
-
Multimodale Kombinationen:
- In einer Anfrage können mehrere Texte und Bilder gemischt werden
- Mehrfach-Dialoge mit Kontext-Kohärenz werden unterstützt
-
Einschränkungen der Tool-Nutzung:
- Bei gleichzeitiger Verwendung mehrerer Tools wählt das Modell intelligent das am besten geeignete Tool aus
- Function Calling erfordert klare Funktionsdefinitionen und Parameterbeschreibungen
- Ergebnisse der Websuche können regional und zeitlich begrenzt sein
-
API-Kompatibilität:
- Vollständig kompatibel mit dem Format der OpenAI Responses API
- Nahtlose Migration bestehenden OpenAI-Codes
- Unterstützt alle Tool-Erweiterungsfunktionen von OpenAI