Textserie
Claude Messages API
- Vollständig kompatibel mit dem Format der Claude Messages API
- Unterstützt mehrstufige Gespräche und Einzelabfragen
- Unterstützt multimodale Inhalte einschließlich Text und Bildern
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisierung
API-Key für die AuthentifizierungBesuchen Sie die Seite zur API-Key-Verwaltung, um Ihren API-Key zu erhaltenIm Anfrage-Header hinzufügen:
API-VersionGibt die zu verwendende Version der Claude API anBeispiel:
2025-10-01Body
Modellname
claude-haiku-4-5-20251001– Claude 4.5, Version mit schneller Antwortclaude-sonnet-4-5-20250929– Claude 4.5, ausgewogene Versionclaude-opus-4-1-20250805– leistungsstärkstes Claude 4.1 Flaggschiff-Modellclaude-opus-4-1-20250805-thinking– Claude 4.1 Opus, Version mit tiefem Denkenclaude-sonnet-4-5-20250929-thinking– Claude 4.5 Sonnet, Version mit tiefem Denken
Liste von NachrichtenArray von Nachrichten, auf deren Grundlage das Modell die nächste Antwort generiert. Jede Nachricht enthält die Felder Mehrfach-Dialog:Vorbefüllte Assistant-Antwort:
role und content.💡 Schnellausfüllen (Try-it-Bereich):- Klicken Sie auf „+ Add an item”, um eine Nachricht hinzuzufügen
- Eingabe
role:user(Benutzernachricht) oderassistant(KI-Antwort, für Mehrfach-Dialoge) - Eingabe
content: der Text Ihrer Nachricht
Maximale Anzahl zu generierender TokensMaximale Anzahl an Tokens, bevor die Generierung stoppt. Das Modell kann bereits vor Erreichen dieser Grenze stoppen.Verschiedene Modelle haben unterschiedliche Maximalwerte. Minimum: 1
SystemanweisungSystemanweisungen legen Claudes Rolle, Persönlichkeit, Ziele und Anweisungen fest.String-Format:Strukturiertes Format:
Temperatur-Parameter, Bereich 0–1Steuert die Zufälligkeit der Ausgabe:
- Niedrige Werte (z. B. 0.2): deterministischer, konservativer
- Hohe Werte (z. B. 0.8): zufälliger, kreativer
Nucleus-Sampling-Parameter, Bereich 0–1Verwendet Nucleus-Sampling. Es wird empfohlen, entweder
temperature oder top_p zu verwenden, nicht beides.Standard: 1.0Top-K-SamplingSampling nur aus den Top-K-Optionen, entfernt „long tail”-Antworten mit niedriger Wahrscheinlichkeit.Nur für fortgeschrittene Anwendungsfälle empfohlen.
Streaming aktivierenBei
true werden Server-Sent Events (SSE) zur Streaming-Übertragung der Antworten verwendet.Standard: falseStopp-SequenzenBenutzerdefinierte Textsequenzen, bei denen das Modell die Generierung stoppt.Maximal 4 Sequenzen.Beispiel:
["\n\nHuman:", "\n\nAssistant:"]MetadatenMetadaten-Objekt für die Anfrage.Enthält:
user_id: Benutzer-Identifikator
Tool-DefinitionenListe der Tools, die das Modell zur Erledigung von Aufgaben verwenden kann.Beispiel für ein Funktions-Tool:Unterstützte Tool-Typen:
- Benutzerdefinierte Funktions-Tools
- Computer-Use-Tool (computer_20241022)
- Texteditor-Tool (text_editor_20241022)
- Bash-Tool (bash_20241022)
Tool-AuswahlstrategieSteuert, wie das Modell Tools verwendet:
{"type": "auto"}: automatische Entscheidung (Standard){"type": "any"}: muss ein Tool verwenden{"type": "tool", "name": "tool_name"}: spezifisches Tool verwenden
Response
Eindeutiger Nachrichten-IdentifikatorBeispiel:
"msg_013Zva2CMHLNnXjNJJKqJ2EF"ObjekttypImmer
"message"RolleImmer
"assistant"Array von Content-BlöckenVom Modell generierter Inhalt als Array von Content-Blöcken.Textinhalt:Tool-Nutzung:Content-Typen:
text: Textinhalttool_use: Tool-Aufruf
Das Modell, das die Anfrage bearbeitet hatBeispiel:
"claude-sonnet-4-5-20250929"Stopp-GrundMögliche Werte:
end_turn: natürliche Beendigungmax_tokens: maximale Token-Anzahl erreichtstop_sequence: Stopp-Sequenz erreichttool_use: Tool aufgerufen
Ausgelöste Stopp-SequenzDie generierte Stopp-Sequenz, falls vorhanden; andernfalls
nullStatistik zur Token-Nutzung
Anwendungsbeispiele
Einfacher Dialog
Mehrfach-Dialog
Verwendung von Systemanweisungen
Streaming-Antwort
Tool-Nutzung
Bildverständnis
Bild im Base64-Format
Best Practices
1. Prompt Engineering
Klare Rollendefinition:2. Fehlerbehandlung
3. Token-Optimierung
4. Vorbefüllung von Antworten
Verarbeitung von Streaming-Antworten
Streaming in Python
Streaming in JavaScript
Wichtige Hinweise
-
API-Key-Sicherheit:
- Speichern Sie API-Keys in Umgebungsvariablen
- Schreiben Sie Keys niemals fest in den Quellcode
- Rotieren Sie Keys regelmäßig
-
Rate-Limiting:
- Beachten Sie die API-Rate-Limits
- Implementieren Sie Retry-Mechanismen
- Verwenden Sie exponentielles Backoff
-
Token-Verwaltung:
- Überwachen Sie die Token-Nutzung
- Optimieren Sie die Prompt-Länge
- Verwenden Sie passende max_tokens-Werte
-
Modellauswahl:
- Opus: komplexe Aufgaben, die tiefes Denken erfordern
- Sonnet: ausgewogene Leistung und Kosten
- Haiku: schnelle Antwort, einfache Aufgaben
-
Inhaltsfilterung:
- Validieren Sie Benutzereingaben
- Filtern Sie sensible Informationen
- Implementieren Sie Inhaltsmoderation