Série Texte
Claude Messages API
- Entièrement compatible avec le format de l’API Claude Messages
- Prend en charge les conversations multi-tours et les requêtes uniques
- Prend en charge les contenus multimodaux, y compris texte et images
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorisations
Clé API pour l’authentificationRendez-vous sur la page de gestion des clés API pour obtenir votre clé APIAjoutez dans l’en-tête de la requête :
Version de l’APIIndique la version de l’API Claude à utiliserExemple :
2025-10-01Body
Nom du modèle
claude-haiku-4-5-20251001— Claude 4.5, version à réponse rapideclaude-sonnet-4-5-20250929— Claude 4.5, version équilibréeclaude-opus-4-1-20250805— modèle phare Claude 4.1, le plus puissantclaude-opus-4-1-20250805-thinking— Claude 4.1 Opus, version à réflexion approfondieclaude-sonnet-4-5-20250929-thinking— Claude 4.5 Sonnet, version à réflexion approfondie
Liste des messagesTableau de messages à partir desquels le modèle générera la prochaine réponse. Chaque message contient les champs Conversation multi-tours :Réponse assistant pré-remplie :
role et content.💡 Remplissage rapide (zone « Try it ») :- Cliquez sur « + Add an item » pour ajouter un message
- Saisissez dans
role:user(message utilisateur) ouassistant(réponse de l’IA, pour conversations multi-tours) - Saisissez dans
content: le texte de votre message
Nombre maximal de tokens à générerNombre maximal de tokens à générer avant l’arrêt. Le modèle peut s’arrêter avant d’atteindre cette limite.Les différents modèles ont des valeurs maximales différentes. Minimum : 1
Invite systèmeLes invites système définissent le rôle, la personnalité, les objectifs et les instructions de Claude.Format chaîne :Format structuré :
Paramètre de température, plage 0–1Contrôle l’aléa de la sortie :
- Valeurs basses (par exemple 0.2) : plus déterministe, conservateur
- Valeurs hautes (par exemple 0.8) : plus aléatoire, créatif
Paramètre d’échantillonnage par noyau (nucleus sampling), plage 0–1Utilise l’échantillonnage par noyau. Il est recommandé d’utiliser soit
temperature soit top_p, mais pas les deux.Par défaut : 1.0Échantillonnage Top-KÉchantillonne uniquement parmi les K meilleures options, supprime les réponses « à longue traîne » de faible probabilité.Recommandé uniquement pour les cas d’usage avancés.
Activer le streamingLorsque
true, utilise Server-Sent Events (SSE) pour transmettre les réponses en flux.Par défaut : falseSéquences d’arrêtSéquences de texte personnalisées qui font arrêter la génération du modèle.Maximum 4 séquences.Exemple :
["\n\nHuman:", "\n\nAssistant:"]MétadonnéesObjet de métadonnées pour la requête.Inclut :
user_id: identifiant utilisateur
Définitions des outilsListe des outils que le modèle peut utiliser pour accomplir des tâches.Exemple d’outil de fonction :Types d’outils pris en charge :
- Outils de fonction personnalisés
- Outil d’utilisation d’ordinateur (computer_20241022)
- Outil éditeur de texte (text_editor_20241022)
- Outil Bash (bash_20241022)
Stratégie de choix d’outilContrôle la façon dont le modèle utilise les outils :
{"type": "auto"}: décision automatique (par défaut){"type": "any"}: doit utiliser un outil{"type": "tool", "name": "tool_name"}: utiliser un outil spécifique
Response
Identifiant unique du messageExemple :
"msg_013Zva2CMHLNnXjNJJKqJ2EF"Type d’objetToujours
"message"RôleToujours
"assistant"Tableau de blocs de contenuContenu généré par le modèle, sous forme de tableau de blocs de contenu.Contenu texte :Utilisation d’un outil :Types de contenu :
text: contenu textueltool_use: invocation d’outil
Modèle ayant traité la requêteExemple :
"claude-sonnet-4-5-20250929"Raison de l’arrêtValeurs possibles :
end_turn: achèvement naturelmax_tokens: nombre maximal de tokens atteintstop_sequence: séquence d’arrêt rencontréetool_use: invocation d’un outil
Séquence d’arrêt déclenchéeLa séquence d’arrêt qui a été générée, le cas échéant ; sinon
nullStatistiques d’utilisation des tokens
Exemples d’utilisation
Conversation simple
Conversation multi-tours
Utilisation d’invites système
Réponse en streaming
Utilisation d’outils
Compréhension d’images
Image en Base64
Bonnes pratiques
1. Ingénierie des prompts
Définition claire du rôle :2. Gestion des erreurs
3. Optimisation des tokens
4. Préremplissage des réponses
Gestion des réponses en streaming
Streaming en Python
Streaming en JavaScript
Remarques importantes
-
Sécurité des clés API :
- Stockez les clés API dans des variables d’environnement
- N’inscrivez jamais les clés en dur dans le code source
- Faites tourner les clés régulièrement
-
Limitation du débit :
- Tenez compte des limites de débit de l’API
- Implémentez des mécanismes de relance
- Utilisez un backoff exponentiel
-
Gestion des tokens :
- Surveillez l’utilisation des tokens
- Optimisez la longueur des prompts
- Utilisez des valeurs max_tokens appropriées
-
Sélection du modèle :
- Opus : tâches complexes nécessitant une réflexion approfondie
- Sonnet : performance et coût équilibrés
- Haiku : réponse rapide, tâches simples
-
Filtrage du contenu :
- Validez les entrées utilisateur
- Filtrez les informations sensibles
- Mettez en place une modération du contenu