Serie de texto
API de Mensajes Claude
- Totalmente compatible con el formato de la API Messages de Claude
- Admite conversaciones de múltiples turnos y consultas únicas
- Admite contenido multimodal con texto e imágenes
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorizaciones
API key para autenticaciónVisite la página de gestión de API Keys para obtener su API KeyAñádala al encabezado de la solicitud:
Versión de la APIEspecifica la versión de la API de Claude a utilizarEjemplo:
2025-10-01Body
Nombre del modelo
claude-haiku-4-5-20251001- Claude 4.5, versión de respuesta rápidaclaude-sonnet-4-5-20250929- Claude 4.5, versión equilibradaclaude-opus-4-1-20250805- Modelo insignia Claude 4.1, el más capazclaude-opus-4-1-20250805-thinking- Claude 4.1 Opus, versión con razonamiento profundoclaude-sonnet-4-5-20250929-thinking- Claude 4.5 Sonnet, versión con razonamiento profundo
Lista de mensajesArray de mensajes para que el modelo genere la siguiente respuesta. Cada mensaje contiene los campos Conversación de múltiples turnos:Respuesta del asistente con prefijado:
role y content.💡 Relleno rápido (área Try it):- Haga clic en ”+ Add an item” para agregar un mensaje
- Entrada de
role:user(mensaje del usuario) oassistant(respuesta de la IA, para conversaciones de múltiples turnos) - Entrada de
content: el texto de su mensaje
Tokens máximos a generarNúmero máximo de tokens a generar antes de detenerse. El modelo puede detenerse antes de alcanzar este límite.Los distintos modelos tienen valores máximos diferentes. Mínimo: 1
Prompt del sistemaLos prompts del sistema definen el rol, la personalidad, los objetivos y las instrucciones de Claude.Formato cadena:Formato estructurado:
Parámetro de temperatura, rango 0-1Controla la aleatoriedad de la salida:
- Valores bajos (por ejemplo, 0.2): Más determinístico, conservador
- Valores altos (por ejemplo, 0.8): Más aleatorio, creativo
Parámetro de muestreo por núcleo (nucleus sampling), rango 0-1Utiliza muestreo por núcleo. Se recomienda usar
temperature o top_p, no ambos.Valor por defecto: 1.0Muestreo Top-KMuestrea solo a partir de las K opciones más probables; elimina las respuestas de “cola larga” con baja probabilidad.Recomendado solo para casos de uso avanzados.
Habilitar streamingCuando es
true, utiliza Server-Sent Events (SSE) para transmitir las respuestas en streaming.Valor por defecto: falseSecuencias de paradaSecuencias de texto personalizadas que hacen que el modelo deje de generar.Máximo 4 secuencias.Ejemplo:
["\n\nHuman:", "\n\nAssistant:"]MetadatosObjeto de metadatos para la solicitud.Incluye:
user_id: Identificador del usuario
Definiciones de herramientasLista de herramientas que el modelo puede usar para completar tareas.Ejemplo de herramienta de función:Tipos de herramientas admitidas:
- Herramientas de función personalizadas
- Herramienta de uso del ordenador (computer_20241022)
- Herramienta de editor de texto (text_editor_20241022)
- Herramienta Bash (bash_20241022)
Estrategia de elección de herramientaControla cómo el modelo utiliza las herramientas:
{"type": "auto"}: Decisión automática (por defecto){"type": "any"}: Debe usar una herramienta{"type": "tool", "name": "tool_name"}: Usar una herramienta específica
Respuesta
Identificador único del mensajeEjemplo:
"msg_013Zva2CMHLNnXjNJJKqJ2EF"Tipo de objetoSiempre
"message"RolSiempre
"assistant"Array de bloques de contenidoContenido generado por el modelo, como un array de bloques de contenido.Contenido de texto:Uso de herramienta:Tipos de contenido:
text: Contenido de textotool_use: Invocación de herramienta
Modelo que procesó la solicitudEjemplo:
"claude-sonnet-4-5-20250929"Motivo de paradaValores posibles:
end_turn: Finalización naturalmax_tokens: Se alcanzó el máximo de tokensstop_sequence: Se encontró una secuencia de paradatool_use: Invocó una herramienta
Secuencia de parada activadaLa secuencia de parada que se generó, si la hay; en caso contrario,
nullEstadísticas de uso de tokens
Ejemplos de uso
Conversación básica
Conversación de múltiples turnos
Uso de prompts del sistema
Respuesta en streaming
Uso de herramientas
Comprensión visual
Imagen en Base64
Buenas prácticas
1. Ingeniería de prompts
Definición clara del rol:2. Manejo de errores
3. Optimización de tokens
4. Prefijado de respuestas
Manejo de respuestas en streaming
Streaming con Python
Streaming con JavaScript
Notas importantes
-
Seguridad de la API Key:
- Almacene las API keys en variables de entorno
- Nunca codifique las claves directamente en el código fuente
- Rote las claves periódicamente
-
Límites de tasa:
- Tenga en cuenta los límites de tasa de la API
- Implemente mecanismos de reintento
- Use retroceso exponencial (exponential backoff)
-
Gestión de tokens:
- Monitoree el uso de tokens
- Optimice la longitud de los prompts
- Use valores adecuados de max_tokens
-
Selección del modelo:
- Opus: Tareas complejas que requieren razonamiento profundo
- Sonnet: Rendimiento y costo equilibrados
- Haiku: Respuesta rápida, tareas sencillas
-
Filtrado de contenido:
- Valide la entrada del usuario
- Filtre información sensible
- Implemente moderación de contenido