Saltar para o conteúdo principal
POST
/
v1
/
messages
curl https://api.apimart.ai/v1/messages \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2025-10-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5-20250929",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello, world"}
    ]
  }'
{
  "code": 200,
  "data": {
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [
      {
        "type": "text",
        "text": "Hello! I'm Claude. Nice to meet you."
      }
    ],
    "model": "claude-sonnet-4-5-20250929",
    "stop_reason": "end_turn",
    "stop_sequence": null,
    "usage": {
      "input_tokens": 12,
      "output_tokens": 18
    }
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl https://api.apimart.ai/v1/messages \
  -H "x-api-key: $API_KEY" \
  -H "anthropic-version: 2025-10-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5-20250929",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello, world"}
    ]
  }'
{
  "code": 200,
  "data": {
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [
      {
        "type": "text",
        "text": "Hello! I'm Claude. Nice to meet you."
      }
    ],
    "model": "claude-sonnet-4-5-20250929",
    "stop_reason": "end_turn",
    "stop_sequence": null,
    "usage": {
      "input_tokens": 12,
      "output_tokens": 18
    }
  }
}

Autorizações

x-api-key
string
obrigatório
Chave de API para autenticaçãoAcesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione-a ao cabeçalho da requisição:
x-api-key: YOUR_API_KEY
anthropic-version
string
obrigatório
Versão da APIEspecifica a versão da API Claude a ser utilizadaExemplo: 2025-10-01

Body

model
string
padrão:"claude-haiku-4-5-20251001"
obrigatório
Nome do modelo
  • claude-haiku-4-5-20251001 - Claude 4.5, versão de resposta rápida
  • claude-sonnet-4-5-20250929 - Claude 4.5, versão equilibrada
  • claude-opus-4-1-20250805 - Claude 4.1, modelo principal mais poderoso
  • claude-opus-4-1-20250805-thinking - Claude 4.1 Opus, versão com raciocínio profundo
  • claude-sonnet-4-5-20250929-thinking - Claude 4.5 Sonnet, versão com raciocínio profundo
messages
array
obrigatório
Lista de mensagensArray de mensagens para o modelo gerar a próxima resposta. Cada mensagem contém os campos role e content.💡 Preenchimento rápido (área Try it):
  1. Clique em ”+ Add an item” para adicionar uma mensagem
  2. Em role, informe: user (mensagem do usuário) ou assistant (resposta da IA, para múltiplas rodadas)
  3. Em content, informe o texto da sua mensagem
Mensagem única do usuário:
[{"role": "user", "content": "Hello, Claude"}]
Conversa em múltiplas rodadas:
[
  {"role": "user", "content": "Hello there."},
  {"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"},
  {"role": "user", "content": "Can you explain LLMs in plain English?"}
]
Resposta do assistente pré-preenchida:
[
  {"role": "user", "content": "What's the Greek name for Sun? (A) Sol (B) Helios (C) Sun"},
  {"role": "assistant", "content": "The best answer is ("}
]
max_tokens
integer
Máximo de tokens a serem geradosNúmero máximo de tokens a serem gerados antes de parar. O modelo pode parar antes de atingir esse limite.Modelos diferentes possuem valores máximos distintos. Mínimo: 1
system
string | array
Prompt do sistemaOs prompts do sistema definem o papel, a personalidade, os objetivos e as instruções do Claude.Formato string:
{
  "system": "You are a professional Python programming tutor"
}
Formato estruturado:
{
  "system": [
    {
      "type": "text",
      "text": "You are a professional Python programming tutor"
    }
  ]
}
temperature
number
Parâmetro de temperatura, faixa 0–1Controla a aleatoriedade da saída:
  • Valores baixos (por exemplo, 0.2): mais determinístico, conservador
  • Valores altos (por exemplo, 0.8): mais aleatório, criativo
Padrão: 1.0
top_p
number
Parâmetro de amostragem por núcleo (nucleus sampling), faixa 0–1Utiliza amostragem por núcleo. Recomenda-se usar temperature OU top_p, não ambos.Padrão: 1.0
top_k
integer
Amostragem Top-KAmostra apenas a partir das K principais opções, removendo respostas de baixa probabilidade da “cauda longa”.Recomendado apenas para casos de uso avançados.
stream
boolean
Habilitar streamingQuando true, usa Server-Sent Events (SSE) para transmitir as respostas em streaming.Padrão: false
stop_sequences
array
Sequências de paradaSequências de texto personalizadas que fazem o modelo parar de gerar.Máximo de 4 sequências.Exemplo: ["\n\nHuman:", "\n\nAssistant:"]
metadata
object
MetadadosObjeto de metadados para a requisição.Inclui:
  • user_id: identificador do usuário
tools
array
Definições de ferramentasLista de ferramentas que o modelo pode usar para concluir as tarefas.Exemplo de ferramenta de função:
{
  "tools": [
    {
      "name": "get_weather",
      "description": "Get the current weather in a given location",
      "input_schema": {
        "type": "object",
        "properties": {
          "location": {
            "type": "string",
            "description": "The city and state, e.g. San Francisco, CA"
          },
          "unit": {
            "type": "string",
            "enum": ["celsius", "fahrenheit"],
            "description": "Temperature unit"
          }
        },
        "required": ["location"]
      }
    }
  ]
}
Tipos de ferramentas suportadas:
  • Ferramentas de função personalizadas
  • Ferramenta de uso do computador (computer_20241022)
  • Ferramenta de edição de texto (text_editor_20241022)
  • Ferramenta Bash (bash_20241022)
tool_choice
object
Estratégia de escolha de ferramentaControla como o modelo usa as ferramentas:
  • {"type": "auto"}: decisão automática (padrão)
  • {"type": "any"}: deve usar uma ferramenta
  • {"type": "tool", "name": "tool_name"}: usar uma ferramenta específica

Resposta

id
string
Identificador único da mensagemExemplo: "msg_013Zva2CMHLNnXjNJJKqJ2EF"
type
string
Tipo do objetoSempre "message"
role
string
PapelSempre "assistant"
content
array
Array de blocos de conteúdoConteúdo gerado pelo modelo, como um array de blocos de conteúdo.Conteúdo de texto:
[{"type": "text", "text": "Hello! I'm Claude."}]
Uso de ferramenta:
[
  {
    "type": "tool_use",
    "id": "toolu_01A09q90qw90lq917835lq9",
    "name": "get_weather",
    "input": {"location": "San Francisco, CA", "unit": "celsius"}
  }
]
Tipos de conteúdo:
  • text: conteúdo de texto
  • tool_use: invocação de ferramenta
model
string
Modelo que processou a requisiçãoExemplo: "claude-sonnet-4-5-20250929"
stop_reason
string
Motivo da paradaValores possíveis:
  • end_turn: conclusão natural
  • max_tokens: atingiu o limite máximo de tokens
  • stop_sequence: encontrou uma sequência de parada
  • tool_use: invocou uma ferramenta
stop_sequence
string | null
Sequência de parada acionadaA sequência de parada gerada, se houver; caso contrário, null
usage
object
Estatísticas de uso de tokens

Exemplos de uso

Conversa simples

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apimart.ai"
)

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain quantum computing basics"}
    ]
)

print(message.content[0].text)

Conversa em múltiplas rodadas

messages = [
    {"role": "user", "content": "What is machine learning?"},
    {"role": "assistant", "content": "Machine learning is a branch of AI..."},
    {"role": "user", "content": "Can you give a practical example?"}
]

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=messages
)

Uso de prompts do sistema

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    system="You are a senior Python developer expert in code review and optimization.",
    messages=[
        {"role": "user", "content": "How to optimize this code?\n\n[code]"}
    ]
)

Resposta em streaming

with client.messages.stream(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Write a short essay about AI"}
    ]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

Uso de ferramentas

tools = [
    {
        "name": "get_stock_price",
        "description": "Get real-time stock price",
        "input_schema": {
            "type": "object",
            "properties": {
                "ticker": {
                    "type": "string",
                    "description": "Stock ticker symbol, e.g., AAPL"
                }
            },
            "required": ["ticker"]
        }
    }
]

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    tools=tools,
    messages=[
        {"role": "user", "content": "What's Tesla's stock price?"}
    ]
)

# Handle tool calls
if message.stop_reason == "tool_use":
    tool_use = next(block for block in message.content if block.type == "tool_use")
    print(f"Calling tool: {tool_use.name}")
    print(f"Arguments: {tool_use.input}")

Compreensão visual

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://example.com/image.jpg"
                    }
                },
                {
                    "type": "text",
                    "text": "Describe this image"
                }
            ]
        }
    ]
)

Imagem em Base64

import base64

with open("image.jpg", "rb") as image_file:
    image_data = base64.b64encode(image_file.read()).decode("utf-8")

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": "image/jpeg",
                        "data": image_data
                    }
                },
                {
                    "type": "text",
                    "text": "Analyze this image"
                }
            ]
        }
    ]
)

Boas práticas

1. Engenharia de prompts

Definição clara do papel:
system = """You are an experienced data scientist specializing in:
- Statistical analysis and data visualization
- Machine learning model development
- Python and R programming
Provide professional, accurate advice."""
Saída estruturada:
message = "Please return the analysis results in JSON format with summary, key_findings, and recommendations fields."

2. Tratamento de erros

from anthropic import APIError, RateLimitError

try:
    message = client.messages.create(
        model="claude-sonnet-4-5-20250929",
        max_tokens=1024,
        messages=[{"role": "user", "content": "Hello"}]
    )
except RateLimitError:
    print("Rate limit exceeded, please retry later")
except APIError as e:
    print(f"API error: {e}")

3. Otimização de tokens

# Use shorter prompts
messages = [
    {"role": "user", "content": "Summarize key points:\n\n[long text]"}
]

# Limit output length
message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=500,  # Limit output
    messages=messages
)

4. Pré-preenchimento de respostas

# Guide model to specific format
messages = [
    {"role": "user", "content": "List 5 Python best practices"},
    {"role": "assistant", "content": "Here are 5 Python best practices:\n\n1."}
]

message = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=messages
)

Tratamento de respostas em streaming

Streaming em Python

import anthropic

client = anthropic.Anthropic(
    api_key="YOUR_API_KEY",
    base_url="https://api.apimart.ai"
)

with client.messages.stream(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Write a Python decorator example"}
    ]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

Streaming em JavaScript

import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env.API_KEY,
  baseURL: 'https://api.apimart.ai'
});

const stream = await client.messages.stream({
  model: 'claude-sonnet-4-5-20250929',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Write a React component example' }
  ]
});

for await (const chunk of stream) {
  if (chunk.type === 'content_block_delta' && 
      chunk.delta.type === 'text_delta') {
    process.stdout.write(chunk.delta.text);
  }
}

Observações importantes

  1. Segurança da chave de API:
    • Armazene as chaves de API em variáveis de ambiente
    • Nunca insira chaves diretamente no código-fonte
    • Faça a rotação das chaves regularmente
  2. Limite de taxa:
    • Esteja atento aos limites de taxa da API
    • Implemente mecanismos de retry
    • Use exponential backoff
  3. Gerenciamento de tokens:
    • Monitore o consumo de tokens
    • Otimize o tamanho dos prompts
    • Use valores adequados para max_tokens
  4. Seleção de modelo:
    • Opus: tarefas complexas, que exigem raciocínio profundo
    • Sonnet: desempenho e custo equilibrados
    • Haiku: resposta rápida, tarefas simples
  5. Filtragem de conteúdo:
    • Valide a entrada do usuário
    • Filtre informações sensíveis
    • Implemente moderação de conteúdo