Saltar para o conteúdo principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "happyhorse-1.1",
    "prompt": "A little girl walking down the road, cinematic feel",
    "resolution": "1080P",
    "size": "16:9",
    "duration": 5,
    "seed": 42
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "happyhorse-1.1",
    "prompt": "A little girl walking down the road, cinematic feel",
    "resolution": "1080P",
    "size": "16:9",
    "duration": 5,
    "seed": 42
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Autorização

Authorization
string
obrigatório
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione ao cabeçalho da requisição:
Authorization: Bearer YOUR_API_KEY

Roteamento de modos

happyhorse-1.1 é a entrada unificada para Text-to-Video / Image-to-Video / Reference-Image-to-Video. O backend determina automaticamente o modo com base nos parâmetros recebidos. Todos os modos são cobrados pela mesma regra (apenas resolução × segundos):
Campos passadosRoteia paraDescrição do modo
Apenas promptText-to-Video (T2V)Gera vídeo puramente a partir de texto
prompt + first_frame_imageImage-to-Video (I2V)Anima a partir de uma imagem do primeiro quadro
prompt + image_urls (1–9 imagens)Reference-Image-to-Video (R2V)Gera uma nova cena a partir de imagens de referência
Prioridade de roteamento (alta para baixa): first_frame_image > image_urls > apenas prompt. Regras de exclusão mútua: os dois campos de mídia (first_frame_image / image_urls) são mutuamente exclusivos. Passar dois campos mutuamente exclusivos ao mesmo tempo retorna 400 mixed_media_not_allowed.

Parâmetros da requisição

model
string
obrigatório
Nome do modelo de geração de vídeo, fixo como happyhorse-1.1
prompt
string
Descrição do conteúdo do vídeo, até 2500 caracteres; não pode conter tokens especiaisExemplo: "A little girl walking down the road, cinematic feel"
first_frame_image
string
Imagem do primeiro quadro, aciona o I2V (Image-to-Video). Suporta URL ou base64 (data:image/<mime>;base64,<payload>, o gateway faz upload para o OSS automaticamente)Mutuamente exclusivo com image_urls
Requisitos da imagem do primeiro quadro:
  • Formato: JPEG / JPG / PNG / BMP / WEBP
  • Lado curto: ≥ 300px
  • Proporção: 1:2.5 a 2.5:1
  • Tamanho do arquivo: ≤ 10MB
image_urls
array<string>
Array de imagens (Modo R2V): 1–9 imagens, usadas como referências de sujeito/estilo para gerar uma nova cenaSuporta URL ou base64Mutuamente exclusivo com first_frame_image
Requisitos da imagem de referência:
  • Formato: JPEG / JPG / PNG / BMP / WEBP
  • Lado curto: ≥ 720p recomendado
  • Proporção: curto / longo ≥ 0,4
  • Tamanho do arquivo: ≤ 10MB
  • Quantidade: 1–9 imagens
resolution
string
padrão:"1080P"
Resolução do vídeo (afeta a cobrança)Opções:
  • 720P - Padrão
  • 1080P - Alta definição (padrão)
duration
integer
padrão:"5"
Duração do vídeo em segundos (afeta a cobrança)Intervalo suportado: qualquer inteiro de 3 a 15Padrão: 5
size
string
padrão:"16:9"
Proporção de telaFormatos suportados:
  • 16:9 - Paisagem widescreen (padrão)
  • 9:16 - Retrato
  • 1:1 - Quadrado
  • 4:3 - Paisagem
  • 3:4 - Retrato
Ignorado no modo I2V — a proporção de saída é determinada automaticamente pela mídia de entrada (imagem do primeiro quadro)
watermark
boolean
padrão:"false"
Se deve adicionar uma marca d’água ao vídeo gerado
  • true: adiciona marca d’água
  • false: sem marca d’água (padrão)
seed
integer
Seed aleatório usado para controlar a aleatoriedade do conteúdo geradoIntervalo de valores: [0, 2147483647]. Se omitido, um seed aleatório é usado.
  • Para requisições idênticas, o modelo gera resultados diferentes ao receber valores de seed diferentes (por exemplo, omitindo o seed)
  • Para requisições idênticas, o modelo gera resultados semelhantes ao receber o mesmo valor de seed, mas a consistência exata não é garantida

Resposta

code
integer
Código de status da resposta, 200 em caso de sucesso
data
array
Array de dados da resposta

Casos de uso

Caso 1: Texto para vídeo T2V (Requisição mais simples)

{
  "model": "happyhorse-1.1",
  "prompt": "A little girl walking down the road, cinematic feel"
}

Caso 2: Texto para vídeo T2V (Parâmetros completos)

{
  "model": "happyhorse-1.1",
  "prompt": "A coastal road at sunset, slow-motion camera push-in, cinematic feel",
  "resolution": "1080P",
  "size": "16:9",
  "duration": 8,
  "seed": 42
}

Caso 3: Imagem para vídeo I2V (first_frame_image)

{
  "model": "happyhorse-1.1",
  "prompt": "Bring the scene in the image to life",
  "first_frame_image": "https://example.com/first_frame.png",
  "resolution": "1080P",
  "duration": 5
}

Caso 4: Referência-Imagem para vídeo R2V (múltiplas referências)

{
  "model": "happyhorse-1.1",
  "prompt": "The protagonist from image 1 runs through the scene from image 2, then picks up the prop from image 3. Keep a 3D cartoon style with smooth motion.",
  "image_urls": [
    "https://example.com/img_01.jpg",
    "https://example.com/img_02.png",
    "https://example.com/img_03.jpeg"
  ],
  "resolution": "1080P",
  "size": "16:9",
  "duration": 5
}

Caso 5: 720P para economizar custo

{
  "model": "happyhorse-1.1",
  "prompt": "Waves crashing on the beach at sunset",
  "resolution": "720P",
  "size": "16:9",
  "duration": 5
}

Guia de seleção de modo

RequisitoAbordagem recomendada
Gerar vídeo apenas a partir de textoPasse apenas prompt (T2V)
Fazer uma imagem “ganhar vida” (usar como primeiro quadro)Passe first_frame_image (I2V)
Gerar uma nova cena a partir de um conjunto de imagens de referênciaPasse image_urls (1–9, R2V)
Economizar custoUse resolution: "720P"

Dicas de uso

  1. Lógica de entrada unificada: os campos de entrada decidem o modo. Note que os dois campos de mídia (first_frame_image / image_urls) são mutuamente exclusivos
  2. size efetivo apenas em T2V/R2V: no modo I2V, size é ignorado — a proporção de saída é determinada pela mídia de entrada
  3. Duração: 5–10 segundos é o ponto ideal. Muito curto causa movimento truncado; muito longo aumenta significativamente o tempo de processamento upstream
  4. Qualidade da imagem do primeiro quadro: clara, bem composta, sujeito centralizado — melhora significativamente a saída I2V
  5. Escrita do prompt: descreva movimento / câmera / atmosfera (por exemplo, “slow push-in, cinematic, warm tones”) para obter melhores resultados do que descrições puramente estáticas de cena
Consultar resultados da tarefaA geração de vídeos é uma tarefa assíncrona que retorna um task_id no envio. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.