Saltar para o conteúdo principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "happyhorse-1.0",
    "prompt": "A little girl walking down the road, cinematic feel",
    "resolution": "1080P",
    "size": "16:9",
    "duration": 5,
    "seed": 42
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "happyhorse-1.0",
    "prompt": "A little girl walking down the road, cinematic feel",
    "resolution": "1080P",
    "size": "16:9",
    "duration": 5,
    "seed": 42
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Autorização

Authorization
string
obrigatório
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione ao cabeçalho da requisição:
Authorization: Bearer YOUR_API_KEY

Roteamento de modos

happyhorse-1.0 é a entrada unificada para Text-to-Video / Image-to-Video / Reference-Image-to-Video / Video Edit. O backend determina automaticamente o modo com base nos parâmetros recebidos. Todos os modos são cobrados pela mesma regra (apenas resolução × segundos):
Campos passadosRoteia paraDescrição do modo
Apenas promptText-to-Video (T2V)Gera vídeo puramente a partir de texto
prompt + first_frame_imageImage-to-Video (I2V)Anima a partir de uma imagem do primeiro quadro
prompt + image_urls (1–9 imagens)Reference-Image-to-Video (R2V)Gera uma nova cena a partir de imagens de referência
prompt + video_url (opcional image_urls 0–5 como refs de estilo / audio_setting)Video Edit (EDIT)Reescreve / reestiliza um vídeo de origem
Prioridade de roteamento (alta para baixa): video_url > first_frame_image > image_urls > apenas prompt. Regras de exclusão mútua: os três campos de mídia (first_frame_image / image_urls / video_url) são mutuamente exclusivos aos pares. A única combinação válida é video_url + image_urls (modo EDIT + imagens de referência). Passar dois campos mutuamente exclusivos retorna 400 mixed_media_not_allowed.

Parâmetros da requisição

model
string
obrigatório
Nome do modelo de geração de vídeo, fixo como happyhorse-1.0
prompt
string
Descrição do conteúdo do vídeo, até 2500 caracteres; não pode conter tokens especiais
  • Modos T2V / R2V / EDIT: obrigatório
  • Modo I2V: opcional, mas recomendado para guiar o movimento da câmera e as ações
Exemplo: "A little girl walking down the road, cinematic feel"
first_frame_image
string
Imagem do primeiro quadro, aciona o I2V (Image-to-Video). Suporta URL ou base64 (data:image/<mime>;base64,<payload>, o gateway faz upload para o OSS automaticamente)Mutuamente exclusivo com image_urls / video_url
Requisitos da imagem do primeiro quadro:
  • Formato: JPEG / JPG / PNG / BMP / WEBP
  • Lado curto: ≥ 300px
  • Proporção: 1:2.5 a 2.5:1
  • Tamanho do arquivo: ≤ 10MB
image_urls
array<string>
Array de imagens:
  • Modo R2V (apenas image_urls fornecido): 1–9 imagens, usadas como referências de sujeito/estilo para gerar uma nova cena
  • Modo EDIT (fornecido junto com video_url): 0–5 imagens, usadas como referência de estilo
Suporta URL ou base64Mutuamente exclusivo com first_frame_image; pode ser combinado com video_url
Requisitos da imagem de referência:
  • Formato: JPEG / JPG / PNG / BMP / WEBP
  • Lado curto: ≥ 720p recomendado
  • Proporção: curto / longo ≥ 0,4
  • Tamanho do arquivo: ≤ 10MB
  • Quantidade: R2V deve ser 1–9; EDIT até 5
video_url
string
URL do vídeo de origem, aciona o EDIT (Video Edit). Base64 não é suportado — forneça um link direto HTTP/HTTPSMutuamente exclusivo com first_frame_image; pode ser combinado com image_urls (≤ 5)
Requisitos do vídeo de origem:
  • Duração: 3–60 segundos (> 15s será automaticamente truncado pelo upstream de 0 a 15s)
  • Resolução: mínimo 480p, lado curto ≥ 360
  • Proporção: 1:8 a 8:1
  • Formato: MP4 / MOV (H.264 recomendado)
  • Taxa de quadros: > 8 fps
  • Tamanho do arquivo: ≤ 100MB
No modo EDIT, a duração do vídeo gerado corresponde ao vídeo de origem (limitada aos 15s truncados quando a origem for maior). O parâmetro duration não tem efeito aqui. Para controlar a duração da saída, recorte o vídeo de origem para a duração desejada antes de fazer upload.
audio_setting
string
padrão:"auto"
Configuração de áudio, efetiva apenas no modo EDIT (deve passar video_url)Opções:
  • auto - Gerar áudio automaticamente (padrão)
  • origin - Manter a faixa de áudio do vídeo de origem
Passar este campo fora do modo EDIT retorna 400 audio_setting_only_for_edit
resolution
string
padrão:"1080P"
Resolução do vídeo (afeta a cobrança)Opções:
  • 720P - Padrão
  • 1080P - Alta definição (padrão)
duration
integer
padrão:"5"
Duração do vídeo em segundos (afeta a cobrança)Intervalo suportado: qualquer inteiro de 3 a 15Padrão: 5
Não tem efeito no modo EDIT (quando video_url é fornecido): a duração do vídeo gerado corresponde ao vídeo de origem (cobrado pelos 15s truncados quando a origem é maior que 15s). Para controlar a duração da saída, recorte o vídeo de origem primeiro.
size
string
padrão:"16:9"
Proporção de telaFormatos suportados:
  • 16:9 - Paisagem widescreen (padrão)
  • 9:16 - Retrato
  • 1:1 - Quadrado
  • 4:3 - Paisagem
  • 3:4 - Retrato
Ignorado nos modos I2V / EDIT — a proporção de saída é determinada automaticamente pela mídia de entrada (imagem do primeiro quadro / vídeo de origem)
watermark
boolean
padrão:"false"
Se deve adicionar uma marca d’água ao vídeo gerado
  • true: adiciona marca d’água
  • false: sem marca d’água (padrão)
seed
integer
Seed aleatório usado para controlar a aleatoriedade do conteúdo geradoIntervalo de valores: [0, 2147483647]. Se omitido, um seed aleatório é usado.
  • Para requisições idênticas, o modelo gera resultados diferentes ao receber valores de seed diferentes (por exemplo, omitindo o seed)
  • Para requisições idênticas, o modelo gera resultados semelhantes ao receber o mesmo valor de seed, mas a consistência exata não é garantida

Resposta

code
integer
Código de status da resposta, 200 em caso de sucesso
data
array
Array de dados da resposta

Casos de uso

Caso 1: Texto para vídeo T2V (Requisição mais simples)

{
  "model": "happyhorse-1.0",
  "prompt": "A little girl walking down the road, cinematic feel"
}

Caso 2: Texto para vídeo T2V (Parâmetros completos)

{
  "model": "happyhorse-1.0",
  "prompt": "A coastal road at sunset, slow-motion camera push-in, cinematic feel",
  "resolution": "1080P",
  "size": "16:9",
  "duration": 8,
  "seed": 42
}

Caso 3: Imagem para vídeo I2V (first_frame_image)

{
  "model": "happyhorse-1.0",
  "prompt": "Bring the scene in the image to life",
  "first_frame_image": "https://example.com/first_frame.png",
  "resolution": "1080P",
  "duration": 5
}

Caso 4: Referência-Imagem para vídeo R2V (múltiplas referências)

{
  "model": "happyhorse-1.0",
  "prompt": "The protagonist from image 1 runs through the scene from image 2, then picks up the prop from image 3. Keep a 3D cartoon style with smooth motion.",
  "image_urls": [
    "https://example.com/img_01.jpg",
    "https://example.com/img_02.png",
    "https://example.com/img_03.jpeg"
  ],
  "resolution": "1080P",
  "size": "16:9",
  "duration": 5
}

Caso 5: Video Edit EDIT (mantém áudio original + referência de estilo)

{
  "model": "happyhorse-1.0",
  "prompt": "Convert the character in the video to a cartoon style, preserving the original motion",
  "video_url": "https://example.com/source.mp4",
  "image_urls": [
    "https://example.com/style_ref.jpg"
  ],
  "resolution": "1080P",
  "audio_setting": "origin",
  "seed": 42
}

Caso 6: 720P para economizar custo

{
  "model": "happyhorse-1.0",
  "prompt": "Waves crashing on the beach at sunset",
  "resolution": "720P",
  "size": "16:9",
  "duration": 5
}

Guia de seleção de modo

RequisitoAbordagem recomendada
Gerar vídeo apenas a partir de textoPasse apenas prompt (T2V)
Fazer uma imagem “ganhar vida” (usar como primeiro quadro)Passe first_frame_image (I2V)
Gerar uma nova cena a partir de um conjunto de imagens de referênciaPasse image_urls (1–9, R2V)
Reescrever / reestilizar um vídeo existentePasse video_url (EDIT), combine opcionalmente com image_urls (0–5) como refs de estilo
Economizar custoUse resolution: "720P"

Dicas de uso

  1. Lógica de entrada unificada: os campos de entrada decidem o modo. Note que os três campos de mídia (first_frame_image / image_urls / video_url) são mutuamente exclusivos aos pares
  2. size efetivo apenas em T2V/R2V: nos modos I2V / EDIT, size é ignorado — a proporção de saída é determinada pela mídia de entrada
  3. Duração: 5–10 segundos é o ponto ideal. Muito curto causa movimento truncado; muito longo aumenta significativamente o tempo de processamento upstream
  4. Qualidade da imagem do primeiro quadro: clara, bem composta, sujeito centralizado — melhora significativamente a saída I2V
  5. Escrita do prompt: descreva movimento / câmera / atmosfera (por exemplo, “slow push-in, cinematic, warm tones”) para obter melhores resultados do que descrições puramente estáticas de cena
  6. Vídeo de entrada do EDIT: > 15 segundos será automaticamente truncado pelo upstream de 0 a 15s. Se precisar de outros segmentos, fatie o vídeo você mesmo primeiro
Consultar resultados da tarefaA geração de vídeos é uma tarefa assíncrona que retorna um task_id no envio. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.