Saltar para o conteúdo principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "doubao-seedance-2.0",
    "prompt": "A kitten yawning at the camera",
    "resolution": "720p",
    "size": "16:9",
    "duration": 5,
    "generate_audio": true
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01KMCGF6BQGN3X28H3KSR50X5T"
    }
  ]
}

Autenticação

Authorization
string
obrigatório
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua API Key:Acesse a página de gerenciamento de API Keys para obter sua API KeyAdicione-a ao cabeçalho da requisição:
Authorization: Bearer YOUR_API_KEY

Parâmetros da requisição

model
string
obrigatório
Nome do modelo de geração de vídeoModelos suportados:
  • doubao-seedance-2.0 — versão padrão, suporta texto-para-vídeo, imagem-para-vídeo, vídeo com primeiro/último frame, vídeo de referência, áudio de referência e vídeo com áudio
  • doubao-seedance-2.0-fast — versão rápida, com os mesmos recursos da versão padrão e maior velocidade de geração
  • doubao-seedance-2.0-face — suporta upload de pessoa real, com os mesmos recursos da versão padrão
  • doubao-seedance-2.0-fast-face — suporta upload de pessoa real, com os mesmos recursos da versão rápida
prompt
string
Descrição do conteúdo do vídeoObrigatório para texto-para-vídeo; opcional para imagem-para-vídeo ou vídeo a partir de vídeo de referênciaRecomenda-se especificar claramente o sujeito, a ação, o movimento de câmera e o estilo para obter melhores resultados de geração
O prompt é limitado a 4000 caracteres, mas o recomendado são 500 caracteres.
Exemplo: "A kitten yawning at the camera"
duration
integer
padrão:"5"
Duração do vídeo (segundos)Faixa suportada: 4 a 15 segundosPadrão: 5
size
string
padrão:"16:9"
Proporção do vídeoOpções:
  • 16:9 — paisagem
  • 9:16 — retrato
  • 1:1 — quadrado
  • 4:3 — proporção tradicional
  • 3:4 — proporção tradicional vertical
  • 21:9 — ultrawide
  • adaptive — adaptativa (corresponde automaticamente à imagem/vídeo de entrada)
Padrão: 16:9
resolution
string
padrão:"480p"
Resolução do vídeoOpções:
  • 480p — definição padrão
  • 720p — alta definição
  • 1080p — Full HD (suportado apenas por doubao-seedance-2.0-face e doubao-seedance-2.0)
Padrão: 480p
seed
integer
Seed aleatória para controlar a aleatoriedade do conteúdo gerado
  • Para a mesma requisição, valores de seed diferentes produzirão resultados diferentes
  • Para a mesma requisição, o mesmo valor de seed produzirá resultados semelhantes, mas não há garantia de consistência exata
generate_audio
boolean
padrão:"false"
Se deve gerar áudio (vídeo com áudio)Quando definido como true, o vídeo incluirá áudio gerado por IA acompanhando-oPadrão: false
return_last_frame
boolean
padrão:"false"
Se deve retornar a imagem do último frameQuando definido como true, o resultado da tarefa retornará adicionalmente a URL da imagem do último frame do vídeo, que pode ser usada para geração contínua de vídeoPadrão: false
tools
array<object>
Lista de ferramentas para recursos adicionais, como busca na webExemplo: [{"type": "web_search"}]
image_urls
array<string>
Array de URLs de imagem para imagem-para-vídeoSuporta dois formatos:
  • URL de imagem comum: https://example.com/cat.jpg
  • Asset URL (asset aprovado): asset://asset_a
Exemplo: ["https://example.com/cat.jpg"] ou ["asset://asset_a"]
Asset URL é suportado apenas pelos modelos doubao-seedance-2.0 e doubao-seedance-2.0-fast. Outros modelos não o suportam.
  • image_urls e image_with_roles não podem ser usados simultaneamente
  • Máximo de 9 imagens de referência
image_with_roles
array
Array de imagens com papéis, permite especificar primeiro frame/último frame
Quando o campo url usa uma Asset URL, apenas os modelos doubao-seedance-2.0 e doubao-seedance-2.0-fast são suportados. Outros modelos não o suportam.
Exemplo:
[
  {"url": "https://example.com/day.jpg", "role": "first_frame"},
  {"url": "https://example.com/night.jpg", "role": "last_frame"}
]
Formato Asset URL:
[
  {"url": "asset://asset_a", "role": "reference_image"}
]
  • image_urls e image_with_roles não podem ser usados simultaneamente
  • Ao usar imagens de primeiro/último frame, video_urls e audio_urls não estão disponíveis
video_urls
array<string>
Array de URLs de vídeo de referênciaSuporta dois formatos:
  • URL de vídeo comum: https://example.com/reference.mp4
  • Asset URL (asset aprovado): asset://asset_a
Exemplo: ["https://example.com/reference.mp4"] ou ["asset://asset_a"]
Asset URL é suportado apenas pelos modelos doubao-seedance-2.0 e doubao-seedance-2.0-fast. Outros modelos não o suportam.
  • Ao usar imagens de primeiro/último frame (image_with_roles), vídeos de referência não estão disponíveis
  • Máximo de 3 vídeos de referência, com duração total de até 15s
  • A resolução do vídeo de referência deve estar entre 480P e 720P
  • Os vídeos de referência não devem conter pessoas reais
audio_urls
array<string>
Array de URLs de áudio de referênciaSuporta dois formatos:
  • URL de áudio comum: https://example.com/speech.wav
  • Asset URL (asset aprovado): asset://asset_a
Exemplo: ["https://example.com/speech.wav"] ou ["asset://asset_a"]
Asset URL é suportado apenas pelos modelos doubao-seedance-2.0 e doubao-seedance-2.0-fast. Outros modelos não o suportam.
  • Ao usar imagens de primeiro/último frame (image_with_roles), áudio de referência não está disponível
  • Máximo de 3 arquivos de áudio de referência, com duração total de até 15s
  • O áudio de referência deve ser usado junto com imagens de referência ou vídeos de referência

Resposta

code
integer
Código de status da resposta, 200 em caso de sucesso
data
array
Array de dados da resposta

Casos de uso

Caso 1: Texto-para-vídeo

{
  "model": "doubao-seedance-2.0",
  "prompt": "A kitten yawning at the camera",
  "resolution": "720p",
  "size": "16:9",
  "duration": 5,
  "seed": 42,
  "generate_audio": true
}

Caso 2: Imagem-para-vídeo (primeiro frame)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten stands up and walks toward the camera",
  "image_urls": ["https://example.com/cat.jpg"],
  "duration": 5
}

Caso 3: Vídeo com primeiro/último frame

{
  "model": "doubao-seedance-2.0",
  "prompt": "Transition from day to night",
  "image_with_roles": [
    {"url": "https://example.com/day.jpg", "role": "first_frame"},
    {"url": "https://example.com/night.jpg", "role": "last_frame"}
  ],
  "duration": 5
}

Caso 4: Vídeo a partir de vídeo de referência

{
  "model": "doubao-seedance-2.0",
  "prompt": "Convert the video style to anime style",
  "video_urls": ["https://example.com/reference.mp4"]
}

Caso 5: Vídeo de referência + áudio de referência

{
  "model": "doubao-seedance-2.0",
  "prompt": "A scene of a person speaking",
  "video_urls": ["https://example.com/reference.mp4"],
  "audio_urls": ["https://example.com/speech.wav"],
  "size": "16:9",
  "duration": 11
}

Caso 6: Vídeo com áudio

{
  "model": "doubao-seedance-2.0",
  "prompt": "A man stops a woman and says: \"Remember, you must never point your finger at the moon.\"",
  "generate_audio": true
}

Caso 7: Geração contínua de vídeo (retornar último frame)

{
  "model": "doubao-seedance-2.0",
  "prompt": "The kitten continues walking toward the camera",
  "image_urls": ["https://example.com/last_frame_from_prev.png"],
  "return_last_frame": true
}

Caso 8: Geração com a versão rápida

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "City nightscape timelapse photography",
  "size": "21:9",
  "duration": 8
}

Caso 9: Imagens de referência + vídeo de referência + áudio de referência (vídeo multimodal)

Combine imagens de referência, vídeo de referência e áudio de referência para gerar um vídeo publicitário imersivo em perspectiva em primeira pessoa. Ideal para divulgação de produtos, anúncios de marca e outros cenários que exigem a fusão de múltiplas fontes de material.
{
  "model": "doubao-seedance-2.0",
  "prompt": "Use video 1's first-person perspective throughout, and use audio 1 as the background music throughout. First-person POV fruit tea advertisement for seedance brand 'Peace Apple' apple fruit tea limited edition. First frame is image 1: your hand picks a dewy Aksu red apple with a crisp apple collision sound. 2-4s: quick cut, your hand drops apple chunks into a shaker cup, adds ice and tea base, shakes vigorously, ice collision and shaking sounds sync with upbeat drum beats, background voice: 'Fresh-cut, fresh-shaken'. 4-6s: first-person close-up of the finished product, layered fruit tea poured into a clear cup, your hand gently squeezes cream cap spreading on top, sticks a pink label on the cup, camera zooms in on the layered texture of cream cap and fruit tea. 6-8s: first-person handheld cup raise, you lift the fruit tea from image 2 toward the camera (simulating handing it to the viewer), cup label clearly visible, background voice 'Take a sip of freshness', final frame freezes on image 2. Background voice consistently uses a female tone.",
  "image_urls": [
    "https://example.com/tea_pic1.jpg",
    "https://example.com/tea_pic2.jpg"
  ],
  "video_urls": ["https://example.com/tea_video1.mp4"],
  "audio_urls": ["https://example.com/tea_audio1.mp3"],
  "generate_audio": true,
  "size": "16:9",
  "duration": 11
}

Caso 10: Imagem-para-vídeo com Asset URL

Assets de avatar virtual aprovados podem ser passados diretamente como imagens de referência, sem necessidade de novo upload ou nova revisão.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character walks naturally on a city street under bright sunshine",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Caso 11: Especificar retrato de referência com Asset URL (image_with_roles)

{
  "model": "doubao-seedance-2.0",
  "prompt": "Using the reference portrait, the character walks elegantly toward the camera",
  "image_with_roles": [
    {
      "url": "asset://asset_a",
      "role": "reference_image"
    }
  ],
  "resolution": "720p",
  "duration": 5
}

Caso 12: Versão rápida + Asset URL imagem-para-vídeo

{
  "model": "doubao-seedance-2.0-fast",
  "prompt": "The character strolls in a park with a gentle breeze",
  "image_urls": ["asset://asset_a"],
  "duration": 5,
  "resolution": "720p"
}

Caso 13: Imagem com Asset URL + vídeo de referência (transferência de movimento)

Combine um asset de retrato aprovado com um vídeo de referência para fazer o personagem executar os movimentos especificados.
{
  "model": "doubao-seedance-2.0",
  "prompt": "The character dances to the rhythm of the reference video with smooth and natural movements",
  "image_urls": ["https://example.com/dance_reference.jpg", "asset://asset_a"],
  "video_urls": ["https://example.com/dance_reference.mp4", "asset://asset_a"],
  "duration": 8,
  "resolution": "720p"
}
Consultar resultados da tarefaA geração de vídeo é uma tarefa assíncrona que retorna um task_id ao ser enviada. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.

Diferenças em relação à versão 1.5 Pro

Recurso1.5 Pro2.0 / 2.0 fast
Resolução480p/720p/1080p480p/720p
Faixa de duração4-12s5-15s
Duração padrão5s5s
Parâmetro de proporçãoaspect_ratiosize (nova opção adaptive)
Geração de áudioparâmetro audioparâmetro generate_audio
Vídeo de referênciaNão suportadoSuportado via video_urls
Áudio de referênciaNão suportadoSuportado via audio_urls
Imagem-para-vídeoimage_urls / image_with_rolesimage_urls / image_with_roles
Vídeo com áudioNão suportadoSuportado via generate_audio
Vídeo contínuoNão suportadoSuportado via return_last_frame
Versão rápidaNão suportadoSuportado via doubao-seedance-2.0-fast