Wan2.6
wan2.6-i2v-flash Image-to-Video
- Modelo rápido de image-to-video do Wanxiang 2.6
- Gera vídeo fluido a partir de imagem do primeiro quadro e prompts de texto
- Suporta alternância entre áudio/silêncio, narração com múltiplas tomadas e áudio personalizado
- Suporta resolução 720p/1080p, duração de 2 a 15 segundos
- Suporta templates de efeitos de vídeo
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autenticação
Todos os endpoints exigem autenticação via Bearer TokenObtenha a chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione ao cabeçalho da requisição:
Parâmetros da requisição
Nome do modelo de geração de vídeo, fixo como
wan2.6-i2v-flashArray de URLs de imagens de referência (apenas 1 imagem do primeiro quadro suportada)Suporta URLs de imagens publicamente acessíveis ou codificação Base64 (
data:image/png;base64,...)Exemplo: ["https://example.com/image.jpg"]Requisitos de imagem:
- Formato: JPEG, JPG, PNG (sem transparência), BMP, WEBP
- Resolução: intervalo de largura/altura 240-8000 pixels
- Tamanho: ≤ 10MB
Descrição do conteúdo do vídeoOpcional, mas recomendado para image-to-video, descreve as ações e os efeitos esperadosEspecifique claramente sujeito, ação, câmera e estilo para obter melhores resultadosExemplo:
"The person in the image smiles and waves, camera slowly zooms in"Prompt negativo, descreve conteúdo indesejadoMáximo de 500 caracteresExemplo:
"blurry, low quality, distorted"Resolução do vídeoOpções:
720p- HD1080p- FHD (padrão)
1080pA resolução afeta diretamente o preço, 1080p é mais caro que 720p. A proporção é determinada pela imagem de entrada.
Duração do vídeo (segundos)Intervalo suportado:
2 a 15 segundos (inteiro)Padrão: 5Se deve gerar áudioDefinido como
true: gera automaticamente música de fundo/efeitos sonoros correspondentes (padrão)Definido como false: gera vídeo silenciosoPadrão: trueNão suportado quando o modelo é
wan2.6-i2v.URL de áudio personalizado (wav/mp3, 3-30 segundos, ≤ 15MB)Prioridade menor que
audio: ignorado quando audio=falseSe o áudio for mais longo que a duração do vídeo, ele será cortado; se for mais curto, a parte restante ficará silenciosaSe deve ativar a reescrita inteligente do promptMelhora significativamente os resultados para prompts mais curtos, mas aumenta o tempo de processamentoPadrão:
trueTipo de tomada, requer
prompt_extend=trueOpções:single- Tomada única (padrão), gera um vídeo contínuo de tomada únicamulti- Múltiplas tomadas, gera um vídeo narrativo com múltiplas transições de tomada
shot_type tem prioridade maior que prompt. Mesmo que o prompt mencione “multi-shot”, definir single ainda resultará em uma única tomada.Seed aleatório (≥0), especificar o mesmo seed pode reproduzir resultados semelhantesExemplo:
12345Se deve adicionar uma marca d’água “AI Generated” (canto inferior direito)Padrão:
falseControle de áudio
| Combinação de parâmetros | Resultado |
|---|---|
Sem audio ou audio_url | Áudio gerado automaticamente (padrão) |
audio_url: "https://..." | Usa o áudio especificado |
audio: false | Vídeo silencioso |
audio: false + audio_url: "..." | Vídeo silencioso (audio tem prioridade maior) |
Resposta
Código de status da resposta, 200 em caso de sucesso
Array de dados da resposta
Casos de uso
Caso 1: Requisição mínima
Caso 2: Parâmetros completos
Caso 3: Áudio personalizado
Caso 4: Vídeo silencioso
Caso 5: Template de efeito
Caso 6: Imagem Base64
Consultar resultados da tarefaA geração de vídeos é uma tarefa assíncrona que retorna um
task_id no envio. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.