Wan2.7
Wan2.7-R2V Reference-to-Video
- Modelo reference-to-video do Alibaba Cloud Wanxiang 2.7
- Gera um novo vídeo com estilo, personagens e cenas consistentes com base em uma ou mais imagens/vídeos de referência
- Suporta consistência de personagem, transferência de estilo e combinação de múltiplos ativos
- Suporta voz de referência (reference_voice) para controlar a voz do personagem
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorização
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione ao cabeçalho da requisição:
Parâmetros da requisição
Nome do modelo de geração de vídeo, fixo como
wan2.7-r2vDescrição do conteúdo do vídeo, até 5000 caracteresPara múltiplas imagens/vídeos, use “image 1”, “image 2”, “video 1”, etc. para referenciar os ativos de referência correspondentes (na ordem de entrada)Exemplo:
"The character in image 1 enters the scene in image 2 and looks around"Array de imagens com papéis; pelo menos um entre este e
video_urls deve ser fornecidoCampos de cada objeto:url(string): URL da imagemrole(string): papel da imagemreference_image- imagem de referência (padrão)first_frame- primeiro quadro especificado (quando fornecido,sizeé ignorado e a proporção segue a imagem do primeiro quadro)
reference_voice(string, opcional): URL do áudio de amostra de voz para esse personagem de referência, usado para controlar a voz do personagem no vídeo gerado
Array de URLs de vídeos de referência, até 5 vídeos (total de imagens + vídeos ≤ 5)Pelo menos um entre este e
image_with_roles deve ser fornecidoRestrições do vídeo:
- Formato: mp4, mov
- Duração: 1–30s
- Resolução: largura e altura no intervalo [240, 4096] pixels
- Proporção: 1:8 – 8:1
- Tamanho do arquivo: até 100MB
Prompt negativo que descreve conteúdo indesejado, até 500 caracteres
Resolução do vídeoOpções:
720P- Padrão1080P- Alta definição (padrão)
Duração do vídeo (segundos)Intervalo suportado:
2 ~ 15 segundosPadrão: 5Proporção de telaFormatos suportados:
16:9- Paisagem widescreen (padrão)9:16- Retrato1:1- Quadrado4:3- Paisagem3:4- Retrato
Se deve ativar a reescrita inteligente do promptMelhora significativamente os resultados para prompts curtos, mas aumenta o tempo de processamentoPadrão:
trueSe deve adicionar a marca d’água “AI Generated” ao vídeo gerado
true: adicionar marca d’águafalse: sem marca d’água (padrão)
Inteiro de seed usado para controlar a aleatoriedade do conteúdo geradoIntervalo de valores: inteiro
≥0- Para requisições idênticas, o modelo gera resultados diferentes ao receber valores de seed diferentes (por exemplo, omitindo o seed)
- Para requisições idênticas, o modelo gera resultados semelhantes ao receber o mesmo valor de seed, mas a consistência exata não é garantida
Resposta
Código de status da resposta, 200 em caso de sucesso
Array de dados da resposta
Casos de uso
Caso 1: Imagem de referência única (Mais simples)
Caso 2: Múltiplas imagens de referência
Caso 3: Geração com base em vídeo de referência
Caso 4: Primeiro quadro especificado + imagem de referência
Caso 5: Imagem de referência + voz de referência (Precisa)
Regras de referência de imagens
Com múltiplas imagens de referência, use índices numéricos noprompt para referenciá-las:
- 1ª imagem → “image 1” ou “the first image”
- 1º vídeo → “video 1” ou “the first video”
Consultar resultados da tarefaA geração de vídeos é uma tarefa assíncrona que retorna um
task_id no envio. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.