SkyReels V4
Geração de Vídeo SkyReels V4
- Dois níveis de modelo: Fast (otimizado para velocidade) e Std (otimizado para qualidade)
- Três modos roteados automaticamente por campos da requisição: Text-to-Video (T2V), Image-to-Video (I2V), Multimodal Reference (Omni)
- Resolução 480p / 720p / 1080p, duração de 3 a 15 segundos
- Recursos avançados: primeiro/último/quadro-chave, imagens de referência, vídeos de referência, colagem em grade, extensão de vídeo, sincronização de áudio
- Modo de processamento assíncrono, retorna um ID de tarefa para consulta posterior
POST
Documentation Index
Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorização
Todos os endpoints da API exigem autenticação via Bearer TokenObtenha sua chave de API:Acesse a página de gerenciamento de chaves de API para obter sua chave de APIAdicione ao cabeçalho da requisição:
Modos de geração
O SkyReels V4 roteia automaticamente para o modo correto com base nos campos da requisição — nenhum campomode é necessário:
| Modo | Acionamento | Capacidade |
|---|---|---|
| T2V (Text-to-Video) | Apenas prompt + campos gerais | Geração orientada puramente por texto |
| I2V (Image-to-Video) | Qualquer um de first_frame_image / end_frame_image / mid_frame_images | Controle do primeiro/último/quadro-chave |
| Omni (Multimodal Reference) | Qualquer um de ref_images / ref_videos | Referência de personagem, colagem em grade, referência de movimento, extensão de vídeo, sincronização de áudio |
Mecanismo
@tag: ao usar mid_frame_images / ref_images / ref_videos, cada elemento deve declarar uma tag começando com @ (por exemplo, @image1, @Actor-1, @video1), e a tag deve aparecer no prompt.Pense no prompt como o “roteiro” e na tag como um “ponteiro de personagem” para ativos específicos (imagens / vídeos). Por exemplo, um prompt como "@Actor-1 walks into the scene of @video1" instrui o sistema a injetar o sujeito da imagem de referência vinculada a @Actor-1 e a referência de movimento vinculada a @video1 no processo de geração.Parâmetros da requisição
Campos gerais
Dois níveis de modelo estão disponíveis:
| Modelo | Posicionamento | Casos de uso |
|---|---|---|
skyreels-v4-fast | Velocidade em primeiro lugar | Pré-visualizações rápidas, geração em lote, conteúdo diário |
skyreels-v4-std | Qualidade em primeiro lugar (preço 25~30% maior que Fast) | Tomadas-chave, requisitos de alto detalhe, entrega formal |
Prompt de texto, máximo de 1280 tokensDescreva cenas, sujeitos, ações e estilos em detalhes para obter melhores resultados de geração.Ao usar
ref_images / ref_videos / mid_frame_images, o prompt deve conter a @tag correspondente (por exemplo, @Actor-1, @video1, @image1).Exemplo: "@Actor-1 walks through a neon-lit street at night."Duração do vídeo de saída (segundos)
- Intervalo:
[3, 15] - Padrão:
5
Resolução do vídeoOpções:
480p720p1080p(padrão)
Proporção de telaOpções:
16:9(padrão)4:31:19:163:4
Se deve otimizar automaticamente o promptQuando ativado, o sistema otimiza automaticamente seu prompt para obter melhores resultados de geração.
Campos específicos do I2V
URL da imagem do primeiro quadro (jpg / jpeg / png / gif / bmp)Quando fornecida, esta imagem é usada como o quadro inicial do vídeo.
URL da imagem do último quadro (jpg / jpeg / png / gif / bmp)Quando fornecida, esta imagem é usada como o quadro final do vídeo. Pode ser combinada com
first_frame_image para controle do primeiro e do último quadro.Lista de quadros-chave intermediários, até 6. Cada elemento tem a seguinte estrutura:
Campos específicos do Omni
Lista de imagens de referência (todos os elementos devem compartilhar o mesmo
type). Cada elemento tem a seguinte estrutura:Lista de vídeos de referência, até 1. Cada elemento tem a seguinte estrutura:
Cenários suportados
Os cenários a seguir são suportados por ambosskyreels-v4-fast e skyreels-v4-std:
| Cenário | Modo | Campos obrigatórios | Caso de uso típico |
|---|---|---|---|
| Text-to-Video | T2V | prompt | Orientado por texto puro, tomadas conceituais rápidas |
| Image-to-Video - Primeiro quadro | I2V | first_frame_image | De imagem para vídeo com um quadro inicial especificado |
| Image-to-Video - Último quadro | I2V | end_frame_image | Especifica o quadro de encerramento |
| Image-to-Video - Quadros-chave | I2V | mid_frame_images (1 ~ 6) | Primeiro + último + quadros-chave intermediários para ritmo preciso |
| Omni Single/Multi-Subject | Omni | ref_images (type=image) | Consistência de personagem, enquadramento de múltiplos sujeitos |
| Omni Grid Collage | Omni | ref_images (type=grid, 1 imagem) | Vídeos de processo passo a passo (tutoriais, receitas, demos) |
| Omni Motion Reference | Omni | ref_videos (type=reference) | Replicar o movimento, sujeito ou estilo de um vídeo de referência |
| Omni Video Extension | Omni | ref_videos (type=extend) | Continuar um vídeo existente com novo conteúdo |
| Omni Audio Sync | Omni | ref_images (type=image) + audio_url | Narração de humano digital, lip-sync orientado por áudio |
Restrições de parâmetros
Violar qualquer um dos seguintes fará com que a requisição seja rejeitada com uma resposta 422, sem cobrança:| Parâmetro | Restrição |
|---|---|
prompt | Máximo de 1280 tokens |
duration | [3, 15] segundos; sobrescrito pela duração do vídeo de referência (máx 10s) quando ref_videos.type=reference |
resolution | Apenas 480p / 720p / 1080p |
aspect_ratio | 16:9 / 4:3 / 1:1 / 9:16 / 3:4; ignorado em I2V; ignorado quando Omni carrega ref_videos |
mid_frame_images | Até 6; time_stamp deve ser -1 ou estar dentro de (0, duration) |
ref_images geral | Todos os elementos devem compartilhar o mesmo type; não pode coexistir com campos I2V |
ref_images.type=grid | Comprimento da lista deve ser = 1; image_urls deve ser 1 imagem |
ref_images.type=image | Comprimento da lista 1 ~ 3; cada image_urls com comprimento 1 ~ 5 |
ref_images.audio_url | Suportado apenas quando type=image, áudio ≤ 15 segundos |
ref_videos | Até 1; video_url MP4 / MOV, ≤ 15 segundos |
ref_videos.type=reference | Sobrescreve a duration solicitada (máx 10s), pode combinar com ref_images.type=image, carrega o áudio do vídeo de entrada por padrão |
ref_videos.type=extend | Cobrado pela duration solicitada; não pode combinar com ref_images |
Campo tag | Deve começar com @ e aparecer no prompt |
| Exclusão I2V / Omni | Campos I2V e campos Omni não podem ser usados juntos |
Resposta
Código de status da resposta, 200 em caso de sucesso
Array de dados da resposta
Exemplos de requisição
Caso 1: Texto para vídeo (Mínimo)
Caso 2: Texto para vídeo (Parâmetros completos)
Caso 3: Imagem para vídeo - Primeiro quadro
Caso 4: Imagem para vídeo - Primeiro/Último quadro + quadros-chave intermediários
Caso 5: Omni - Referência de sujeito único
Caso 6: Omni - Múltiplos sujeitos + referência de movimento por vídeo
Caso 7: Omni - Colagem em grade
Caso 8: Omni - Extensão de vídeo (extend)
Caso 9: Omni - Sincronização de áudio (orientada por voz)
Consultar resultados da tarefaA geração de vídeos é uma tarefa assíncrona que retorna um
task_id no envio. Use o endpoint Obter status da tarefa para consultar o progresso e os resultados da geração.