Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.5-preview",
    "prompt": "Sunset coastal highway, cinematic shot",
    "size": "16:9",
    "resolution": "720p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

curl --request POST \
  --url https://api.apimart.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "wan2.5-preview",
    "prompt": "Sunset coastal highway, cinematic shot",
    "size": "16:9",
    "resolution": "720p",
    "duration": 5
  }'
{
  "code": 200,
  "data": [
    {
      "status": "submitted",
      "task_id": "task_01J9HA7JPQ9A0Z6JZ3V8M9W6PZ"
    }
  ]
}

Autenticación

Authorization
string
requerido
Todos los endpoints requieren autenticación mediante Bearer TokenObtener API Key:Visite la página de gestión de API Keys para obtener su API KeyAñadir al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEY

Parámetros de la solicitud

model
string
requerido
Nombre del modelo de generación de video, fijado como wan2.5-preview
prompt
string
Descripción del contenido del videoObligatorio para text-to-video (sin image_urls), opcional pero recomendado para image-to-videoDescriba escenas, acciones y estilos en detalle para obtener mejores resultadosEjemplo: "Sunset coastal highway, cinematic shot"
image_urls
array<string>
Array de URLs de imágenes de referencia (solo se admite 1 imagen)Requerido para el modo image-to-video, admite URLs de imágenes accesibles públicamente o codificación Base64 (data:image/png;base64,...)Ejemplo: ["https://example.com/image.jpg"]
El sistema selecciona automáticamente el modo text-to-video o image-to-video según si se incluye image_urls. No envíe image_urls para el modo text-to-video.
negative_prompt
string
Prompt negativo, describe contenido no deseadoMáximo 500 caracteresEjemplo: "blurry, low quality, distorted"
resolution
string
predeterminado:"720p"
Resolución del videoOpciones:
  • 480p - SD, admite size: 16:9, 9:16, 1:1
  • 720p - HD (por defecto), admite size: 16:9, 9:16, 1:1, 4:3, 3:4
  • 1080p - FHD, admite size: 16:9, 9:16, 1:1, 4:3, 3:4
Por defecto: 720p
La resolución afecta directamente al precio: 1080p > 720p > 480p.
480p solo admite las proporciones 16:9, 9:16, 1:1. Pasar 4:3 o 3:4 provocará un error.
duration
integer
predeterminado:"5"
Duración del video (segundos)Solo admite: 5 o 10 segundosPor defecto: 5
size
string
predeterminado:"16:9"
Proporción de aspecto, solo efectiva para text-to-video (sin image_urls)Las opciones dependen de resolution:480p:
  • 16:9 - Paisaje (por defecto)
  • 9:16 - Retrato
  • 1:1 - Cuadrado
720p / 1080p:
  • 16:9 - Paisaje (por defecto)
  • 9:16 - Retrato
  • 1:1 - Cuadrado
  • 4:3 - Paisaje
  • 3:4 - Retrato
Por defecto: 16:9
Para image-to-video, la proporción de aspecto la determina la imagen de entrada. No envíe size, de lo contrario se devolverá un error.
seed
integer
Semilla aleatoria (≥0), especificar la misma semilla puede reproducir resultados similaresEjemplo: 12345
prompt_extend
boolean
predeterminado:"true"
Si se debe activar la reescritura inteligente del promptMejora significativamente los resultados para prompts cortos, pero aumenta el tiempo de procesamientoPor defecto: true
audio
boolean
predeterminado:"true"
Si se debe añadir audio automáticamenteCuando está activado, el sistema generará audio que coincida con el videoPor defecto: true
Este modelo solo admite audio=true. No se admite establecerlo en false para video silencioso.
audio_url
string
URL de audio personalizado (wav/mp3, 3-30 segundos, ≤ 15MB)Si el audio es más largo que la duración del video, será recortado automáticamente; si es más corto, la parte restante quedará en silencio
Requisitos del archivo de audio:
  • Formato: wav, mp3
  • Duración: 3-30 segundos
  • Tamaño: ≤ 15MB
watermark
boolean
predeterminado:"false"
Si se debe añadir una marca de agua “AI Generated” (esquina inferior derecha)Por defecto: false

Combinaciones de resolución y proporción de aspecto

Las combinaciones de size y resolution se asignan a dimensiones de píxeles upstream (solo efectivas para text-to-video):
Proporción de aspectoDescripciónTamaño 480pTamaño 720pTamaño 1080p
16:9Paisaje (por defecto)832×4801280×7201920×1080
9:16Retrato480×832720×12801080×1920
1:1Cuadrado624×624960×9601440×1440
4:3Paisaje-1088×8321632×1248
3:4Retrato-832×10881248×1632
480p solo admite las proporciones 16:9, 9:16, 1:1. Pasar 4:3 o 3:4 provocará un error. 720p y 1080p admiten las 5 proporciones.

Respuesta

code
integer
Código de estado de la respuesta, 200 en caso de éxito
data
array
Array de datos de la respuesta

Casos de uso

Caso 1: Texto a video (simple)

{
  "model": "wan2.5-preview",
  "prompt": "Sunset coastal highway, cinematic shot"
}

Caso 2: Texto a video (parámetros completos)

{
  "model": "wan2.5-preview",
  "prompt": "City night scene, neon lights and rain-soaked streets",
  "negative_prompt": "blurry, low quality, distorted",
  "size": "16:9",
  "resolution": "720p",
  "duration": 5,
  "seed": 12345,
  "prompt_extend": true,
  "audio": true,
  "watermark": false
}

Caso 3: Imagen a video

{
  "model": "wan2.5-preview",
  "prompt": "Cat running on the grass",
  "image_urls": ["https://example.com/cat.jpg"],
  "resolution": "480p",
  "duration": 5
}

Caso 4: Imagen a video (imagen Base64)

{
  "model": "wan2.5-preview",
  "prompt": "Make the cat stand up and walk",
  "image_urls": ["data:image/png;base64,iVBORw0KGgo..."],
  "duration": 5
}

Caso 5: Audio personalizado

{
  "model": "wan2.5-preview",
  "prompt": "Person dancing to the music",
  "image_urls": ["https://example.com/dancer.jpg"],
  "audio_url": "https://example.com/music.mp3",
  "resolution": "720p",
  "duration": 10
}

Descripción de modos

Texto a video (Text-to-Video)

  • El parámetro prompt es obligatorio
  • No envíe image_urls
  • Use size para especificar la proporción de aspecto

Imagen a video (Image-to-Video)

  • El parámetro image_urls es obligatorio (solo se admite 1 imagen)
  • prompt es opcional, se usa para describir las acciones esperadas
  • La proporción de aspecto la determina la imagen de entrada, no envíe size
El sistema selecciona automáticamente el modo según si se incluye image_urls
Consultar resultados de la tareaLa generación de video es una tarea asíncrona que devuelve un task_id al enviarse. Use el endpoint Obtener estado de la tarea para consultar el progreso y los resultados de la generación.