HappyHorse 1.0
HappyHorse 1.0 视频生成
- 阿里云百炼 HappyHorse 1.0 视频生成模型(统一入口,单模型自动路由)
- 根据传入字段自动路由:T2V(仅 prompt)/ I2V(first_frame_image)/ R2V(image_urls)/ EDIT(video_url)
- 支持 720P/1080P 分辨率,3-15 秒任意整数时长
- 仅按分辨率 × 视频秒数计费,与具体能力无关
POST
认证
模式路由
happyhorse-1.0 是文生视频 / 图生视频 / 参考图生视频 / 视频编辑的统一入口,后端根据传入参数自动判断模式,所有模式按统一规则计费(仅按分辨率 × 秒):
| 你传的字段 | 路由到 | 模式说明 |
|---|---|---|
仅 prompt | 文生视频(T2V) | 纯文字描述生成视频 |
prompt + first_frame_image | 图生视频(I2V) | 以图为首帧动起来 |
prompt + image_urls(1~9 张) | 参考图生视频(R2V) | 一组参考图生成全新画面 |
prompt + video_url(可选 image_urls 0~5 张作风格参考 / audio_setting) | 视频编辑(EDIT) | 对源视频进行改写/风格化 |
video_url > first_frame_image > image_urls > 仅 prompt。
字段互斥规则:三个媒体字段(first_frame_image / image_urls / video_url)两两互斥,唯一例外是 video_url + image_urls(EDIT 模式 + 参考图)是合法组合。同时传两个互斥字段会返回 400 mixed_media_not_allowed。
请求参数
视频生成模型名称,固定为
happyhorse-1.0视频内容描述,最多 2500 字符,不能包含特殊 token
- T2V / R2V / EDIT 模式:必填
- I2V 模式:可选,但建议填写以指导运镜和动作
"一个小女孩走在路上,电影感画面"首帧图片,触发 I2V(图生视频)。支持 URL 或 base64(
data:image/<mime>;base64,<payload>,网关自动转储到 OSS)与 image_urls / video_url 互斥首帧图片要求:
- 格式:JPEG / JPG / PNG / BMP / WEBP
- 短边像素:≥ 300px
- 宽高比:
1:2.5 ~ 2.5:1 - 大小:≤ 10MB
图片数组:
- R2V 模式(仅传
image_urls):1~9 张,作为主体/风格参考生成全新画面 - EDIT 模式(同时传
video_url):0~5 张,作为风格参考图
first_frame_image 互斥;可与 video_url 同时使用参考图要求:
- 格式:JPEG / JPG / PNG / BMP / WEBP
- 短边像素:推荐 ≥ 720p
- 宽高比:短边 / 长边 ≥ 0.4
- 大小:≤ 10MB
- 数量:R2V 必须 1~9 张;EDIT 最多 5 张
源视频 URL,触发 EDIT(视频编辑)。暂不支持 base64,请提供 HTTP/HTTPS 直链与
first_frame_image 互斥;可与 image_urls(≤ 5 张)同时使用源视频要求:
- 时长:3 ~ 60 秒(> 15s 上游自动从 0 截到 15s)
- 分辨率:最小 480p,短边 ≥ 360
- 宽高比:
1:8 ~ 8:1 - 格式:MP4 / MOV(建议 H.264 编码)
- 帧率:> 8 fps
- 大小:≤ 100MB
音频设置,仅 EDIT 模式生效(必须同时传
video_url)可选值:auto- 自动生成音频(默认)origin- 保留原视频音轨
视频分辨率(影响计费)可选值:
720P- 标清1080P- 高清(默认)
视频时长(秒,影响计费)支持范围:
3 ~ 15 的任意整数默认值:5画面宽高比支持的格式:
16:9- 横版宽屏(默认)9:16- 竖版长屏1:1- 正方形4:3- 横版3:4- 竖版
是否在生成的视频上添加水印
true:添加水印false:不添加水印(默认)
随机种子,用于控制生成内容的随机性取值范围:
[0, 2147483647],省略则随机- 相同的请求下,模型收到不同的 seed 值(如:不指定 seed 值),将生成不同的结果
- 相同的请求下,模型收到相同的 seed 值,会生成类似的结果,但不保证完全一致
响应
响应状态码,成功时为 200
返回数据数组
使用场景
场景 1:文生视频 T2V(最简请求)
场景 2:文生视频 T2V(完整参数)
场景 3:图生视频 I2V(first_frame_image)
场景 4:参考图生视频 R2V(多张参考图)
场景 5:视频编辑 EDIT(保留原音轨 + 风格参考)
场景 6:720P 节省额度
模式选择建议
| 需求 | 推荐方式 |
|---|---|
| 纯文字描述生成视频 | 仅传 prompt(T2V) |
| 让图片”动起来”(以图为首帧) | 传 first_frame_image(I2V) |
| 用一组参考图生成全新画面 | 传 image_urls(1~9 张,R2V) |
| 对已有视频改写 / 风格化 | 传 video_url(EDIT),可叠加 image_urls 0~5 张做风格参考 |
| 节省额度 | 指定 resolution: "720P" |
使用建议
- 统一入口逻辑:根据传入字段自动路由模式,注意三个媒体字段(
first_frame_image/image_urls/video_url)两两互斥 - size 仅 T2V/R2V 生效:I2V / EDIT 模式下
size会被忽略,输出宽高比由输入媒体决定 - 时长建议:5~10 秒为甜点区,过短动作不连贯,过长上游耗时显著增加
- 首帧图片质量:清晰、构图明确、主体居中,能显著提升 I2V 效果
- prompt 写作:描述运动 / 镜头 / 氛围(如 “缓慢推近、电影感、暖色调”),比单纯描述静态场景效果更好
- EDIT 输入视频:> 15 秒会被上游自动从 0 秒截取到 15 秒,需要其他片段请先自行切片
查询任务结果视频生成为异步任务,提交后会返回
task_id。使用 获取任务状态 接口查询生成进度和结果。