SkyReels V4는 요청 필드에 따라 자동으로 해당 모드로 라우팅됩니다. mode 필드를 지정할 필요가 없습니다:
모드
트리거 조건
기능
T2V(텍스트-비디오)
prompt 및 공통 필드만
순수 텍스트 기반 생성
I2V(이미지-비디오)
first_frame_image / end_frame_image / mid_frame_images 중 하나
첫/끝/키 프레임 제어
Omni(멀티모달 참조)
ref_images / ref_videos 중 하나
주체 참조, 그리드 콜라주, 모션 참조, 비디오 확장, 음성 동기화
엄격한 상호 배타성: I2V 필드(first_frame_image / end_frame_image / mid_frame_images)와 Omni 필드(ref_images / ref_videos)는 동시에 사용할 수 없으며, 위반 시 422를 반환합니다.
@tag 메커니즘: mid_frame_images / ref_images / ref_videos를 사용할 때 각 요소는 @로 시작하는 tag(예: @image1, @Actor-1, @video1)를 선언해야 하며, 해당 tag는 반드시 prompt에 나타나야 합니다.prompt를 “대본”으로, tag를 구체적인 소재(이미지 / 비디오)를 가리키는 “캐릭터 포인터”로 이해할 수 있습니다. 예를 들어 prompt에 "@Actor-1이 @video1 장면에 들어간다"라고 쓰면, 시스템은 @Actor-1에 해당하는 참조 이미지의 주체와 @video1에 해당하는 모션 참조를 생성 과정에 주입합니다.
텍스트 프롬프트, 최대 1280 tokens장면, 주체, 동작, 스타일 등을 자세히 설명하면 더 나은 생성 결과를 얻을 수 있습니다.ref_images / ref_videos / mid_frame_images를 사용할 때 prompt에는 해당하는 @tag(예: @Actor-1, @video1, @image1)가 반드시 포함되어야 합니다.예시: "@Actor-1 walks through a neon-lit street at night."
{ "model": "skyreels-v4-fast", "prompt": "Slowly pull the camera back to reveal the entire scene.", "first_frame_image": "https://example.com/start.png", "duration": 5}
{ "model": "skyreels-v4-fast", "prompt": "The man from @image_1 imitates the move on the left in @video_1. The woman from @image_2 imitates the right side.", "duration": 5, "ref_images": [ { "tag": "@image_1", "type": "image", "image_urls": ["https://example.com/a.png"] }, { "tag": "@image_2", "type": "image", "image_urls": ["https://example.com/b.png"] } ], "ref_videos": [ { "tag": "@video_1", "type": "reference", "video_url": "https://example.com/motion.mp4" } ]}
이 케이스는 ref_videos.type=reference를 사용하므로 요청의 duration은 참조 비디오의 실제 길이로 덮어씌워집니다(상한 10초). 여기서 "duration": 5를 전달해도 최종 비디오 길이는 참조 비디오에 따릅니다.
{ "model": "skyreels-v4-fast", "prompt": "Create a video showing how to make tomato and egg noodles based on @image1.", "ref_images": [ { "tag": "@image1", "type": "grid", "image_urls": ["https://example.com/recipe_grid.png"] } ]}