Kling 3.0 AI视频生成器

Kling 3.0引入了一种全合一的多模态生成框架,具有原生音频、多镜头叙事、更强的主题一致性,以及最长15秒的输出。专业版早期访问现已推出,更多版本即将发布。

文本转视频

提示词
Google Nano BananaKling 3.0
0 / 5000

Kling 3.0的关键特性

统一的多模态视频引擎

Kling 3.0将文本到视频、图像到视频、参考工作流程和编辑操作统一为一个原生多模态模型。这种架构提高了对提示的理解、创意控制和复杂场景中的输出稳定性。

一次生成中的多镜头叙事

Kling VIDEO 3.0可以从提示中解释逐镜头意图,并在一次运行中生成更丰富的电影结构。它支持自定义多镜头叙事和更平滑的过渡,无需手动拼接。

多参考控制下的元素一致性

该模型支持首帧+元素参考,以及在相机移动和场景演变中的更强主题锁定。角色、道具和环境从头到尾保持更一致。

具有角色级语音定位的原生音频

Kling 3.0升级了原生音频,在多角色场景中具有更清晰的发言人分配。它支持中文、英文、日文、韩文和西班牙文,以及方言和口音控制,以生成更真实的对话。

视频中的原生级文本渲染

Kling 3.0改善了场景中的文本生成和保留,帮助保持可读的标识、标签和品牌文案。这对于需要清晰排版的广告创意和产品视频尤其有用。

灵活的3-15秒时长以丰富叙事

与之前的限制相比,Kling 3.0将最大输出时长扩展到15秒,并提供灵活的控制。更长的单次生成使得连续动作和叙事节奏的制作变得更容易。

Kling VIDEO 3.0能力升级

从VIDEO 2.6升级到VIDEO 3.0增加了多镜头控制、更强的参考、多语言原生音频和更长的时长支持。

CapabilityKling VIDEO 2.6Kling VIDEO 3.0

Text-to-Video

Yes

Yes

Image-to-Video

Yes

Yes

开始与结束帧到视频

Yes

Yes

Multi-Shot

No

Yes

元素参考

No

Yes

多角色共指(3+)

No

Yes

多语言本地音频

No

Yes

最大时长

10s

15s

如何使用 Kling 3.0

在三个快速步骤中使用 Kling 3.0 创建电影级 AI 视频

01

选择 Kling 3.0

打开文本到视频或图像到视频,并从模型列表中选择 Kling 3.0。使用仅文本模式创建新场景,或使用图像模式进行受控动画。

02

设置提示和创意控制

描述镜头、相机意图、对话和风格。根据需要添加图像参考以保持主题一致性,然后根据目标输出设置纵横比和时长。

03

生成、审查和导出

运行生成,审查运动/音频一致性,并导出最终剪辑。通过提示优化或参考进行迭代,以改善镜头顺序和角色一致性。

常见问题

了解更多关于 Kling 3.0 和 Kling VIDEO 3.0 Omni 的信息








开始使用 Kling 3.0 创建