> 技术 > AI/人工智能

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧 / 自带音效视频

人阅读 2024-11-08 17:58:12

感谢网友 HH_KK 的线索投递！

11 月 8 日消息，智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5，相比于原有模型，CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力，I2V 模型支持任意尺寸比例，大幅提升图生视频质量及复杂语义理解。　

官方介绍，CogVideoX v1.5 也将同步上线到“清影”平台，并与新推出的 CogSound 音效模型结合，“新清影”将具备如下特性：

质量提升：在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
超高清分辨率：支持生成 10s、4K、60 帧超高清视频。
可变比例：支持任意比例，从而适应不同的播放场景。
多通道输出：同一指令 / 图片可以一次性生成 4 个视频。
带声效的 AI 视频：新清影可以生成与画面匹配的音效。

附开源地址如下：

代码：

https://github.com/thudm/cogvideo

模型：

https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，所有文章均包含本声明。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网 闽ICP备2024036174号-1

联系邮箱：support1012@126.com