> 技术 > AI/人工智能

字节跳动 OmniHuman 多模态视频生成模型即将上线,图片 音频便可生成视频

人阅读 2025-02-07 17:57:55

2 月 7 日消息,据第一财经报道,字节跳动旗下一站式 AI 创作平台即梦 AI 将上线多模态视频生成模型 OmniHuman,仅需一张图片与一段音频便可生成一条 AI 视频,该模型为字节自研闭源模型。

即梦 AI 相关负责人透露,该模型未来会进行小范围内测,官方也会对这一功能设置严格的安全审核机制,并对输出的视频标注水印以作提醒。

注意到,字节跳动的研究人员近日展示了一款 AI 模型,可以通过一张图片和一段音频生成半身、全身视频。字节跳动表示,和一些只能生成面部或上半身动画的深度伪造技术不同,OmniHuman-1 能够生成逼真的全身动画,且能将手势和面部表情与语音或音乐精准同步。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

LOT物联网

iot产品 iot技术 iot应用 iot工程

Powered By LOT物联网  闽ICP备2024036174号-1

联系邮箱:support1012@126.com