第一个
字节发布 AI 视频生成神器:Goku
字节跳动与香港大学联合开源的视频生成项目 Goku(悟空)是一款基于流动(Rectified Flow)Transformer 架构的先进 AI 视频生成模型,通过文本或图像直接生成高质量视频内容,尤其在虚拟数字人和广告场景中表现突出。
此外,字节还推出了 Goku+,这是一个基于 Goku 的广告视频生成模型,专门用于生成真人出镜的口播广告视频和产品广告宣传片。不过目前只发布了论文,这个模型大概率不会开源?
核心功能
① 文本/图像生成视频:支持生成动画、自然风光、动物行为等多种场景,视频长度可达20秒以上,画面连贯稳定。

第二个
开源卖货主播大模型 Streamer-Sales

第三个
浙大×字节开源 MimicTalk
浙江大学与字节跳动联合开源的 MimicTalk 项目,15 分钟极速生成 3D 说话人脸的能力,效果还行!


本站资源均为作者提供和网友推荐收集整理而来,仅供学习和研究使用,请在下载后24小时内删除,谢谢合作!

© 版权声明
THE END
暂无评论内容