第一个
字节发布 AI 视频生成神器:Goku
字节跳动与香港大学联合开源的视频生成项目 Goku(悟空)是一款基于流动(Rectified Flow)Transformer 架构的先进 AI 视频生成模型,通过文本或图像直接生成高质量视频内容,尤其在虚拟数字人和广告场景中表现突出。
此外,字节还推出了 Goku+,这是一个基于 Goku 的广告视频生成模型,专门用于生成真人出镜的口播广告视频和产品广告宣传片。不过目前只发布了论文,这个模型大概率不会开源?
核心功能
① 文本/图像生成视频:支持生成动画、自然风光、动物行为等多种场景,视频长度可达20秒以上,画面连贯稳定。

第二个
开源卖货主播大模型 Streamer-Sales

第三个
浙大×字节开源 MimicTalk
浙江大学与字节跳动联合开源的 MimicTalk 项目,15 分钟极速生成 3D 说话人脸的能力,效果还行!


青争开放社区所有资源仅供学习交流使用请勿商业运营,严禁从事违法,侵权等任何非法活动,否则后果自负!

© 版权声明
THE END
暂无评论内容