当前位置:首页 > 报告详情

朱思语-基于视频生成模型Hallo和Champ的数字人构建.pdf

上传人: 拾亿 编号:751778 2025-07-29 41页 9.09MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了复旦大学教授朱思语在数字人构建领域的相关研究。朱思语教授专注于视频与三维生成模型,发表了60余篇论文,并曾创立3D视觉公司Altizure,后被苹果公司收购。文章围绕数字人的产业背景、技术难点、整体方案、技术实践以及总结与展望展开。 关键点: 1. 数字人技术:涉及生成式应用爆发、主流技术方案VAE、视频扩散模型等。 2. 技术难点:可控视频生成挑战大,难以真实建模三维物理世界,存在外观、几何、运动与动力学等方面的瓶颈。 3. 解决方案:提出MCMat、VideoMV、STAG4D等模型,以及Champ和Hallo系列方法,通过3D参数化控制和音频驱动实现数字人生成。 4. 未来展望:更多3D物理控制条件对齐,发展Video CoT、Geometry、Appearance & Lighting、Motion & Animation等技术。 文章未提供具体的核心数据。
"数字人创作难点是什么?" "如何用Hallo和Champ生成逼真数字人?" "朱思语教授的哪些研究突破值得关注?"
客服
商务合作
小程序
服务号
折叠