当前位置:首页 > 报告详情

搜狗-刘恺-搜狗多模态合成技术研究及应用 .pdf

上传人: B**** 编号:28674 2021-01-31 38页 11.38MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
搜狗多模态合成技术研究及应用文章主要介绍了搜狗在多模态合成方面的最新研究进展和应用案例。刘恺是搜狗AI交互技术部多模态合成团队的负责人,专家研究员,曾在科大讯飞研究院从事语音合成算法研究,2017年加入搜狗。搜狗的多模态合成技术包括语音合成、语音变声、数字音效、多模态合成等,旨在方便用户高效生成高质量、高表现力的音视频,使机器与人的交互更加生动自然。其中,数字人合成技术备受关注,可输入文本快速生成声音、图像同步的数字人视频。搜狗的AI音视频生成平台“声咖”可帮助创作者高效生成高品质内容,而AI合成主播“新小浩”和“新小萌”已在新闻媒体领域得到应用。此外,数字人还在金融、医疗、司法、教育、直播短视频等多个领域得到应用,可助业务降本增效。
"搜狗多模态合成技术如何让机器表达更丰富?" "如何通过搜狗数字人技术打造个性化虚拟主播?" "搜狗AI合成主播如何提升新闻媒体制作效率?"
客服
商务合作
小程序
服务号
折叠