当前位置:首页 > 报告详情

刘洋《QQ浏览器视频搜索中的多模态技术》.pdf

上传人: s**** 编号:157228 2024-03-16 21页 4.96MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了腾讯QQ浏览器视频搜索中的多模态技术,由腾讯QB视频搜索负责人Jelmeliu(刘洋)介绍。文章指出,视频搜索面临新的挑战,需要跨模态检索和多模态理解。视频封面、视频内容帧、OCR/ASR等技术在视频搜索中具有重要信息增益。视频搜索架构包括数据层、表征层、匹配层和应用层。文章详细介绍了视频封面、视频内容帧、视频感知域、视频融合域等多模态技术的应用,并提出了后续技术展望,如多模态LLM模型在搜索业务的应用、单流匹配模型的落地应用、知识增强的多模态匹配技术的落地应用等。
"腾讯QQ浏览器如何利用多模态技术提升视频搜索效果?" "视频搜索中的多模态融合技术有哪些最新进展?" "如何通过技术手段提升视频搜索结果的相关性和用户体验?"
客服
商务合作
小程序
服务号
折叠