当前位置:首页 > 报告详情

美团:2022美团技术年货——算法系列(430页).pdf

上传人: 三*** 编号:112735 2023-01-16 430页 32.87MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了美团视觉智能部在多媒体和计算机视觉领域顶级会议ACM MM和ECCV上发表的8篇论文。这些论文涵盖了内容生产、内容分发、用户互动、商业化变现等多个内容领域的智能科技。主要内容包括: 1. 弱监督语义分割:提出了一种新的损失函数,通过为前景和背景像素分配不同的优化方向来提高它们之间的特征差异性,实现了更加清晰的伪标签物体轮廓。 2. 图像描述生成:提出了一种高效未来信息建模方法,通过自回归和非自回归图像描述模型的联合训练,实现了对全局上下文的有效利用。 3. 单阶段全景指代分割:提出了一种单阶段端到端像素短语匹配网络,通过直接将每个短语与其对应的像素匹配并简单的组合输出全景分割。 4. 视频文本检索:提出了一种基于注意力的概念传播网络框架,通过引入概念层级的信息,在内容层面匹配的基础上引入了语义层面的匹配。 5. 开放词汇目标检测:提出了一种两阶段的开放词汇目标检测器,使用来自预训练视觉语言模型的文本编码器对类别无关的物体提议区域进行分类。 6. 图像文本匹配:提出了一种反事实匹配方法,用于更加有效的匹配关系挖掘,与三种最先进的图像文本匹配模型结合起来进行评估。 7. 零样本视频分类:提出了一种基于网络知识的属性构建方法和属性-类别关系挖掘方法,通过所挖掘的属性以及外部知识,采用图神经网络学习视觉特征到类别的映射。 8. Vision Transformer的高精度后量化算法:提出了一种名为APQ-ViT的方法,通过引入底部误差消除的逐块校准策略,基于块层面感知量化误差,减少量化对最终输出的影响。
视觉AI如何助力内容生产? 图像文本匹配技术有何应用? 模型压缩技术如何提升内容分发效率?
客服
商务合作
小程序
服务号
折叠