当前位置:首页 > 报告详情

5-1 腾讯文本理解系统 TexSmart 中的细粒度实体识别关键技术.pdf

上传人: 云闲 编号:102340 2021-01-01 60页 5.52MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯AI Lab高级研究员蒋海云关于文本理解系统TexSmart中的细粒度实体识别关键技术。TexSmart系统能够对中文和英文两种语言的文本进行词法、句法和语义分析。细粒度实体识别是TexSmart系统的特色之一,支持上千种实体类型,类型之间具有层级结构。文章详细介绍了基于知识库的组合方法、基于相似实体推断的远程监督方法和基于多源融合的Zero-shot方法。其中,基于知识库的组合方法通过无监督和有监督的组合方法预测细粒度的类别分布;基于相似实体推断的远程监督方法通过相似实体推断解决歧义问题;基于多源融合的Zero-shot方法通过引入辅助信息,如上下文一致性、类型层级结构和背景知识,提高模型在零样本情况下的细粒度实体识别性能。
腾讯AI Lab的TexSmart系统有哪些特色功能? 细粒度命名实体识别(NER)在实际应用中面临哪些挑战? 基于多源融合的零样本细粒度实体识别方法有哪些创新点?
客服
商务合作
小程序
服务号
折叠