《多语言事件关联分析及观点挖掘研究-余正涛-2.pdf》由会员分享,可在线阅读,更多相关《多语言事件关联分析及观点挖掘研究-余正涛-2.pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、多语言事件关联分析及观点挖掘研究多语言事件关联分析及观点挖掘研究 余正涛 2020年9月6日 昆明理工大学 目 录 研究背景1 多语言知识图谱构建2 多语言文本语义表征3 多语言事件分析及观点挖掘4 研究趋势5 研究背景 国家之间的交流日益密切,共同关注的事件越来越多。及时 获取不同国家的事件信息,把握不同国家的事件动态及事件 间的关联关系,掌握不同国家对同一事件的观点,对于促进 国际交流合作有着非常重要的意义。 研究难点 多语言知识稀缺 单语事件分析:面向单语言的 热点事件发现、跟踪、分析及 预测等任务,已形成较为完善 的事件分析系统。 跨语言事件分析:面向高资源 语言的跨语言事件分析已有相
2、 关研究。 1.多语言知识稀缺:如何构建多语言知识图 谱,为多语言事件分析等任务提供知识支 撑。 2.多语言文本语义理解困难:低资源语言翻 译技术不成熟,如何实现语义空间对齐是 难点。 3.多语言语料稀缺:面向东南亚等资源稀缺 语言开展事件分析和观点挖掘面临标注语 料稀缺,有效实现跨语言事件是难点。 存在问题 面向资源稀 缺语言的跨 语言分析 研究现状 主要研究工作 多语言知识图谱 多语言知识获取 多语言实体对齐 多语言实体链接 多语言文本表征 多语言词对齐 多语言深度语义 多语言事件分析 跨语言事件抽取 多语言事件关联 多语言观点挖掘 多语言情感分析 多语言摘要 多语言事件分析 多语言事件抽
3、取 目 录 研究背景1 多语言知识图谱构建2 多语言文本语义表征3 多语言事件分析及观点挖掘4 研究趋势5 基于迁移学习的多语言实体识别 Huang X, May J, Peng N. What Matters for Neural Cross-Lingual Named Entity Recognition: An Empirical Analysis. EMNLP2019 任务:实体识别是构建跨语言知识图谱的基 础。 问题:低资源场景实体识别标注数据稀缺 方法:利用高资源语言标注数据,迁移知识 到低资源语言。首先基于双语词嵌入实现不 同语言的语义对齐,然后利用双语词典增强 不同语言的嵌入表征,最后实现跨语言实体 识别。 基于多视角的多语言实体对齐 Yang H W, Zou Y, Shi P, et al. Aligning Cross-Lingual Entities with Mu