PlantData:大规模知识图谱数据存储(109页).pdf

编号:77866 PDF  PPTX 109页 3.68MB 下载积分:VIP专享
下载报告请您先登录!

PlantData:大规模知识图谱数据存储(109页).pdf

1、链接数据 洞察价值 LINKED DATA & SMART DATA PlantData 知识图谱实战分享会第1期 大规模知识图谱数据存储 胡芳槐 博士 上海海翼知信息科技有限公司 CTO 2 语义大数据背景下的知识图谱技术 数据存储的发展历史 知识图谱数据存储 知识图谱时态信息存储 上半场 人民的名义知识图谱 大数据时代 大数据时代,强调的是对大规模数据综合处理的能力。 从数据库到大数据(1) 大数据的出现,必将颠覆传统的数据管理方式。在数据来源、数据处理方式和数据思维等方面都会对其带来革命性的变化。 从数据库(DB)到大数据(BD),不只是一个简单的技术演进,两者有着本质上的差别。 DBB

2、D 来源:开源技术社区 Nock(洛神) 从数据库到大数据(2) 池塘捕鱼大海捕鱼 从数据库到大数据(2) 数据规模 MB GB/TB/PB 池塘捕鱼 大海捕鱼 从数据库到大数据(2) 数据类型 数据种类单一(少数几种) 以结构化数据为主 数据种类繁多 包含着结构化、半结构化以及非结构化的数据 半结构化和非结构化数据所占份额越来越大 池塘捕鱼 大海捕鱼 从数据库到大数据(2) 数据模式 先有模式然后产生数据 难以预先确定模式 模式在数据出现之后才能确定 且模式随着数据量的增长处于不断的演变之中 池塘捕鱼 大海捕鱼 从数据库到大数据(2) 处理对象 数据仅作为处理对象 数据能作为一种资源来辅助

3、解决其他诸多领域的问题 池塘捕鱼 大海捕鱼 从数据库到大数据(2) 处理方法 One Size Fits All No Size Fits All 池塘捕鱼 大海捕鱼 从数据库到大数据(3) 以计算为中心转变到以数据处理为中心。 数据思维 大数据应用挑战1: 多源异构数据难以融合 涉密部门 企业内部数据 顾军 .生于1963年 .江苏南通人 .中国核工业 公司内部数据、新闻网站、论坛帖子、微博 多源异构数据难以融合 信息聚合、数据融合需求迫切! 大数据应用挑战2:数据模式动态变迁困难 当前数据模式动态变迁困难,当客户新需求、业务新认知时程序员需痛苦的 修改数据结构及业务逻辑,带来扩展性差、对客

4、户响应慢、维护成本高等不良情况。 我们需要:可自由扩展的数据模式! 响应速度慢 人员投入大 数据结构难改动 扩展性差 维护成本高 大数据应用挑战3:非结构化数据计算机难以理解 计算机无法理解非结构化数据的语义 企业迫切需要将非结构化数据结构化 Web of Document 大数据应用挑战4:数据使用专业程度过高 行业智能问答大幅降低数据使用门槛 Knowledge Graph: The key for Smart Data Things, not strings! 什么是知识图谱? 知识图谱旨在描述真实世界中存在的各种实体或概念,以及它们之间的关联关系。其中: 每个实体或概念用一个全局唯一确

5、定的ID来标识,称为标识符; 每个属性值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。 现实世界中有多种类型的事物 事物之间有多种类型的链接 知识图谱与本体 知识图谱并不是本体的替代品,它是在本体的基础上进行了丰富和扩充,这种扩充主要体现在实体(Entity)层面。 本体中突出和强调的是概念以及概念之间的关联关系,而知识图谱则是在本体的基础上,增加了更加丰富的关于实体的信息。 本体描述了知识图谱的数据模式(schema),即为知识图谱构建数据模式相当于为其建立本体。 知识图谱助力人工智能 语义搜索 私人助理 聊天机器人 穿戴设备 Google Bing 百度 Siri

6、Google Now 微软小娜 百度度秘 微软小冰 小黄鸡 公子小白 Apple Watch Ticwatch 计算知识引擎 临床决策支持 出行助手 IBM Watson Health 出门问问 百度知识图谱 业务需求 技术方案 数据挑战 4. 数据使用专业程度过高 3. 数据模式动态变迁困难 语义理解 数据关联探索 业务动态扩展 智能数据检索 1. 非结构化数据计算机难以理解 2. 多源异构数据难以融合 知识图谱助力商业智能 数据结构化 数据结构化 数据结构化 数据融合 数据结构化 自由扩展数据模式 数据结构化 行业智能问答 知识图谱的适用场景 数 据 场 景 多源异构数据需要融合统一使用

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(PlantData:大规模知识图谱数据存储(109页).pdf)为本站 (沧海一笑) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠