《电信网络中的图学习性能优化-曾立.pdf》由会员分享,可在线阅读,更多相关《电信网络中的图学习性能优化-曾立.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、DataFunSummit#2023电信网络中的图学习性能优化曾立华为技术有限公司GTS 数据智能计算专家01图技术的发展情况图的介绍、优势与业界应用02图学习在电信业务的应用图学习的原理与业务应用情况03图学习的性能优化主流引擎对比、关键挑战分析及加速技术04总结与展望图学习的业务和技术演进方向目录CONTENTDataFunSummit#202301图技术的发展情况越来越多的问题被建模成图,进而解决深度关联的问题传统的关系型数据库无法解决这些问题金融风控A1A1复杂关联,多跳查询转账转账商业推荐三跳以上,甚至六跳信用卡套现 盛行导致信用卡不良率攀升,每年 数亿元 损失每年的 洗钱 规模 2
2、000 亿元,经济总量的 2%如何存储千亿级的金融数据?如何支持属性和结构的快速更新?如何响应关联深度超过3的复杂查询?关系数据库一跳关联-六跳以上关联大量自连接TTTT图技术VS.金融交易图用户商品图A1是否存在洗钱链路?如何存储千亿级的电商数据?如何聚合用户的信息(住址,好友,浏览历史,购物记录)?如何把最合适的商品推荐给用户?海南的用户A浏览了女式牛仔裤,然后搜索衬衫,应该展示哪些商品?如果A的好友B跟A有相似的行为记录,B还购买了防晒霜,是否应向A推荐?查询的挑战:数据规模大 查询复杂(三跳以上关联)业务负载高存储的挑战:数据规模大,持续增长 属性维度高,且异构多样 数据频繁更新来源传
3、统电商的 商品推荐:十万亿元 的规模互联网企业的 广告推荐:近 万亿元 的规模新兴 直播电商的兴趣推荐:超 万亿元 的规模,年增速 142%其背后的原理关系数据库图技术一跳关联-六跳以上关联大量自连接 TTTT转账方(src)被转账方(dst)转账金额(val)A1B11,000,000A1B25,000A1B310,000A1B4600,000B1C11,000,000C1C21,000,000C2A11,000,000多表拼接环路检测关系表TSELECT*FROM T as T1,T as T2,T as T3 WHERE T1.src=A1 and T1.dst=T2.src and T
4、2.dst=T3.srcand T3.dst=T4.src and T4.dst=T1.src性能差:关系表 T 需要作多次 自连接功能不足:无法支持不固定跳数的查询只能一步步试:一跳是否可达,两跳是否可达SQL查询A1转账B1B2B3B4C1转账C2转账转账省略许多边转账易使用:建模简单自然,查询书写符合人类直觉性能好:直接 遍历图,无需表拼接(Join)功能强:支持任意跳数的查询用户可以不指定跳数g.V(A1).both().both().cyclicPath().path()图模型gGremlin 查询Cypher 查询MATCH p=(A1)-*-(A1)RETURN pRelatio
5、n Table JoinGraph Traversal计算范式计算复杂度O(|T|n)O(|T|)|T|即图g的边数A1A1转账转账(n跳关联)千万边 三跳 1021 -107世纪-毫秒问题其实,现实世界中,“图”是无所不在的社交网络道路网络蛋白质结构知识图谱通信网络定义:“图”是以“关联”为基础对现实世界的抽象表达G=(V,E,D),V=vertex(顶点或者节点),E=edge(边),D=data(属性&权重)互联网来源来源From Professor Lei ZouFrom Professor M.Tamer zsuFrom Professor M.Tamer zsu商业推荐-图技术在行
6、业的成熟应用基于评分的搜索推荐基于用户行为的商品推荐算法:图学习算法:随机游走/频繁子图挖掘算法用户搜索关键词,系统基于评分推荐商品/店铺淘宝/京东/拼多多等电商算法:随机游走/图学习算法:多跳查询/关联分析线上/线下购物超市里经常会把婴儿的尿不湿和啤酒放在一起售卖媒体平台的内容推荐社交网络的好友推荐QQ/微博/领英/各大游戏 等平台小蓝小白小红小明小灰小黑基于共同好友数(或地区、爱好等),优先给小明推荐小白而非小黑知乎/抖音/今日头条/微信读书 等平台 用户信息、用户和用户的关系(关注、好友等)内容(视频、文章、广告等)用户和内容的联系(点赞、评论、转发、点击广告等)被动等搜索主动推荐Fro