当前位置:首页 > 报告详情

大规模分布式 GPU 图嵌入在腾讯的实践之路.pdf

上传人: li 编号:29579 2021-02-07 28页 909.45KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了腾讯在微信数据中心实现的大规模分布式GPU图嵌入的实践。文章首先介绍了图数据的背景,包括社交网络、生物网络、金融网络等。然后阐述了图嵌入的概念,即将网络节点转换为适合机器学习模型的向量。文章还分析了实现图嵌入面临的挑战,如设计并行训练方法、优化内存访问模式、设计通信策略等。 文章提出了一个分层数据分区和流水线训练的GPU嵌入系统设计。通过随机游走引擎和图嵌入PS样本池,实现了图嵌入的并行训练。实验表明,该系统在不同的图数据集上均取得了良好的性能。在性能分析中,文章比较了不同数量GPU下的训练结果,展示了系统的可扩展性。 最后,文章总结了实现大规模分布式GPU图嵌入的关键点,包括使用数据并行和模型并行、优化通信性能、处理图特定原语与机器学习训练操作的差异,并提出了未来工作的方向。
"腾讯如何实践大规模分布式GPU图嵌入?" "图嵌入系统设计中面临的挑战及解决方案是什么?" "图嵌入任务与GNN的区别和联系是什么?"
客服
商务合作
小程序
服务号
折叠