1、DataFunSummit#2024社群推荐在腾讯游戏中的应用毕文东腾讯-IEG社交算法组-高级算法研究员01社群推荐简介回答社群推荐的3W问题:What,Why,How?02自适应K-Free社群检测解决社群推荐的冷启问题,KDD202403有约束社群推荐算法ComRec数据稀疏挑战下的有约束社群推荐算法,KDD202304About UsTencent IEG CDP Group目录CONTENTDataFunSummit#202401社群推荐简介回答社群推荐的3W问题:What,Why,How?What:社交络中的社群(游戏)社交网络由节点(个人)和节点之间的社会关系(亲人、同事、朋友等
2、)组成的网络结构游戏社交网络指由游戏中的玩家和玩家间的交互关系(好友、组队、社团等)构成的网络结构图 11:社群示意图图 2:某腾讯游戏中的社群示例社交网络中的社群社交网络中的部分节点集合,一个社群通常由联系紧密的人组成,社交网络中通常有多个社群E.g.,游戏中的熟人、兴趣相投的玩家构成的社团、俱乐部等1 https:/ 社群检测算法在业务场景中的两个痛点:兼顾社群的语义属性(玩家属性:玩法偏好,付费,活跃),网络结构(好友关系链的紧密程度)确定社群的数目和分布 当前算法无法同时解决两个痛点:传统算法(如 Louvain):不需要社群数目先验,但是无法感知节点和社群的语义属性。深度学习算法(深
3、度图聚类):可以联合学习语义属性,但需要社群数目先验问题定义:K-Free社群检测 K-Free Community Detection onAttributed Graphs在真实社群数目K 未知的前提下,挖掘同时具有网络结构信息和语义特点的社群结构。(a)Real-World Case:Social Network withAttributed Nodes in Online GameReal-world social network where communitynumber K is unknownclose friendsacquaintance(e.g.ad-hocteammate
4、)Player Pairs in the same communitymentor-menteePlayer Pairs across different communitiessame communityInput attributed graphTraining procedure:search K and assign nodesOutput:K and affiliation(b)K-Free Community Detection:Assign Nodes into K=?CommunitiesAssign nodes intoK=8?communitiesNodeAttribute
5、Assign nodes intoK=5?communitiesOutput:K=3closefriendsK-Free社群检测示意图传统算法(以 Louvain 为例)优化模块度(Modularity)传统算法:难以权衡 模块度(Modularity)衡量社群网络结构的紧密程度。Calinski Harabasz score(Semantic)衡量社群内节点语义属性的相似性。真实社群(Ground Truth)是网络结构和语义属性的权衡(物以类聚,人以群分):Modularity 和 Semantic 都高 但也都没那么高 Louvain 检测的社群数比真实的数值高很多。DGC:Deep G
6、raph Clustering GNN同时以拓扑和特征做输入联合学习 embedding 在 embedding 上进行K-means 聚类 GNN based Community Detection Future Directions来源:A Comprehensive Survey on Community Detection with Deep LearningDGC 就定要有 K 吗?需要K是因为有K-means聚类 Case1:那我把K-means 换成不需要K的 聚类例如DBSCAN 不就好了?结果:模型崩溃 Case2:那我遍历K,选个模块度最高的K不就好了?结果:低效,且难以确