第一位主讲人是18级的宋磊,她此次为大家分享的是一篇名为《Structural diversity in social contagion》的论文, 这是一篇基于复杂网络的大规模传染过程的文章。

宋磊同学首先引入论文中传染的概念,并指出:传染的概念已经从最初的流行疾病扩展到描述了一系列通过网络传播的过程,特别是社会现象,如广告推广、政治观点、新技术的采用和财务决策。然后简要介绍了传统的社会传染模型的特点,传统的社会传染模型是建立在与生物传染的物理类比基础上的,即一个人受到传染的可能性随着他或她的接触社区的大小以及他或她所接触的受传染的人的数量的增加而单调地增加。但由于在真实的大规模传染过程中难以获取单个网络邻域的详细数据,因此很难对其进行评估。

基于上述问题,宋磊同学随即向我们展示了论文中通过分析Facebook的推广来研究上述问题的案例,这是一个比较少见的社交传染过程被真正的全球采用的例子,通过该案例我们发现:传染的可能性与个人接触邻居的连接组件个数严格相关,而不是由实际规模的邻居数量。而且,当我们改变个人邻居的拓扑结构,实际的邻居数量反而可能成为一个传染的负面指标。

进一步的,宋磊进一步解析了论文中的相关转换率的坐标图以及其他相关的结构图,发现网络邻居结构的细节如何在经验预测个人决策中扮演重要的角色。最后得出结论显示,与其把邻居数量作为社会传染中的关键性指标,不如考虑邻居结构的细节。

在宋磊同学结束汇报之后,李平老师在论文idea的基础上,为宋磊同学提出了可很多深入研究的方向和建议。相信这些宝贵的建议也能为参会的所有同学更多的启发。

 

接着出场的是18级的王标,他此次为大家分享的是一篇名为《dyngraph2vec: Capturing Network Dynamics using Dynamic Graph Representation Learning》的论文,这篇论文主要介绍了一种可以学习动态网络的表现形式的由密集层和递归层组成的深度结构。

在Introduction部分,王标介绍到现实世界的网络会随着时间的推移而发展,并具有变化的动态,而事实上,能够捕获这样的演变是预测看不见的网络的特性的关键之处。

王标首先强调了一个前提,即针对图表示的学习,是在向量空间中获取图的各种性质的基本任务和前提。本篇论文提出了了一种嵌入方法,该方法在动态图中学习演化的结构,可以预测不可见的链路,且具有较高的精度。论文中的模型通过在每个时间步长的嵌入函数,使用来自图进化的信息来捕获网络动态,从而能够以更高的精度来预判链接。

模型展示

在展示完论文的核心思想后后,王标开始为大家描述算法的详细流程,首先,在利用自编码器的前提下,网络中节点的初始输入使用了节点前L个时刻的历史邻居信息;而后在一次epoch上,更新后的节点没有用来更新节点,用的是初始邻居信息,与此同时,为了使得初始化的邻域向量不稀疏,在编码解码过程中使用LSTM算法;最后重构误差,算法核心Loss Function认为两个节点从没有连边到产生连边的影响大于两个节点一直有联系的影响。

算法Loss Function

最后在实验部分,数据分别是:第一个是人造数据集;第二个是作者之间的协作合作数据集;第三个是一个聊天日志数据集。

实验对比

 经对比,可得出论文中所展示出来的深层结构可得到更好结果的结论。

 

以下是宋磊、王标同学在这次seminar中的表现评分。