基于多层复杂网络的地理多元流测度与社区识别研究

研究摘要

物质、信息、能量等在不同空间位置之间的移动和交换形成了地理流,多种形式的地理流相结合构成了地理多元流,如何从中挖掘出丰富的信息是迫切需要解决的问题。

本文以基于GDELT数据的国际关系研究为应用背景,探索基于多层复杂网络的地理多元流测度与社区识别方法。首先利用多路复用网络模型构建了包括媒体层、立法执法层、叛乱层的地理多元流网络,随后研究了地理多元流网络的MultiRank中心性、重叠度中心性、多重参与系数与Z分数等测度方法,并进行了全球尺度的社区识别分析,最后分析了网络的时序变化特征。

关键词

地理多元流 多层复杂网络 GDELT 国际关系 网络化挖掘

基金项目

国家自然科学基金项目(42171448)

研究背景

地理空间中,物质、信息、能量等在不同空间位置之间的移动或交换形成了"地理流",如交通流、人口移动流、贸易流等。多种类型的地理流形成了"地理多元流"。流的出现重新塑造了人们对于空间的认知。

与单一地理流相比,地理多元流结合了具有互补关系的多源数据,包含了不同类型的交互,能够更加全面地反映复杂系统的各个方面,如何从中挖掘信息和知识是迫切需要解决的问题。

GDELT数据库

全球事件、语言、语调数据库(The Global Database of Events, Language, and Tone, GDELT数据库)自1979年起对全球新闻报道进行实时自动抓取,通过文本分析获取人物、地点、组织和事件类型等不同维度的信息,具有免费开放、更新频率高、信息全面等特点。

研究方法

地理多元流网络构建

构建了2018、2020和2022年的媒体(Media)、立法执法(Legislature)与叛乱(Insurgent)网络,并以此为基础构建时序的地理多元流网络,进一步探索节点在地理空间的交互情况。

网络测度方法

研究了地理多元流网络的MultiRank中心性、重叠度中心性、多重参与系数与Z分数等测度方法,从不同角度分析节点在网络中的重要性。

社区识别算法

使用扩展的Louvain社区识别算法进行地理多元流网络的社区识别,发现网络中高度连接的节点集合,理解网络的内在结构和交互模式。

研究框架

研究框架图

数据来源

地理流网络构建规则

网络名称 事件含义 参与者1角色类型 事件性质 平均语调值范围
媒体网络 媒体积极合作事件 MED(媒体, Meida) 1或2 [0, 100]
立法执法网络 立法执法机关积极合作事件 COP(警察机关、部门, Police forces)或 JUD(司法制度, Judiciary)或 LEG(立法机关, Legislature) 1或2 [0, 100]
叛乱网络 叛乱分子 INS(叛乱分子, Insurgent)或 SEP(分裂主义叛乱分子, Separatist rebels) 3或4 [-100, 0]

多路复用网络模型

多路复用网络是多层网络模型的一种,具有各层节点集相同、每层具有不同类型连接等特点,适用于多主题、多层次、时变的地理多元流。

网络构建方法

以年为周期构建有向加权网络G=(V, E,ω)。其中V为节点集,E为有向边集,ω为边的权重集。在同一周期内,将单一地理流网络的节点定义为至少参与过一个事件的国家或地区的集合。

如果2个国家或地区共同参与过至少一个事件,则在二者之间构建一条由参与者1指向参与者2的有向边。由于不同事件带来的影响不同,本文采用平均语调值之和作为边权重。

网络定义

地理多元流网络可定义为三元组G=<V,E,C>,其中V为节点集,E是边集,C是层间边的集合,表示同一节点在不同层之间的连接。

研究结果

MultiRank中心性分析

MultiRank中心性是PageRank中心性在多层网络中的扩展,能够同时确定节点和层的重要性。本文对构建的3个地理多元流网络进行了MultiRank中心性的计算,选择排名前20位的节点进行分析。

主要发现:

  • 美国连续3年的MultiRank排名都是1,且数值远超其他节点
  • 中国、英国和俄罗斯的排名也比较稳定,在系统中始终保持着较高的影响力
  • 媒体层和立法执法层在系统中的重要性相近,且远大于叛乱层的重要性

重叠度中心性分析

在多层网络中,重叠度中心性是一种通过统计节点在各层连边的边强度之和来衡量节点重要性的方法。本文对地理多元流网络的重叠度进行计算,选择排名前10位的节点进行分析。

关键发现:

  • 在2018年和2022年,美国和阿富汗的重叠度排名均在前2位
  • 中国和英国的重叠度排名始终在前10位
  • 阿富汗在叛乱层的出度非常高,其叛乱组织经常主动发起叛乱活动

多重参与系数与Z分数分析

多重参与系数能够有效衡量节点在不同层连接的丰富性。Z分数与多重参与系数一同分析可以更好地理解某一节点在地理多元流网络中的参与情况。

节点分类结果:

  • 既属于多路复用节点又属于枢纽节点的有且只有美国
  • 既属于聚集节点又属于多路复用节点的有且只有阿富汗
  • 地理多元流网络的多重参与系数平均值在0.5左右,分布较均匀

社区识别结果

本文使用Louvain算法识别地理多元流网络及其各层的社区结构。复杂网络的社区是高度连接的节点的集合,这些节点看起来几乎与网络的其他部分独立。

社区结构特征:

  • 俄罗斯及其周边国家保持着较为紧密的联系
  • 美国在地理多元流网络整体中处于主导地位
  • 非洲大陆南部各国家及东南亚的多数国家分别稳定在同一社区

研究结论

方法研究结论

  • 地理多元流网络蕴含了比单一地理流网络更加丰富的信息
  • 网络特征随时间的变化代表了各地理单元之间交互模式的变化
  • 多层网络方法能够产生清晰的直接结果,避免了综合分析产生的误差

应用研究结论

  • 美国、中国、英国的活动对于全球社会局势发展具有重要影响
  • 阿富汗参与的事件高度聚集于叛乱层,其立法执法和媒体活动存在外界干扰
  • 美国、中国、俄罗斯分别在各自的社区内具有合作倾向

未来研究方向

空间分析

对地理多元流网络的中心性测度进行空间相关性、空间异质性分析,探索其不同的空间格局和模式

多尺度分析

对地理多元流网络进行多空间尺度(全球尺度、国家尺度等)的综合分析,探索其在不同空间尺度的特征

时序分析

对国际关系地理多元流网络进行长时间序列的分析,探索其时空演变规律,为国际关系的分析和预测提供决策支持