物质、信息、能量等在不同空间位置之间的移动和交换形成了地理流,多种形式的地理流相结合构成了地理多元流,如何从中挖掘出丰富的信息是迫切需要解决的问题。
本文以基于GDELT数据的国际关系研究为应用背景,探索基于多层复杂网络的地理多元流测度与社区识别方法。首先利用多路复用网络模型构建了包括媒体层、立法执法层、叛乱层的地理多元流网络,随后研究了地理多元流网络的MultiRank中心性、重叠度中心性、多重参与系数与Z分数等测度方法,并进行了全球尺度的社区识别分析,最后分析了网络的时序变化特征。
国家自然科学基金项目(42171448)
地理空间中,物质、信息、能量等在不同空间位置之间的移动或交换形成了"地理流",如交通流、人口移动流、贸易流等。多种类型的地理流形成了"地理多元流"。流的出现重新塑造了人们对于空间的认知。
与单一地理流相比,地理多元流结合了具有互补关系的多源数据,包含了不同类型的交互,能够更加全面地反映复杂系统的各个方面,如何从中挖掘信息和知识是迫切需要解决的问题。
全球事件、语言、语调数据库(The Global Database of Events, Language, and Tone, GDELT数据库)自1979年起对全球新闻报道进行实时自动抓取,通过文本分析获取人物、地点、组织和事件类型等不同维度的信息,具有免费开放、更新频率高、信息全面等特点。
构建了2018、2020和2022年的媒体(Media)、立法执法(Legislature)与叛乱(Insurgent)网络,并以此为基础构建时序的地理多元流网络,进一步探索节点在地理空间的交互情况。
研究了地理多元流网络的MultiRank中心性、重叠度中心性、多重参与系数与Z分数等测度方法,从不同角度分析节点在网络中的重要性。
使用扩展的Louvain社区识别算法进行地理多元流网络的社区识别,发现网络中高度连接的节点集合,理解网络的内在结构和交互模式。
网络名称 | 事件含义 | 参与者1角色类型 | 事件性质 | 平均语调值范围 |
---|---|---|---|---|
媒体网络 | 媒体积极合作事件 | MED(媒体, Meida) | 1或2 | [0, 100] |
立法执法网络 | 立法执法机关积极合作事件 | COP(警察机关、部门, Police forces)或 JUD(司法制度, Judiciary)或 LEG(立法机关, Legislature) | 1或2 | [0, 100] |
叛乱网络 | 叛乱分子 | INS(叛乱分子, Insurgent)或 SEP(分裂主义叛乱分子, Separatist rebels) | 3或4 | [-100, 0] |
多路复用网络是多层网络模型的一种,具有各层节点集相同、每层具有不同类型连接等特点,适用于多主题、多层次、时变的地理多元流。
以年为周期构建有向加权网络G=(V, E,ω)。其中V为节点集,E为有向边集,ω为边的权重集。在同一周期内,将单一地理流网络的节点定义为至少参与过一个事件的国家或地区的集合。
如果2个国家或地区共同参与过至少一个事件,则在二者之间构建一条由参与者1指向参与者2的有向边。由于不同事件带来的影响不同,本文采用平均语调值之和作为边权重。
地理多元流网络可定义为三元组G=<V,E,C>,其中V为节点集,E是边集,C是层间边的集合,表示同一节点在不同层之间的连接。
MultiRank中心性是PageRank中心性在多层网络中的扩展,能够同时确定节点和层的重要性。本文对构建的3个地理多元流网络进行了MultiRank中心性的计算,选择排名前20位的节点进行分析。
在多层网络中,重叠度中心性是一种通过统计节点在各层连边的边强度之和来衡量节点重要性的方法。本文对地理多元流网络的重叠度进行计算,选择排名前10位的节点进行分析。
多重参与系数能够有效衡量节点在不同层连接的丰富性。Z分数与多重参与系数一同分析可以更好地理解某一节点在地理多元流网络中的参与情况。
本文使用Louvain算法识别地理多元流网络及其各层的社区结构。复杂网络的社区是高度连接的节点的集合,这些节点看起来几乎与网络的其他部分独立。
对地理多元流网络的中心性测度进行空间相关性、空间异质性分析,探索其不同的空间格局和模式
对地理多元流网络进行多空间尺度(全球尺度、国家尺度等)的综合分析,探索其在不同空间尺度的特征
对国际关系地理多元流网络进行长时间序列的分析,探索其时空演变规律,为国际关系的分析和预测提供决策支持