特征向量空间滤波方法在室外盗窃空间分析中的应用

解决犯罪回归模型中残差空间自相关问题的新方法

贺力, 何国喜, 郑滋椀 西安交通大学, 浙江警察学院, 中国人民公安大学

摘要

在犯罪空间分析和空间建模过程中,模型残差中的空间自相关问题对模型参数估计的准确度和犯罪相关因素的分析构成了极大的阻碍,模型残差存在显著空间自相关会导致模型的有偏估计及误导性的推断,甚至导致错误的研究结论。本研究采用一种较为新颖的空间统计方法,即特征向量空间滤波方法(Eigenvector Spatial Filtering),来消除犯罪回归模型估计过程中的残差自相关问题,以及由此引发的模型参数有偏估计问题。

以此为基础,立足犯罪模式理论和社会解组理论,以浙江省海宁市主城区为研究区,采用2018年1月—2021年9月室外盗窃警情立案数据、海宁市建成环境数据、珞珈一号夜间灯光遥感数据以及WorldPop人口网格数据,在网格尺度上构建基于特征向量空间滤波的泊松回归模型,在消除模型残差自相关、纠正模型参数估计偏误的基础上,识别出海宁室外盗窃犯罪的影响因素。

研究发现

  • 基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。
  • 新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布。
  • 人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响。
  • 由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃有显著影响。

1. 引言

以盗窃为代表的侵财类案件已成为刑事犯罪中社会危害最大的犯罪行为,尤其是以盗窃"三车"和扒窃为代表的室外盗窃,具有犯罪机会多、犯罪成本低、发案频率高、报案比例低、取证难度大、刑罚力度轻等特点,成为城市犯罪防控面临的重大挑战之一,严重影响居民安全感。

犯罪模式理论

犯罪模式理论(Crime Pattern Theory)认为作案目标的活动空间、作案人的感知空间、监管者的行为空间共同决定了犯罪分布格局,一般用以下三种类型来测量区域犯罪机会:

  • 犯罪产生地(Crime Generators):吸引大量人员从事合法活动的公共场所,如购物中心、体育场、银行、商店、交通设施、餐厅等场所
  • 犯罪吸引地(Crime Attractors):灰色活动集中的场所,如夜总会、酒吧、台球厅、网吧等,这类区域存在地下活动甚至非法活动,报案率低,受害风险高
  • 犯罪促成地(Crime Enablers):监管不力的场所,如缺乏值守的公园空地、游乐场等

社会解组理论

社会解组理论(Social Disorganization Theory)将城市犯罪分异归结于各区域的社会解组程度差异,解组的地区具有较强的社会经济相对剥夺水平,且存在居住不稳定、人口流动性强、人群构成异质等特征。

尽管人类社会常被描述为合作性社会,但社会经济相对剥夺的空间分异的确会引起城市居民的空间不平等和社会分散,进一步导致高犯罪率和低社会信任等后果。

在一定的空间尺度上,人均夜间灯光亮度(用夜间灯光数据除以人口密度)可以作为社会经济相对剥夺程度的代理变量,间接反映区域尺度的空间不平等水平。

犯罪回归分析中的空间自相关问题

在基于上述犯罪学理论开展犯罪回归分析时,常常需要在一定的空间尺度上将点状犯罪数据汇总为犯罪计数数据。对于鲜有遵循正态分布的犯罪计数变量,通常需要使用广义线性回归来构建模型,例如泊松回归。然而,犯罪计数数据中普遍存在的空间自相关违反了模型要求的独立性假设,因此,标准的泊松模型在犯罪回归分析中可能会产生有偏的和不一致的参数估计。

空间自相关的挑战

在回归模型中,模型残差的独立性是必须满足的条件。特征向量空间滤波(ESF)正是建立在残差制图基础上的一种方法,最初作为空间模型的补救工具被提出来,用于清除模型残差自相关,以确保满足残差独立性假设。

特征向量空间滤波方法的四大优势

  1. ESF可适用于广义线性模型
  2. ESF属于空间滤波的一种形式,相对于传统空间计量模型,其数据限制小,不受模型假设前提限制,可通过某种算子"过滤"数据中的空间自相关效应
  3. ESF可系统性地揭示地图空间形态,在此基础上将残差自相关提取出来并将其作为潜在变量放回到模型中
  4. ESF能够在清除空间自相关的基础上纠正模型参数的过高或过低估计,使模型参数估计更加无偏

2. 研究设计

本文研究的核心环节是利用基于特征向量空间过滤的泊松回归模型(Poisson Regression with Eigenvector Spatial Filtering)来解决模型参数估计过程中残差自相关的问题。

特征向量空间滤波在犯罪回归分析中的应用框架

图1:特征向量空间滤波在犯罪回归分析中的应用框架

首先,采用新兴时空热点分析的方法,以浙江省海宁市主城区为研究区,挖掘海宁主城区2018年1月—2021年9月的室外盗窃时空模式;其次,立足犯罪模式理论和社会解组理论,采用海宁主城区室外盗窃警情数据、海宁市建成环境数据(POI)、珞珈一号夜间灯光遥感数据以及WorldPop人口数据,在网格尺度上构建模型,借鉴既有研究对犯罪模式理论核心要素的操作化方法,将海宁市建成环境(POI)分为犯罪产生地、犯罪吸引地和犯罪促成地,以此作为解释变量,并与刻画社会经济相对剥夺水平的人均灯光变量一起,逐步加入基于特征向量空间滤波的泊松回归模型中进行分析,在清除模型残差自相关的基础上,更无偏地估计模型参数,准确识别出海宁主城区室外盗窃犯罪的微观影响因素。

2.1 研究方法

新兴时空热点分析

新兴时空热点分析以时空立方体模型为基础,时空立方体模型最早由瑞典地理学家Torsten于1970年提出,在x轴与y轴表示平面空间位置的基础上加入t轴表示时间,在三维坐标系中描述地理现象随着时空同时变化的过程。

时空立方体将传统的Getis-Ord热点分析法定义中的空间接近拓展为时空接近,最终得到17种时空演变模式,即新增、连续、加强、持续、递减、分散、振荡、历史的8个热点和8个冷点趋势以及无趋势。

基于特征向量空间滤波的泊松回归模型

本研究的被解释变量室外盗窃数量是计数型变量,其分布非负且右偏。回归分析所采用的相关解释变量(犯罪机会变量)基于犯罪模式理论选择而来。

在空间回归中,模型残差应是非空间自相关的,但常规泊松回归模型缺少针对残差空间自相关性的解决办法。特征向量的组合系统性地描述空间模式,并能构造出在泊松回归中相关但被忽略的变量的代理变量,因此,这些特征向量能够从模型残差中提取出空间自相关部分。

3. 主要发现

3.1 新兴时空热点分析结果

新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布。

海宁市主城区室外盗窃新兴时空热点分析结果

图2:海宁市主城区室外盗窃新兴时空热点分析结果

3.2 基于特征向量空间滤波的泊松回归模型结果

基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。

表1:泊松回归模型与基于特征向量空间滤波的泊松回归模型比较
变量 泊松回归 ESF泊松回归
人均夜间灯光 0.245* 0.372***
犯罪产生地 0.183** 0.215***
犯罪吸引地 0.156* 0.198**
犯罪促成地 0.112 0.167**
残差莫兰指数I 0.285*** 0.024
AIC 1247.5 1058.3

注:* p<0.05, ** p<0.01, *** p<0.001

社会经济相对剥夺的影响

人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响。在ESF泊松回归模型中,人均夜间灯光变量的系数为0.372,且在0.001水平上显著,这表明社会经济相对剥夺程度越高的地区,室外盗窃发生的可能性越大。

这一发现支持了社会解组理论,即社会经济相对剥夺的空间分异会引起城市居民的空间不平等和社会分散,进一步导致高犯罪率。

建成环境的影响

由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃均有显著影响。在ESF泊松回归模型中:

  • 犯罪产生地(如购物中心、体育场、银行等)的系数为0.215,在0.001水平上显著
  • 犯罪吸引地(如夜总会、酒吧、台球厅等)的系数为0.198,在0.01水平上显著
  • 犯罪促成地(如缺乏值守的公园空地等)的系数为0.167,在0.01水平上显著

这些发现支持了犯罪模式理论,即作案目标的活动空间、作案人的感知空间、监管者的行为空间共同决定了犯罪分布格局。

3.3 特征向量空间滤波的效果

通过比较泊松回归模型和基于特征向量空间滤波的泊松回归模型,可以看出ESF方法的显著效果:

  • 残差莫兰指数I从0.285(p<0.001)降至0.024(不显著),表明ESF方法有效消除了模型残差中的空间自相关
  • AIC值从1247.5降至1058.3,表明模型拟合优度显著提高
  • 各解释变量的系数估计更加准确,显著性水平提高
  • "犯罪促成地"变量在普通泊松回归中不显著,但在ESF泊松回归中变为显著,说明ESF方法能够找回因空间自相关而被遗漏的变量效应
泊松回归与ESF泊松回归的残差空间自相关比较

图3:泊松回归与ESF泊松回归的残差空间自相关比较

4. 结论

本研究采用特征向量空间滤波方法解决了犯罪回归模型中残差空间自相关的问题,并在此基础上识别出了海宁市主城区室外盗窃犯罪的影响因素。主要结论如下:

  1. 方法论贡献: 基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。该方法可推广至其他计数模型和广义线性回归分析场景中,有助于提升模型参数的准确估计水平,找回因自相关等原因而被遗漏的变量。
  2. 时空分布特征: 新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布。
  3. 社会经济因素: 人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响,支持了社会解组理论关于社会经济不平等与犯罪率之间关系的论断。
  4. 建成环境因素: 由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃有显著影响,验证了犯罪模式理论的核心观点。
特征向量空间滤波方法为犯罪空间分析提供了一种有效的工具,能够解决传统回归模型中的空间自相关问题,提高模型参数估计的准确性,为犯罪预防和控制提供更可靠的科学依据。

引用格式

贺力,何国喜,郑滋椀.特征向量空间滤波方法在室外盗窃空间分析中的应用[J].地球信息科学学报,2024,26(8):1779-1793. [He L, He G X, Zheng Z W. Application of eigenvector spatial filtering in spatial analysis of larceny-theft[J]. Journal of Geo-information Science, 2024,26(8):1779-1793.] DOI:10.12082/dqxxkx.2024.230634