解决犯罪回归模型中残差空间自相关问题的新方法
在犯罪空间分析和空间建模过程中,模型残差中的空间自相关问题对模型参数估计的准确度和犯罪相关因素的分析构成了极大的阻碍,模型残差存在显著空间自相关会导致模型的有偏估计及误导性的推断,甚至导致错误的研究结论。本研究采用一种较为新颖的空间统计方法,即特征向量空间滤波方法(Eigenvector Spatial Filtering),来消除犯罪回归模型估计过程中的残差自相关问题,以及由此引发的模型参数有偏估计问题。
以此为基础,立足犯罪模式理论和社会解组理论,以浙江省海宁市主城区为研究区,采用2018年1月—2021年9月室外盗窃警情立案数据、海宁市建成环境数据、珞珈一号夜间灯光遥感数据以及WorldPop人口网格数据,在网格尺度上构建基于特征向量空间滤波的泊松回归模型,在消除模型残差自相关、纠正模型参数估计偏误的基础上,识别出海宁室外盗窃犯罪的影响因素。
以盗窃为代表的侵财类案件已成为刑事犯罪中社会危害最大的犯罪行为,尤其是以盗窃"三车"和扒窃为代表的室外盗窃,具有犯罪机会多、犯罪成本低、发案频率高、报案比例低、取证难度大、刑罚力度轻等特点,成为城市犯罪防控面临的重大挑战之一,严重影响居民安全感。
犯罪模式理论(Crime Pattern Theory)认为作案目标的活动空间、作案人的感知空间、监管者的行为空间共同决定了犯罪分布格局,一般用以下三种类型来测量区域犯罪机会:
社会解组理论(Social Disorganization Theory)将城市犯罪分异归结于各区域的社会解组程度差异,解组的地区具有较强的社会经济相对剥夺水平,且存在居住不稳定、人口流动性强、人群构成异质等特征。
尽管人类社会常被描述为合作性社会,但社会经济相对剥夺的空间分异的确会引起城市居民的空间不平等和社会分散,进一步导致高犯罪率和低社会信任等后果。
在一定的空间尺度上,人均夜间灯光亮度(用夜间灯光数据除以人口密度)可以作为社会经济相对剥夺程度的代理变量,间接反映区域尺度的空间不平等水平。
在基于上述犯罪学理论开展犯罪回归分析时,常常需要在一定的空间尺度上将点状犯罪数据汇总为犯罪计数数据。对于鲜有遵循正态分布的犯罪计数变量,通常需要使用广义线性回归来构建模型,例如泊松回归。然而,犯罪计数数据中普遍存在的空间自相关违反了模型要求的独立性假设,因此,标准的泊松模型在犯罪回归分析中可能会产生有偏的和不一致的参数估计。
在回归模型中,模型残差的独立性是必须满足的条件。特征向量空间滤波(ESF)正是建立在残差制图基础上的一种方法,最初作为空间模型的补救工具被提出来,用于清除模型残差自相关,以确保满足残差独立性假设。
本文研究的核心环节是利用基于特征向量空间过滤的泊松回归模型(Poisson Regression with Eigenvector Spatial Filtering)来解决模型参数估计过程中残差自相关的问题。
图1:特征向量空间滤波在犯罪回归分析中的应用框架
首先,采用新兴时空热点分析的方法,以浙江省海宁市主城区为研究区,挖掘海宁主城区2018年1月—2021年9月的室外盗窃时空模式;其次,立足犯罪模式理论和社会解组理论,采用海宁主城区室外盗窃警情数据、海宁市建成环境数据(POI)、珞珈一号夜间灯光遥感数据以及WorldPop人口数据,在网格尺度上构建模型,借鉴既有研究对犯罪模式理论核心要素的操作化方法,将海宁市建成环境(POI)分为犯罪产生地、犯罪吸引地和犯罪促成地,以此作为解释变量,并与刻画社会经济相对剥夺水平的人均灯光变量一起,逐步加入基于特征向量空间滤波的泊松回归模型中进行分析,在清除模型残差自相关的基础上,更无偏地估计模型参数,准确识别出海宁主城区室外盗窃犯罪的微观影响因素。
新兴时空热点分析以时空立方体模型为基础,时空立方体模型最早由瑞典地理学家Torsten于1970年提出,在x轴与y轴表示平面空间位置的基础上加入t轴表示时间,在三维坐标系中描述地理现象随着时空同时变化的过程。
时空立方体将传统的Getis-Ord热点分析法定义中的空间接近拓展为时空接近,最终得到17种时空演变模式,即新增、连续、加强、持续、递减、分散、振荡、历史的8个热点和8个冷点趋势以及无趋势。
本研究的被解释变量室外盗窃数量是计数型变量,其分布非负且右偏。回归分析所采用的相关解释变量(犯罪机会变量)基于犯罪模式理论选择而来。
在空间回归中,模型残差应是非空间自相关的,但常规泊松回归模型缺少针对残差空间自相关性的解决办法。特征向量的组合系统性地描述空间模式,并能构造出在泊松回归中相关但被忽略的变量的代理变量,因此,这些特征向量能够从模型残差中提取出空间自相关部分。
新兴时空热点分析显示,室外盗窃绝对数量随疫情到来呈递减趋势,室外盗窃热点持续于海宁市主城区中部,冷点呈多点分布。
图2:海宁市主城区室外盗窃新兴时空热点分析结果
基于特征向量空间滤波的泊松回归模型提取出了模型残差中的自相关部分,确保残差无显著空间自相关,将显著的空间滤波加入回归模型,较大幅度提升了模型拟合优度,纠正了系数估计偏误问题,缓解了过度离散问题,并找回了遗漏变量。
变量 | 泊松回归 | ESF泊松回归 |
---|---|---|
人均夜间灯光 | 0.245* | 0.372*** |
犯罪产生地 | 0.183** | 0.215*** |
犯罪吸引地 | 0.156* | 0.198** |
犯罪促成地 | 0.112 | 0.167** |
残差莫兰指数I | 0.285*** | 0.024 |
AIC | 1247.5 | 1058.3 |
注:* p<0.05, ** p<0.01, *** p<0.001
人均夜间灯光所表征的城市相对剥夺水平对室外盗窃有显著正向影响。在ESF泊松回归模型中,人均夜间灯光变量的系数为0.372,且在0.001水平上显著,这表明社会经济相对剥夺程度越高的地区,室外盗窃发生的可能性越大。
这一发现支持了社会解组理论,即社会经济相对剥夺的空间分异会引起城市居民的空间不平等和社会分散,进一步导致高犯罪率。
由各类建成环境所刻画的犯罪吸引地、产生地、促成地对室外盗窃均有显著影响。在ESF泊松回归模型中:
这些发现支持了犯罪模式理论,即作案目标的活动空间、作案人的感知空间、监管者的行为空间共同决定了犯罪分布格局。
通过比较泊松回归模型和基于特征向量空间滤波的泊松回归模型,可以看出ESF方法的显著效果:
图3:泊松回归与ESF泊松回归的残差空间自相关比较
本研究采用特征向量空间滤波方法解决了犯罪回归模型中残差空间自相关的问题,并在此基础上识别出了海宁市主城区室外盗窃犯罪的影响因素。主要结论如下:
贺力,何国喜,郑滋椀.特征向量空间滤波方法在室外盗窃空间分析中的应用[J].地球信息科学学报,2024,26(8):1779-1793. [He L, He G X, Zheng Z W. Application of eigenvector spatial filtering in spatial analysis of larceny-theft[J]. Journal of Geo-information Science, 2024,26(8):1779-1793.] DOI:10.12082/dqxxkx.2024.230634