研究背景与意义

全球癌症现状

作为全球公共卫生领域中严峻威胁之一,癌症已经成为制约人类寿命提升的重要障碍之一。据世界卫生组织(WHO)估计,未来20年全球癌症人数可能会增加60%,防控形势愈发严峻。

2020年国际癌症研究中心(International Agency for Research on Cancer, IARC)发布的《世界癌症报告》指出,全球排前十的癌症依次是肺癌、乳腺癌、前列腺癌、结直肠癌、胃癌、肝癌、食管癌、子宫颈癌、甲状腺癌和膀胱癌,占全癌症发病总数的60.8%。

研究意义

当前研究定量揭示出了部分癌症疾病负担的空间聚集性与时间变化性,对于相关风险因素的评价和解释也有一定贡献。但仍存在几点不足:

  • 目前癌症相关研究覆盖范围和类型均比较有限,并未深入挖掘全球多种癌症不同影响因素作用的空间异质性和时间规律性
  • 多数研究仅着力于在空间尺度或时间尺度的单一分析,并未将时空依赖特征信息融合,通过构建集成模型从时空维度揭示癌症的风险变化趋势
  • 癌症诱因复杂且时空分布具有较强时效性,需采用多源时空数据集对当前全球多种癌症的不同影响因素进行探究

因此,本研究对2011—2019年全球200个国家的5种主要类型癌症(肺癌、结直肠癌、胃癌、肝癌与胰腺癌)死亡病例数据进行了时空信息挖掘,将多尺度地理加权回归、自回归积分滑动平均模型提供的时空特征信息,集成融合到时空贝叶斯预测模型的参数设计中,从时空角度综合评估了全球癌症死亡风险的疾病负担趋势,并揭示出其关键驱动因素的影响作用,为制定全球性癌症防控策略提供科学依据与理论支持。

研究方法

技术路线

本研究通过集成MGWR、ARIMA和贝叶斯时空模型3种方法优势,同时融合流行病的时空特征信息进行全球癌症的时空风险趋势预测。研究技术路线如下:

技术路线图

研究数据搜集与预处理

将获取到的原始数据进行清洗、筛选并空间化匹配,作为后续研究的数据基础。

各类型癌症的时空流行特征提取

首先,对各类型癌症进行多尺度地理加权回归分析,提取不同影响因素驱动作用的空间分异特征;其次,基于自回归积分滑动平均模型进行时间序列分析,提取全球不同国家主要类型癌症的时间趋势与周期波动特征。

时空贝叶斯预测模型构建

将MGWR和ARIMA的提取的时空特征作为参数输入,集成时空联合信息建立贝叶斯集成嵌套拉普拉斯近似模型,预测全球每个国家的主要癌症相对死亡风险。该方法有效提升了流行病时空演化过程与风险预测能力,为公共卫生管理决策提供更为精准的时空预测和风险评估。

多尺度地理加权回归

多尺度地理加权回归模型(MGWR)通过为每个解释变量设置不同的邻域(带宽),揭示出各影响因素在不同地理位置和尺度上的变化关系,精确分析其空间异质性。

Yi = β0(ui,vi) + ∑j=1pβj(ui,vi)Xij + εi

自回归积分滑动平均

自回归积分滑动平均模型(ARIMA)能够有效模拟和预测具有趋势或季节性的时间序列数据。

(1-∑i=1pφiLi)(1-L)dXt = (1+∑i=1qθiLit

贝叶斯时空预测模型

研究集成嵌套拉普拉斯进行近似贝叶斯推断,使用Bernardinelli模型来估计全球各个国家各类型癌症的相对风险。

Yij~Po(Eijθij)

log(θij) = α + ui + vi + (β + δi) × tj

研究区概况及数据来源

本文以全球200个国家为研究区,包括绝大多数可获取相关数据的主权国家。根据世界银行对全球各个国家的经济发展状况以及地域分类,将本研究中的国家根据收入水平、发展程度、地域区位进行了分组。

研究区域分布图

按收入水平分类

  • 高收入国家:人均GNI>12 055美元
  • 中高等收入国家:3 896美元≤人均GNI≤12 055美元
  • 中低等收入国家:996美元≤人均GNI≤3 895美元
  • 低收入国家:人均GNI<996美元

按地域区位分类

  • 东亚与太平洋地区
  • 欧洲与中亚地区
  • 拉丁美洲与加勒比海地区
  • 中东与北非地区
  • 北美地区
  • 南亚地区
  • 撒哈拉以南非洲地区

数据来源

研究所采集的疾病数据来自于全球疾病负担(GBD)数据库,旨在全面评估全球、国家及地区各种疾病、伤害和风险因素的流行病学情况,涵盖了从1970年到近期数百种疾病和伤害以及数10种风险因素数据信息。

本研究选取的数据为2011—2019年全球各个国家的肺癌、肝癌、结直肠癌、胃癌、胰腺癌死亡率数据,覆盖全球200个国家。

研究结果

全球癌症死亡率时空变化特征

研究发现,全球五类癌症死亡率均持续增加,2019年各类癌症死亡率较2011年平均上升了17.2/100 000人。全球超过72.8%的国家癌症死亡相对风险较高(RR>1),呈现出明显的空间聚集性。

区域差异

相比非洲与南亚地区,欧洲、中亚、北美、东亚及太平洋地区癌症死亡率增速较快。

收入水平差异

相比中低收入和低收入国家,高收入和中高收入国家各类癌症死亡率上升趋势明显,相对风险更高。

癌症死亡率的关键影响因素

通过多尺度地理加权回归分析,研究确定了影响全球癌症死亡率的关键因素:

人口因素

65岁及以上人口占比

生活习惯因素

吸烟
酒精消费
低运动强度
高糖加工饮食

经济因素

人均GDP
人均GNI

医疗卫生因素

人均医疗卫生支出
各影响因素对癌症死亡率的贡献率

不同类型癌症的时空风险特征

肺癌

肺癌死亡率在高收入国家和中高收入国家显著高于其他地区,尤其是欧洲和北美地区。主要影响因素为吸烟率、空气污染和老龄化程度。

结直肠癌

结直肠癌死亡率在欧洲和北美地区较高,与高脂肪饮食、低纤维摄入和久坐生活方式密切相关。近年来在亚洲地区呈现快速上升趋势。

胃癌

胃癌死亡率在东亚地区(特别是日本、韩国和中国)显著高于其他地区,与饮食习惯、幽门螺杆菌感染率和食品保存方式相关。

肝癌

肝癌死亡率在非洲和亚洲部分地区较高,与乙肝、丙肝病毒感染率、酒精消费和黄曲霉毒素暴露等因素密切相关。

胰腺癌

胰腺癌死亡率在高收入国家较高,与人口老龄化、吸烟、肥胖和糖尿病等因素相关。由于早期诊断困难,全球胰腺癌生存率普遍较低。

讨论与结论

主要发现

1

死亡率持续上升:全球五类癌症死亡率均持续增加,2019年各类癌症死亡率较2011年平均上升了17.2/100 000人。

2

空间聚集性显著:全球超过72.8%的国家癌症死亡相对风险较高(RR>1),呈现出明显的空间聚集性。

3

区域差异明显:相比非洲与南亚地区,欧洲、中亚、北美、东亚及太平洋地区癌症死亡率增速较快。

4

收入水平影响显著:相比中低收入和低收入国家,高收入和中高收入国家各类癌症死亡率上升趋势明显,相对风险更高。

5

关键影响因素:65岁及以上人口占比、吸烟、酒精、低运动强度、高糖加工饮食、人均GDP、人均GNI和人均医疗卫生支出成为全球主要类型癌症死亡风险的关键影响因素。

方法创新

本研究通过集成不同地理时空分析方法优势,创新性构建了涵括时空分组变量和不同影响因素的疾病风险时空预测模型,具有以下特点:

灵活度高

可解释性强

适用于量化时空非平稳性关系

该模型能够有效评估全球不同地区主要类型癌症死亡的相对风险,加深了地理空间建模技术与流行病研究的交叉融合,对严峻的全球癌症防控规划具有重大科学意义。

政策建议

针对性预防措施:根据不同地区癌症类型的高风险特征,制定有针对性的预防和干预措施,如在吸烟率高的地区加强控烟政策,在肝炎病毒感染率高的地区推广疫苗接种。

资源优化分配:根据癌症风险的时空分布特征,优化医疗资源分配,在高风险地区增加癌症筛查和治疗设施。

健康生活方式推广:加强对吸烟、酗酒、不健康饮食和缺乏运动等癌症风险因素的公众教育,推广健康生活方式。

国际合作与知识共享:加强全球癌症防控的国际合作,促进低收入国家和高收入国家之间的知识和技术共享,共同应对全球癌症挑战。