PM2.5作为空气污染物的主要成分之一,严重影响人类身体健康,如呼吸系统受损、癌症与心血管疾病的发病率增加等。如何降低人类在PM2.5中暴露程度是当下可持续城市和社会发展的重中之重。
目前已有PM2.5浓度预测模型过多专注于提升模型预测精度,但忽略了模型的可解释性,造成模型可复用性和可信任度较差。大多数时空预测模型却难以兼顾预测精度及可解释之间的均衡。
本文提出了一种新颖的兼顾预测精度和可解释性的PM2.5浓度预测模型,即注意力时空常微分方程(Attentional SpatioTemporal Ordinary Differential Equation, ASTODE)。
通过设计了一种新颖时空导数网络将传统NODE扩展到了时空常微分方程,进而挖掘PM2.5浓度数据中的时空关系。
构建了一种可解释的数据结构(即注意力机制)辅助时空常微分方程捕捉PM2.5浓度数据中的长期依赖关系。
图1 ASTODE模型的整体示意
传统NODE虽具备一定的可解释性,但仍存在不足:
本文提出了时空导数网络将传统NODE扩展到了时空常微分方程。时空导数网络数学定义如式(3)所示:
图2 时空常微分方程模块的前向传播过程
时空注意力模块由空间注意力和时间注意力组成:
注意力机制是一种可解释的数据结构。以空间维度的注意力机制为例,注意力机制可视为反距离权重函数在数据驱动下的一种扩展。
图3 时空注意力模块的前向传播过程
本研究采用的PM2.5浓度数据集来源于天津市的27个空气质量监测站点,时间跨度为2015年2月1日—2015年4月30日,采样间隔为60min。
图4 ASTODE模型的定性预测结果
图7从时间维度和空间维度定性描述了ASTODE模型的预测性能:
模型 | MAE | RMSE | MAPE/% |
---|---|---|---|
ST-KNN | 14.35 | 22.12 | 32.02 |
T-GCN | 10.20 | 17.97 | 25.14 |
BTMF | 8.98 | 15.42 | 20.74 |
GDGCN | 8.56 | 15.11 | 19.47 |
Vanilla-NODE | 13.34 | 19.52 | 35.06 |
ODE-RNNs | 9.67 | 15.99 | 23.22 |
ASTODE | 8.63 | 15.14 | 19.54 |
实验结果表明,ASTODE模型解决了传统NODE的两点不足,兼顾模型可解释的同时,优于或者逼近于现有基线方法的预测精度。尤其是ASTODE模型已经逼近于GDGCN模型的预测精度,这证明了在不考虑模型可解释性的情况下,ASTODE模型已经具备了令人可接受的预测结果。
本研究从2个方面解释ASTODE模型:
可解释的准确预测PM2.5浓度变化对人类健康风险评估和政策实施具有重要意义。本文提出的ASTODE模型:
本研究的局限性:
下一步工作重点: