考虑异常数据的多层神经网络交通流预测模型

研究背景与重要性

随着城市化进程加速、机动车保有量增加，交通拥堵问题日渐突出。交通流预测对于城市管理、智能交通至关重要，对提高交通管理效率和优化城市运行具有现实意义。然而，短时交通流预测面临数据噪声与缺失、数据非平稳性、复杂时空依赖及突发事件等问题。

数据噪声

异常数据与缺失值

非平稳性

数据波动性强

时空依赖

复杂关联关系

突发事件

外部干扰影响

交通流预测方法演进历程

第一阶段：传统统计学方法

典型模型

• 历史平均(HA)模型
• 自回归差分移动平均(ARIMA)
• 基于统计学理论
• 参数化建模方法

主要局限

• 对数据平稳性高度依赖
• 线性假设限制
• 难以捕获复杂非线性特征
• 处理动态场景能力有限

第二阶段：浅层机器学习方法

典型模型

• 支持向量回归(SVR)
• k近邻模型(K-NN)
• 提高非线性特征处理能力
• 基于核函数的映射

存在问题

• 依赖手工构建特征
• 需要大量经验知识
• 处理高度动态场景局限性
• 特征工程复杂

第三阶段：深度学习方法

时序建模

• 循环神经网络(RNN)
• 长短时记忆网络(LSTM)
• 门控循环单元(GRU)
• 双向递归网络(BiRNN)

空间建模

• 图卷积网络(GCN)
• 时空图卷积网络(STSGCN)
• 空间-时空融合网络(STFGCN)
• 图注意力网络(GAT)

注意力机制

• Transformer模型
• Informer网络
• 多头概率稀疏自注意力
• 蒸馏机制

现有方法的局限性与挑战

核心问题：异常数据处理不足

现有模型均未考虑交通流数据中蕴含的由外部干扰、突发事件等导致的异常数据及存在的潜在影响。这些异常数据会严重影响预测模型的准确性和稳定性。

异常数据来源

• 天气因素影响
• 某区域举办活动
• 交通事故发生
• 其他外部干扰和突发事件

影响表现

• 某时段交通流量异常波动
• 数据非平稳性增强
• 预测模型精度下降
• 模型稳定性受损

技术方法局限性

异常识别不精确

• 孤立森林算法参数单一
• 异常数据识别不精确
• 缺乏多参数约束考虑
• 忽略交通流内在结构

传统矩阵缺陷

• M阶矩阵存在固有缺陷
• 难以精准捕获异常影响
• 动态范围表征不足
• 空间关系建模局限

重要区域识别不足

• 仅通过节点出入度筛选
• 重要区域识别不准确
• 缺乏交通拥堵指数考虑
• 局部动态信息捕获不足

研究空白与需求

现有研究虽然通过融合外部因素和引入分解方法来降低外部因素的影响，也考虑了连续缺失值下的交通流预测，但缺乏系统性的异常数据处理框架和精准的异常影响建模方法，亟需构建考虑异常数据的智能预测模型。

MLNN-CAD：创新的多层神经网络预测模型

模型总体架构

本文提出考虑异常数据的多层神经网络预测模型(MLNN-CAD)，通过多级孤立森林异常识别、动态图构建、多层神经网络融合等创新技术，实现对异常数据下短时交通流的精准预测。

VMD-MIF

异常数据处理

GCN-ResGAT

空间信息提取

Informer-XLSTM

时空信息提取

卷积融合层

预测值生成

创新一：多级孤立森林算法

核心改进

结合各交通参数间的约束关系与交通流内在结构和规律，提高异常数据识别精度

技术优势

• 克服传统单参数局限
• 考虑多参数约束关系
• 结合VMD分解技术
• 精准识别异常数据

创新二：动态图构建机制

异常影响动态图

结合节点距离、皮尔逊相关系数及交通流量构建，精准捕获异常影响动态范围

重要节点动态图

结合交通拥堵指数构建，有效捕获交通流局部动态信息

技术实现框架

空间信息提取

• 融合GCN与ResGAT
• 提取全局空间信息
• 捕获异常影响空间特征
• 识别重要节点空间信息

时空信息提取

• Informer提取全局时空信息
• XLSTM提取异常影响时空信息
• 捕获重要节点时空特征
• 多尺度时序建模

融合预测

• 卷积融合层设计
• 多源信息有效整合
• 生成最终预测值
• 提升预测精度

数学模型表达

交通流预测问题表达

X_T+1, ..., X_T+R = F_X{X'', A, E, K}

输入参数

• X'': 补全后的交通流量数据集
• A: 原始图结构
• E: 交通流量异常数据集
• K: 关键节点交通流量数据集

输出参数

• X_T+1,...,T+R: 未来R时间步交通流量
• F_X: 交通流预测映射函数
• R: 预测时间步长

实验结果：PeMS数据集验证

实验设置

实验数据

• PeMS04和PeMS08真实交通流数据
• 时间范围：2018年1月1日-2月18日
• 真实道路网络交通流量
• 包含多种异常情况数据

对比模型

• HA、BiGRU、Informer
• XLSTM、STSGCN、STFGCN
• VMD-AGCGRN等7种模型
• 涵盖传统到深度学习方法

性能提升结果

PeMS04数据集表现

7.68%

MAE提升

10.36%

RMSE提升

6.06%

MAPE提升

相较于VMD-AGCGRN模型的显著性能提升

方法有效性验证

精度全面提升

MAE、RMSE、MAPE 三项指标均显著改善

异常数据处理

多级孤立森林算法有效识别异常数据

时空建模优势

动态图构建机制精准捕获时空依赖

与现有方法对比优势

实验结果表明，MLNN-CAD模型在处理异常数据条件下的短时交通流预测方面具有显著优势，为智能交通系统提供了更加可靠的预测基础。

相对传统方法

相比HA、ARIMA等传统方法，能够更好地处理非线性时空依赖关系

相对深度学习方法

相比现有深度学习模型，在异常数据处理和时空建模方面更加精准

实际应用与发展前景

应用领域

智能交通系统

交通流量预测，信号灯智能控制，路径优化规划

城市管理

交通拥堵预警，城市规划支持，应急响应管理

交通运营

运输效率优化，资源配置决策，服务质量提升

技术优势

异常数据处理能力

• 多级孤立森林异常识别
• VMD分解降噪处理
• 异常影响动态图构建
• 提升模型鲁棒性

时空建模优势

• GCN-ResGAT空间特征提取
• Informer-XLSTM时序建模
• 多层神经网络融合
• 精准捕获复杂依赖关系

发展前景

技术发展方向

结合更多外部因素数据，发展多模态交通流预测；集成边缘计算技术，支持实时在线预测

应用拓展

扩展到更多城市和道路网络，支持跨区域预测模型；集成到智能交通平台，提供实时决策支持

理论意义与价值

本研究提出的MLNN-CAD模型为异常数据下的短时交通流预测提供了具有可行性的理论基础，在交通流预测理论和智能交通系统发展方面具有重要意义。

理论创新

多级孤立森林算法的创新应用

方法突破

异常数据处理的系统性解决方案

应用价值

智能交通系统的可靠预测基础

研究背景与重要性

数据噪声

非平稳性

时空依赖

突发事件

交通流预测方法演进历程

第一阶段：传统统计学方法

典型模型

主要局限

第二阶段：浅层机器学习方法

典型模型

存在问题

第三阶段：深度学习方法

时序建模

空间建模

注意力机制

现有方法的局限性与挑战

核心问题：异常数据处理不足

异常数据来源

影响表现

技术方法局限性

异常识别不精确

传统矩阵缺陷

重要区域识别不足

研究空白与需求

MLNN-CAD：创新的多层神经网络预测模型

模型总体架构

VMD-MIF

GCN-ResGAT

Informer-XLSTM

卷积融合层

创新一：多级孤立森林算法

核心改进

技术优势

创新二：动态图构建机制

异常影响动态图

重要节点动态图

技术实现框架

空间信息提取

时空信息提取

融合预测

数学模型表达

输入参数

输出参数

实验结果：PeMS数据集验证

实验设置

实验数据

对比模型

性能提升结果

方法有效性验证

精度全面提升

异常数据处理

时空建模优势

与现有方法对比优势

相对传统方法

相对深度学习方法

实际应用与发展前景

应用领域

智能交通系统

城市管理

交通运营

技术优势

异常数据处理能力

时空建模优势

发展前景

技术发展方向

应用拓展

理论意义与价值

理论创新

方法突破

应用价值

MLNN-CAD模型的四大核心技术

多级孤立森林

动态图构建

多层神经网络

卷积融合层

智能交通的新突破：异常数据下的精准交通流预测