技术摘要:
本发明公开了一种协同考虑时空相关性及贡献差异的多步交通速度预测方法,该方法使用了基于循环神经网络的编码‑解码的网络架构来充分表达交通速度的时序特性。在编码部分,对相关路段速度值所构成的输入向量引入第一阶段的注意力机制,使其自适应学习不同相关路段在不 全部
背景技术:
随着机动车数量的增长,交通拥堵问题日益严重,给人们的出行带来了诸多不便, 也对环境造成了污染,甚至威胁到了人们的生命安全。交通拥堵带来的直接问题是出行时 间增加。另一方面,机动车数量的增加所带来的交通拥堵使得行驶车辆启动、停止次数增 加、路上等待时间增加,导致了汽车尾气排放量的增加,造成大气的污染,严重危害着人类 健康。与此同时,交通拥堵也是交通事故频发的一大诱因。据统计,20世纪全世界因交通事 故而死亡的人数达2585万。 早期常用的方法以时间序列方法为主,时间序列模型通过对历史时间序列进行数 学建模,然后将其应用于预测未来的时间序列,如ARIMA方法。近二十年来,很多研究将包括 支持向量机等统计学习方法应用于时序问题建模。近几年,随着人工智能的发展,一些深度 学习方法,如循环神经网络、卷积神经网络等以及宽度学习方法也被应用在交通预测中。传 统的时间序列模型拟合能力弱,切缺乏非线性表达能力,难以模拟道路的真实状况,且没有 考虑到空间相关性。基于宽度学习的方法具有建模速度快的优势,基于循环神经网络的方 法和基于卷积神经网络的方法分别可以有效地表达交通速度的时间相关性和空间相关性。 但这些方法都没有区分不同时刻对于预测时刻的贡献度以及不同相关路段对于预测路段 的贡献度,且大多没有考虑天气、节假日等外部因素的影响。基于此,本发明所提出的方法, 既考虑了相关路段的影响,又考虑了历史时刻的影响,且融入了天气和节假日等外部因素 的影响。此外,本发明还通过注意力机制表达了不同相关路段和不同历史时刻的贡献差异 性,体现了较以往方法更加细粒度的时空相关关系。到目前为止,尚未见到与本发明相关的 研究报道。
技术实现要素:
本发明的目的在于针对现有交通速度预测方法的不足,提供一种考虑时空相关性 和贡献差异的多步交通速度预测方法。 本发明的目的是通过以下技术方案来实现的:一种考虑时空相关性和贡献差异的 多步交通速度预测方法,该方法包括以下步骤: 步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对 天气、节假日等外部因素数据进行类别分类。 步骤2:确定模型的输入变量和外部离散特征向量。 (2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的 优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于 5 CN 111613054 A 说 明 书 2/8 页 预测模型的建立。 (2.2)m为建模所需要的历史时间窗口的大小。设tp为第一个预测时刻,则模型预 测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m 1,...,tp- 1,其对应所需的速度输入向量记为 其中k为相关路段的个数。此外还要输 入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据。 步骤3:模型的建立和训练。 (3.1)确定相关路段的贡献程度,得到新的输入向量。 编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗 口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所 示: 其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前 时刻的前一时刻的f维隐藏层状态和细胞状态, 是所有输 入时刻的第j个相关路段速度值所组成的向量, 是网络需要学 习的参数。 使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数: 然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量: (3.2)对编码器网络的LSTM单元进行计算和更新。 将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式 如下,首先计算遗忘门fi、输入门ai、输出门oi: 其中, 是前一个时刻的隐藏层状态hi-1与当前时刻的输入 在向量维度上 的拼接。σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数。 然后计算更新当前的细胞状态: 其中,Ws,bs是待学习的参数,符号 ⊙ 表示对应元素相乘。 计算隐藏层状态如下: hi=oi ⊙ tanh(si) (8) (3.3)确定不同历史时刻的贡献程度,得到新的输入向量。 6 CN 111613054 A 说 明 书 3/8 页 解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp 1 ,tp 2,tp为 第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态 以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下: 其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和 细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数。 采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数: 然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码 器中所有时刻的隐藏层状态的加权和ct: 将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻 LSTM单元的输入向量: xt=[ct;yt-1] (12) (3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新。 (3.5)构建考虑外部因素的全连接神经网络。 在预测t时刻的交通速度时,我们将解码器的输出和由外部因素组成的离散特征 拼接起来,并将它们输入到一个全连接神经网络,得到最终的输出 其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日 期,Wn和bn是待学习的参数。 (3.6)模型的训练。 采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得 最终参数得到训练好的模型。 步骤4:模型在线预测。 对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样 本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。 进一步地,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不 同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。 对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z 个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量 可以表示为v Tu (1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。 对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三 类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期 类型,路段u在p天内的天气数据表示为w Tu (1×24p),日期类别数据表示为d Tu (1×24p)。 7 CN 111613054 A 说 明 书 4/8 页 与现有技术相比,本发明的有益效果是:本方法从实际交通数据的特点出发,不仅 考虑了交通速度的时间相关特性和空间相关特性,而且考虑了天气、节假日等外部因素的 影响。时间特性上,我们利用LSTM来充分学习交通速度的时序关联性,还考虑了不同历史时 刻对不同预测时刻的贡献差异性,并通过注意力机制来学习这种差异;空间特性上,我们在 对目标路段进行预测时,充分考虑了相关路段对其的影响,考虑到不同相关路段对预测路 段的影响不同,使用注意力机制来学习这种贡献差异。本方法充分考虑了不同历史时刻的 贡献差异和不同相关路段的贡献差异。相比以往的方法,本方法是一种对时空特性刻画更 加细粒度、更加全面的端到端方法,为交通速度预测提供了一种有效易行的方法,为实际道 路状况预测的研究指明了新的方向。 附图说明 图1是本发明方法架构图。 图2是使用本发明在不同预测步下的10个路段上的预测结果RMSE的均值与其他三 种方法的对比图。 图3是使用本发明在不同预测步下的10个路段上的预测结果的RMSE的标准差与其 他三种方法的对比图。
本发明公开了一种协同考虑时空相关性及贡献差异的多步交通速度预测方法,该方法使用了基于循环神经网络的编码‑解码的网络架构来充分表达交通速度的时序特性。在编码部分,对相关路段速度值所构成的输入向量引入第一阶段的注意力机制,使其自适应学习不同相关路段在不 全部
背景技术:
随着机动车数量的增长,交通拥堵问题日益严重,给人们的出行带来了诸多不便, 也对环境造成了污染,甚至威胁到了人们的生命安全。交通拥堵带来的直接问题是出行时 间增加。另一方面,机动车数量的增加所带来的交通拥堵使得行驶车辆启动、停止次数增 加、路上等待时间增加,导致了汽车尾气排放量的增加,造成大气的污染,严重危害着人类 健康。与此同时,交通拥堵也是交通事故频发的一大诱因。据统计,20世纪全世界因交通事 故而死亡的人数达2585万。 早期常用的方法以时间序列方法为主,时间序列模型通过对历史时间序列进行数 学建模,然后将其应用于预测未来的时间序列,如ARIMA方法。近二十年来,很多研究将包括 支持向量机等统计学习方法应用于时序问题建模。近几年,随着人工智能的发展,一些深度 学习方法,如循环神经网络、卷积神经网络等以及宽度学习方法也被应用在交通预测中。传 统的时间序列模型拟合能力弱,切缺乏非线性表达能力,难以模拟道路的真实状况,且没有 考虑到空间相关性。基于宽度学习的方法具有建模速度快的优势,基于循环神经网络的方 法和基于卷积神经网络的方法分别可以有效地表达交通速度的时间相关性和空间相关性。 但这些方法都没有区分不同时刻对于预测时刻的贡献度以及不同相关路段对于预测路段 的贡献度,且大多没有考虑天气、节假日等外部因素的影响。基于此,本发明所提出的方法, 既考虑了相关路段的影响,又考虑了历史时刻的影响,且融入了天气和节假日等外部因素 的影响。此外,本发明还通过注意力机制表达了不同相关路段和不同历史时刻的贡献差异 性,体现了较以往方法更加细粒度的时空相关关系。到目前为止,尚未见到与本发明相关的 研究报道。
技术实现要素:
本发明的目的在于针对现有交通速度预测方法的不足,提供一种考虑时空相关性 和贡献差异的多步交通速度预测方法。 本发明的目的是通过以下技术方案来实现的:一种考虑时空相关性和贡献差异的 多步交通速度预测方法,该方法包括以下步骤: 步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对 天气、节假日等外部因素数据进行类别分类。 步骤2:确定模型的输入变量和外部离散特征向量。 (2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的 优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于 5 CN 111613054 A 说 明 书 2/8 页 预测模型的建立。 (2.2)m为建模所需要的历史时间窗口的大小。设tp为第一个预测时刻,则模型预 测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m 1,...,tp- 1,其对应所需的速度输入向量记为 其中k为相关路段的个数。此外还要输 入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据。 步骤3:模型的建立和训练。 (3.1)确定相关路段的贡献程度,得到新的输入向量。 编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗 口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所 示: 其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前 时刻的前一时刻的f维隐藏层状态和细胞状态, 是所有输 入时刻的第j个相关路段速度值所组成的向量, 是网络需要学 习的参数。 使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数: 然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量: (3.2)对编码器网络的LSTM单元进行计算和更新。 将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式 如下,首先计算遗忘门fi、输入门ai、输出门oi: 其中, 是前一个时刻的隐藏层状态hi-1与当前时刻的输入 在向量维度上 的拼接。σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数。 然后计算更新当前的细胞状态: 其中,Ws,bs是待学习的参数,符号 ⊙ 表示对应元素相乘。 计算隐藏层状态如下: hi=oi ⊙ tanh(si) (8) (3.3)确定不同历史时刻的贡献程度,得到新的输入向量。 6 CN 111613054 A 说 明 书 3/8 页 解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp 1 ,tp 2,tp为 第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态 以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下: 其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和 细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数。 采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数: 然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码 器中所有时刻的隐藏层状态的加权和ct: 将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻 LSTM单元的输入向量: xt=[ct;yt-1] (12) (3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新。 (3.5)构建考虑外部因素的全连接神经网络。 在预测t时刻的交通速度时,我们将解码器的输出和由外部因素组成的离散特征 拼接起来,并将它们输入到一个全连接神经网络,得到最终的输出 其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日 期,Wn和bn是待学习的参数。 (3.6)模型的训练。 采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得 最终参数得到训练好的模型。 步骤4:模型在线预测。 对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样 本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。 进一步地,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不 同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。 对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z 个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量 可以表示为v Tu (1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。 对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三 类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期 类型,路段u在p天内的天气数据表示为w Tu (1×24p),日期类别数据表示为d Tu (1×24p)。 7 CN 111613054 A 说 明 书 4/8 页 与现有技术相比,本发明的有益效果是:本方法从实际交通数据的特点出发,不仅 考虑了交通速度的时间相关特性和空间相关特性,而且考虑了天气、节假日等外部因素的 影响。时间特性上,我们利用LSTM来充分学习交通速度的时序关联性,还考虑了不同历史时 刻对不同预测时刻的贡献差异性,并通过注意力机制来学习这种差异;空间特性上,我们在 对目标路段进行预测时,充分考虑了相关路段对其的影响,考虑到不同相关路段对预测路 段的影响不同,使用注意力机制来学习这种贡献差异。本方法充分考虑了不同历史时刻的 贡献差异和不同相关路段的贡献差异。相比以往的方法,本方法是一种对时空特性刻画更 加细粒度、更加全面的端到端方法,为交通速度预测提供了一种有效易行的方法,为实际道 路状况预测的研究指明了新的方向。 附图说明 图1是本发明方法架构图。 图2是使用本发明在不同预测步下的10个路段上的预测结果RMSE的均值与其他三 种方法的对比图。 图3是使用本发明在不同预测步下的10个路段上的预测结果的RMSE的标准差与其 他三种方法的对比图。