技术摘要:
本申请涉及一种地铁站人流量峰值的预测方法、装置和计算机设备。所述方法包括:根据历史数据获得人流密集地铁站及其人流量峰值时段,构建训练样本集,将其输入基于图卷积的时空特征提取网络、峰值判别网络和峰值预测网络的预测模型,提取人流密集地铁站的人流量时空特 全部
背景技术:
城市作为区域经济、政治和文化的中心,城市居民的日常出行需求呈多样化高频 次的特点。但公共交通拥挤、公共场所人群密集、道路交通拥堵等低出行舒适度的问题也日 益突出。对人流密集区域或交通站点人流量变化进行预测有利于人流密集管控、道路交通 疏导等措施的展开。 人流量变化预测的实现通常是根据历史观测数据构建人流量预测模型,使用该模 型预测未来一段时间内城市中某区域或交通站点的人群到达和离开的数量。人流量变化预 测属于时间序列预测的一种,根据其预测算法的不同可分为基于传统机器学习方法和深度 学习方法两大类。基于传统机器学习的人流量变化预测方法构建的大多数是单目标变量、 浅层的人流量变化预测模型。近年来,多数人流量预测模型采用了深度学习方法,利用全连 接层、经典卷积网络层或图卷积网络层对人流量时间序列进行空间维度的关联关系建模, 取得了比基于传统机器学习方法更好的预测性能。 但是目前的人流量变化预测方法往往在人流量出现峰值时出现低估的现象,即虽 然其预测结果高于同一时段历史平均值,但仍然低于真实的人流量。如地铁站的人流量变 化通常较有规律,其人流量高峰时段基本与人们上下班通勤时段一致。然而由于交通状况 的快速变化、社区活动、天气等多种因素,某些地铁站在某些时段可能出现特别大的人流量 高峰。这种突然出现的人流量“峰”值,远高于该地铁站同一时段历史平均的高峰人流量。现 有大部分人流量预测算法以降低平均预测误差为目标进行预测模型优化,这使得大多数模 型在上述“峰”值的预测上会出现“低估”的现象。这一问题非常不利于城市公共安全、人流 密集管控等措施的实施。
技术实现要素:
基于此,有必要针对上述技术问题,提供一种能够提高地铁站人流量峰值时段预 测准确度的一种地铁站人流量峰值的预测方法、装置和计算机设备。 一种地铁站人流量峰值的预测方法,所述方法包括: 从预设的数据源获取地铁站的历史人流量数据,根据历史人流量数据将对应地铁 站标记为人流密集地铁站,并获得人流密集地铁站的人流量峰值时段,根据人流密集地铁 站和对应的人流峰值时段构建训练样本集。 将训练样本集中的人流密集地铁站和对应的人流峰值时段输入预先设置的预测 模型,预测模型包括:基于图卷积的时空特征提取网络、基于全连接网络的峰值判别网络和 峰值预测网络。 由时空特征网络提取人流密集地铁站的人流量时空特征,由峰值判别网络和峰值 4 CN 111612281 A 说 明 书 2/12 页 预测网络输出峰值判别结果和峰值预测结果,根据人流量时空特征、峰值判别结果、峰值预 测结果以及预先设置的基于调整类别权重的损失函数,训练预测模型,得到训练好的预测 模型。 获取地铁站的实时人流量数据,将实时人流量数据输入训练好的预测模型,得到 实时人流量数据的峰值判别结果和峰值预测结果。 其中一个实施例中,基于调整类别权重的损失函数的构建方式包括: 根据峰值判别网络和所述峰值预测网络的分类损失与回归损失的比例调整因子、 调整类别损失的权重参数、正类样本和负类样本的修正交叉熵损失、正类样本和负类样本 的预测均方根误差,构建峰值判别损失函数和峰值预测损失函数。 其中一个实施例中,从预设的数据源获取地铁站的历史人流量数据,根据历史人 流量数据将对应地铁站标记为人流密集地铁站,并获得人流密集地铁站的人流量峰值时 段,根据人流密集地铁站和对应的人流峰值时段构建训练样本集的步骤包括: 从预设的数据源获取地铁站的历史人流量数据。 根据历史人流量数据和预设的人流密集站点阈值,将对应地铁站标记为人流密集 地铁站。 根据预设的观察时间窗口和预设的人流密集时段阈值,从历史人流量数据中得到 人流密集地铁站的人流量峰值时段。 根据人流密集地铁站和对应的人流峰值时段构建训练样本集。 其中一个实施例中,构建预先设置的预测模型的步骤包括: 定义各层图卷积的线性变换可学习参数矩阵,用于对人流密集地铁站的特征向量 进行行线性变换。 定义邻接可学习参数矩阵,用于对人流密集地铁站的特征向量进行相互交换。 基于图卷积网络定义人流量时空特征提取网络,基于分类与回归框架将人流量时 空特征提取网络分别接入基于全连接网络层的峰值判别网络和峰值预测网络。 其中一个实施例中,由时空特征网络提取人流密集地铁站的人流量时空特征,由 峰值判别网络和峰值预测网络输出峰值判别结果和峰值预测结果,根据人流量时空特征、 峰值判别结果、峰值预测结果以及预先设置的基于调整类别权重的损失函数,训练预测模 型,得到训练好的预测模型的步骤包括: 由时空特征网络提取人流密集地铁站的人流量时空特征,由峰值判别网络和峰值 预测网络输出峰值判别结果和峰值预测结果。 根据人流量时空特征、峰值判别结果和峰值预测结果,获得预先设置的基于调整 类别权重的损失函数的值。 当损失函数的值大于预设值时,采用梯度下降法计算并设置预测模型中的预测参 数的值。 当损失函数的值小于预设值时,获得训练好的预测模型。 其中一个实施例中,根据预设的基于调整类别权重的损失函数,采用训练样本集 训练预测模型的步骤包括: 采用梯度下降法计算并设置预测模型中的预测参数的值,将训练样本集输入预测 模型。 5 CN 111612281 A 说 明 书 3/12 页 当损失函数的值小于预设值时,获得训练好的预测模型。 其中一个实施例中,根据预设的观察时间窗口和预设的人流密集时段阈值,从历 史人流量数据中得到人流密集地铁站的人流量峰值时段的步骤,包括: 从历史人流量数据中获取在p个预设的时间窗口内进入人流密集地铁站的总人 数,当总人数大于预设的人流密集时段阈值时,将p个时间窗口设为人流密集地铁站的人流 量峰值时段。 其中一个实施例中,根据历史人流量数据和预设的人流密集站点阈值,将对应地 铁站标记为人流密集地铁站的步骤包括: 根据历史人流量数据得到进入地铁站的总人数,将总人数大于预设的人流密集站 点阈值的地铁站标记为人流密集地铁站。 一种地铁站人流量峰值的预测装置,其特征在于,装置包括: 训练样本集构建模块,用于从预设的数据源获取地铁站的历史人流量数据,根据 历史人流量数据将对应地铁站标记为人流密集地铁站,并获得人流密集地铁站的人流量峰 值时段,根据人流密集地铁站和对应的人流峰值时段构建训练样本集。 训练样本集输入模块,用于将训练样本集中的人流密集地铁站和对应的人流峰值 时段输入预先设置的预测模型,预测模型包括:基于图卷积的时空特征提取网络、基于全连 接网络的峰值判别网络和峰值预测网络。 预测模型训练模块,用于由时空特征网络提取人流密集地铁站的人流量时空特 征,由峰值判别网络和峰值预测网络输出峰值判别结果和峰值预测结果,根据人流量时空 特征、峰值判别结果、峰值预测结果以及预先设置的基于调整类别权重的损失函数,训练预 测模型,得到训练好的预测模型。 地铁站量人流峰值预测模块,用于获取地铁站的实时人流量数据,将实时人流量 数据输入训练好的预测模型,得到实时人流量数据的峰值判别结果和峰值预测结果。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在 于,所述处理器执行所述计算机程序时实现上述任意一个实施例中所述方法的步骤。 一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序 被处理器执行时实现上述任意一个实施例中所述方法的步骤。 上述一种地铁站人流量峰值的预测装置方法、装置、计算机设备和存储介质,利用 地铁站的历史数据确定地铁站人流量峰值时段相关参数,构建训练样本集,在分类与回归 框架上基于图卷积网络搭建峰值判别与预测网络,构建基于调整类别权重的损失函数,训 练得到地铁站峰值判别与预测模型,并利用该模型进行峰值预测。本申请针对地铁站人流 量预测问题,在分类与回归框架上提出基于图卷积的峰值判别与预测方法,可以避免以降 低平均预测误差为优化目标带来的模型峰值预测“低估”问题,有针对性地提高了地铁站人 流量预测在峰值时段的预测准确度。 附图说明 图1为一个实施例中地铁站人流量峰值的预测方法的步骤流程示意图; 图2为一个实施例中人流量时空特征提取网络的示意图; 图3为一个实施例中预测模型的组成示意图; 6 CN 111612281 A 说 明 书 4/12 页 图4为一个实施例中计算机设备的内部结构图。