logo好方法网

一种基于排序学习的多数据源航班起飞时间预测方法


技术摘要:
本发明公开了一种基于排序学习的多数据源航班起飞时间预测方法,包括以下步骤:使用航班属性和航班起飞预测时间的历史数据进行预测模型训练;对预测模型进行优化;通过预测模型对多数据源航班起飞时间的实时数据进行采信。该方法将排序学习算法应用于航班预计起飞时间  全部
背景技术:
航班的起飞时间预测(ETD,estimated  time  of  departure),决定了民航客机对 地面、空域等资源的占用,对于空管、机场、航空公司等航空单位的工作效率极其重要。针对 同一航班,其起飞时间的预测通常来源于多个单位,各数据源由于各自掌握不同的资源,其 预计的覆盖范围、误差分布各不相同,经常产生分歧,如何实现优质的综合采信决策是一个 值得解决的问题。单数据源的采信方案,可将数据源的采信与否建模成一个二分类问题,使 用常见的二分类算法来解决,如贝叶斯方法、SVM、多层神经网络等。多数据源的采信方案, 可基于二分类模型直接向多分类模型进行扩展,是一种直观的实现方案;基于统计的方法 对每个数据源进行评价,参考其置信度,也可以实现多数据源采信任务。 但是,在多数据源的采信方法中,基于多分类和统计学的方案均难以利用数据源 之间的互补性质。借助排序学习算法,将收到的所有数据源全部纳入一个模型,则可以充分 地利用所有数据源。在训练数据的获取上,现有技术往往局限于各数据源内部分别建模。假 设各数据源的预测逻辑长时间保持稳定,即其误差关于选取的特征组合的分布稳定,当同 时收到两个预测值相差过大的数据源时,误差较大的数据源虽然不应被采用,但不代表其 出现得毫无价值,任何其他预测无论正确与否,其本身也贡献了一定的信息量,对选取正确 的数据源理应有所帮助。
技术实现要素:
针对现有技术中所存在的问题,本发明提出一种基于排序学习的多数据源航班起 飞时间预测方法,解决在多数据源的采信方法基于多分类和统计学的方案均难以利用数据 源之间互补性质,借助排序学习算法,将收到的所有数据源全部纳入一个模型,充分提高多 源数据的利用率。 为达到以上目的,本发明一方面提出一种基于排序学习的多数据源航班起飞时间 预测方法,包括以下步骤: 步骤S1、获取航班属性和航班起飞预测时间的多源历史数据,使用排序学习算法 训练预测模型; 步骤S2、优化预测模型; 步骤S3、通过预测模型对多源航班预测起飞时间进行决策。 优选地,所述步骤S1的工作流程为: 步骤S11、采集所有航班属性和航班起飞预测信息的历史数据; 步骤S12、将历史数据分为训练集和预测集; 步骤S13、对训练集的历史数据进行时间轴采样和特征提取,形成训练集文档; 4 CN 111599219 A 说 明 书 2/5 页 步骤S14、根据训练集文档预测起飞时间与给定起飞时间之间的误差绝对值,对训 练集文档进行相关性标注选分类; 步骤S15、调用排序学习算法训练预测模型。 优选地,所述步骤S11的航班属性包括航班号、起飞机场;所述航班起飞预测信息 包括预测数据源、预测起飞时间、预测发生时间。 优选地,所述步骤S13是将特定航班属性在预测时间点形成的组合作为排序学习 算法的查询,该航班属性与早于上述时间点的若干个预测时间点形成的组合作为排序算法 的训练集文档。 优选地,所述步骤S14相同误差绝对值的文档,其权重大小误差正负值确定。 优选地,所述步骤S15使用排序学习算法对训练文档集进行K折交叉验证法进行训 练,得到预测模型。 优选地,所述步骤S2使用历史数据的预测集,根据排序评价指标归一化贴现累计 收益ndcg,对预测模型进行优化调整。 优选地,所述步骤S3的工作流程为: 步骤31、获取需要对预测起飞时间进行决策的全部航班属性; 步骤32、根据航班属性获取该航班所有的预测起飞时间; 步骤33、形成针对当前时间的实时航班文档集; 步骤34、将实时航班文档集输入已训练好的预测模型,将评分最高的预测时间决 策为采信预测。 另一方面,本发明提供一种电子设备,包括中央处理器以及存储计算机可执行指 令的存储器,其特征在于,所述计算机可执行指令在被执行时使所述处理器执行上述方法。 再一方面,本发明提供一种非易失性存储介质,其中存储有计算机程序,所述计算 机程序在执行上述方法。 本发明相对于现有技术取得了如下的技术效果: 本发明的方法将排序学习算法应用于航班预计起飞时间预测的多数据源决策采 信中,基于多数据源对航班预测起飞时间的历史数据进行时间采样,结合航班属性形成航 班文档集,并基于预测误差的航班起飞时间预测进行相关性标注,调用排序学习算法获取 得分最高的预测起飞时间作为决策采信。本发明的方案将航班的所有数据源的历史预测数 据结合在一起,合理利用了预测信息量,训练数据丰富,统一模型解决航班整个生命周期中 任何时刻预测采信问题的综合决策。 附图说明 以下附图仅对本发明作示意性的说明和解释,并不用于限定本发明的范围,其中: 图1示出本发明一个实施例的一种基于排序学习的多数据源航班起飞时间预测方 法流程图; 图2示出本发明一个实施例的使用排序学习算法训练预测模型的流程图; 图3示出本发明一个实施例的通过预测模型对多源航班预测起飞时间进行决策流 程图。 图4示出本发明一个实施例的基于规则的决策模型和排序学习模型的性能比较 5 CN 111599219 A 说 明 书 3/5 页 图。
下载此资料需消耗2积分,
分享到:
收藏