技术摘要:
本申请公开了电梯调度模型训练方法、装置、电子设备和存储介质,涉及电梯技术领域。方案为:获取包括多个电梯在各时刻的运行状态信息训练样本集;利用初始调度模型,对多个电梯在第一时刻的运行状态信息进行编码解码处理,生成与第一时刻的运行状态信息对应的第一调度 全部
背景技术:
电梯是多高层建筑的主要垂直运输工具,除平时担负客货运输外,还兼有消防功 能。随着人们生活水平的提高,电梯越来越普及。 目前电梯调度系统,主要是依据调度规则对电梯进行控制。但是,这种控制方法比 较适合单个电梯的情况,而现在已经进入电梯群控的时代,依据调度规则无法合理地控制 多部电梯,让电梯合作运送乘客。可见,现有的电梯控制方法,扩展性差、且控制效率低。
技术实现要素:
本申请提供一种电梯调度模型训练方法、装置、电子设备以及存储介质,用于解决 现有技术中依据调度规则对电梯进行控制的方式,扩展性差、且控制效率低的问题。 根据第一方面,提供了一种电梯调度模型训练方法,包括: 获取训练样本集,其中所述样本集中包括多个电梯在各时刻的运行状态信息; 利用初始调度模型,对所述多个电梯在第一时刻的运行状态信息进行编码解码处 理,生成与所述第一时刻的运行状态信息对应的第一调度策略; 依据第一预设的规则,生成与所述第一时刻的运行状态信息对应的第一修正调度 策略; 依据第二预设的规则,确定所述第一调度策略对应的第一奖励值、及所述第一修 正调度策略对应的第二奖励值; 若所述第二奖励值大于所述第一奖励值,则根据所述第一修正调度策略与所述第 一调度策略的差异,对所述初始调度模型进行反向传播修正; 利用修正后的模型继续对所述多个电梯的运行状态信息进行编码解码处理,直至 生成的调度策略对应的奖励值在预设范围内,以利用生成的调度模型进行电梯调度。 本申请实施例的电梯调度模型方法,通过首先获取包括多个电梯在各时刻的运行 状态信息的训练样本集,然后利用初始调度模型,对所多个电梯在第一时刻的运行状态信 息进行编码解码处理,生成与第一时刻的运行状态信息对应的第一调度策略,之后依据第 一预设的规则,生成与第一时刻的运行状态信息对应的第一修正调度策略,并依据第二预 设的规则,确定第一调度策略对应的第一奖励值、及第一修正调度策略对应的第二奖励值, 若第二奖励值大于第一奖励值,则根据第一修正调度策略与第一调度策略的差异,对初始 调度模型进行反向传播修正,再利用修正后的模型继续对多个电梯的运行状态信息进行编 码解码处理,直至生成的调度策略对应的奖励值在预设范围内,以利用生成的调度模型进 行电梯调度。由此,通过利用多个电梯在各时刻的运行状态信息,训练电梯调度模型,利用 调度模型对电梯进行控制,可以应用在不同的场景,也可协同控制多个电梯,控制方式可扩 5 CN 111598211 A 说 明 书 2/12 页 展性强,效率高。 根据第二方面,提供了一种电梯调度模型装置,包括: 获取模块,用于获取训练样本集,其中所述样本集中包括多个电梯在各时刻的运 行状态信息; 第一生成模块,用于利用初始调度模型,对所述多个电梯在第一时刻的运行状态 信息进行编码解码处理,生成与所述第一时刻的运行状态信息对应的第一调度策略; 第二生成模块,用于依据第一预设的规则,生成与所述第一时刻的运行状态信息 对应的第一修正调度策略; 确定模块,用于依据第二预设的规则,确定所述第一调度策略对应的第一奖励值、 及所述第一修正调度策略对应的第二奖励值; 修正模块,用于当所述第二奖励值大于所述第一奖励值时,根据所述第一修正调 度策略与所述第一调度策略的差异,对所述初始调度模型进行反向传播修正; 所述第一生成模块,还用于利用修正后的模型继续对所述多个电梯的运行状态信 息进行编码解码处理,直至生成的调度策略对应的奖励值在预设范围内,以利用生成的调 度模型进行电梯调度。 本申请实施例的电梯调度模型训练装置,通过获取包括多个电梯在各时刻的运行 状态信息的训练样本集,利用初始调度模型,对所多个电梯在第一时刻的运行状态信息进 行编码解码处理,生成与第一时刻的运行状态信息对应的第一调度策略,依据第一预设的 规则,生成与第一时刻的运行状态信息对应的第一修正调度策略,并依据第二预设的规则, 确定第一调度策略对应的第一奖励值、及第一修正调度策略对应的第二奖励值,若第二奖 励值大于第一奖励值,则根据第一修正调度策略与第一调度策略的差异,对初始调度模型 进行反向传播修正,利用修正后的模型继续对多个电梯的运行状态信息进行编码解码处 理,直至生成的调度策略对应的奖励值在预设范围内,以利用生成的调度模型进行电梯调 度。由此,通过利用多个电梯在各时刻的运行状态信息,训练电梯调度模型,利用调度模型 对电梯进行控制,可以应用在不同的场景,也可协同控制多个电梯,控制方式可扩展性强, 效率高。 根据第三方面,提供了一种电子设备,包括: 至少一个处理器;以及 与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一 个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的电梯调度模型 训练方法。 根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其 上存储有计算机程序,所述计算机指令用于使所述计算机执行上述一方面实施例所述的电 梯调度模型训练方法。 根据本申请的技术解决了依据调度规则对电梯进行控制的方式,扩展性差、且控 制效率低的问题,本申请实施例中通过利用多个电梯在各时刻的运行状态信息,训练得到 调度模型,利用调度模型对电梯进行控制,可以应用在不同的场景,也可协同控制多个电 梯,控制方式可扩展性强,效率高。 6 CN 111598211 A 说 明 书 3/12 页 上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1为本申请实施例提供的一种电梯调度模型训练方法的流程示意图; 图2为本申请实施例提供的另一种电梯调度模型训练方法的流程示意图; 图3为本申请实施例提供的一种电梯调度模型训练装置的结构示意图; 图4为本申请实施例提供的另一种电梯调度模型训练装置的结构示意图; 图5为根据本申请实施例的电梯调度模型训练方法的电子设备的框图。