logo好方法网

一种贸易信息风险预警模型的构建方法及应用


技术摘要:
本发明公开了一种贸易信息风险预警模型的构建方法及应用,所述构建方法包括以下步骤:S1、构建复杂网络:从历史商品信息表中提取有效实体信息,将各个有效实体信息作为实体节点,将相互关联的两个实体节点连线构成边,所述实体节点和边构成复杂网络结构;S2:量化复杂  全部
背景技术:
在贸易的商品运输过程中,运输交通(货车、火车、货船、飞机)随行上报一份信息 表,表中如实记录了所运输商品的相关信息,如商品名、商品重量、生产企业、货主单位、物 流单位、来源地、目的地等。如果出现运输的商品与上报信息不符(如商品实际重量或数量 与上报信息不符、夹带其他未报备物品、运输违规物品等异常时),需要及时处置这些异常。 因此,在到达目的地时检查人员会依据上报信息与实际检查结果及当地的政策等来判断运 输的各种商品是否异常。随着各地的贸易运输越来越频繁,受限于时间成本,检查人员无法 对所有的商品逐一进行检查,只能进行抽检,虽然经验丰富的检查人员可以凭经验更有效 的抽查,但仍然费时费力,且抽检工作经验很难固化,如何提高检查效率(尽可能快地把异 常商品、异常企业查出来)并降低人力成本是一个亟待解决的问题。 利用机器学习和深度学习方法建模,其准确率受到多种因素影响,例如,当数据在 各个维度关联不大、数据正负样本极度不平衡,这些方法可能难以学到有效的特征,且模型 的经济性与实时性较差,通常还会耗费大量的算力进行训练。在商品的贸易运输中,上报的 信息表中包含的数据维度信息比较基础,过于离散,需要人工整合。例如,信息表中包含了 企业成立时间,若想量化企业成立时间,则需要用当前时间减去企业成立时间。并且不同信 息表的数据之间往往是有关联的,贸易活动本身受多方影响,如生产企业、运输公司、代理 人等之间利益关系比较复杂,因而用单份信息表直接作为输入去训练一个机器学习或深度 学习的模型,预测问题商品或问题企业的准确率不会高于人工抽检,效果不理想。
技术实现要素:
本发明的目的在于提供一种贸易信息风险预警模型的构建方法,将构建的模型用 于贸易商品抽检,解决现有技术导致抽检准确率低、抽检工作量大的问题。 本发明通过下述技术方案实现: 一种贸易信息风险预警模型的构建方法,包括以下步骤: S1、构建复杂网络:从历史商品信息表中提取有效实体信息,将各个有效实体信息 作为实体节点,将相互关联的两个实体节点连线构成边,其中,同一张商品信息表中的实体 节点间的连线为表内部边,不同商品信息表中的实体节点间的连线为表外部边,所述实体 节点和边构成复杂网络结构; S2:量化复杂网络:统计历史商品信息表的抽查数据计算问题率,以问题率作为实 体节点与边关系的量化特征量化实体节点和边的风险值; S3:构建风险预警模型:根据历史商品信息表的抽查数据对实体节点和边的风险 值赋权重,得到权重函数,然后加权求和实体节点和边的风险值得到风险预警模型,所述权 4 CN 111598408 A 说 明 书 2/7 页 重为风险项的重要性系数,所述权重函数依据历史商品信息表的抽查数据调整。 本发明根据历史检查数据构造复杂网络的节点和边。复杂网络的实体节点代表某 种实体,如商品种类、到达时间、企业信息、联系电话、检查结果等;复杂网络的边代表其两 端实体节点间的关系;本申请以商品信息表为基本单元进行阐述。建复杂网络结构时,每张 商品信息表都提取了相同维度的信息作为实体节点,信息表的网络结构应当是连通的(至 少与表ID相连),相互关联具体是指根据实际数据判断2个实体节点之间是否存在某种联 系,例如商品E由O公司生产,那么商品E与O公司相互关联。 本发明可以进行风险评估,即按任意连续的时间区间统计并展示检查结果和预测 结果,包括实际检查结果的问题项(如重量与上报不符)、商品信息表的预测结果、某类实体 节点或边的风险指标(如企业节点或商品节点的风险分布,企业和企业边关系或商品和商 品边关系的风险分布),以便于工作人员分析异常信息的变化趋势用于指导后续的检查工 作。实际使用中,舍弃过于久远(如5年前)的数据,在模型中加入最新的数据,实现模型的定 期更新,包括增删复杂网络中节点与边、更新风险值以及更新权重等步骤。 实验表明,模型的预测准确率高于人工筛查,说明本发明提出基于复杂网络的建 模方法有一定的风险预测能力,且通过风险指标分析可以发现异常信息的变化趋势。 进一步地,步骤S1中提取有效实体信息的过程为: 从历史数据中选取N张商品信息表,对每张商品信息表Sn(n=1,2,...,N)都提取K 维的有效实体信息,将K维有效实体信息作为复杂网络的实体节点,则在复杂网络中构造了 N·K个实体节点。 本发明对对每张商品信息表都用相同的方式构造边关系(如图1所示): 商品信息表中的K节点应当连通,且原则上可以任意连接,但应当具有一定的实际 含义,如商商品信息表中的K节点应当连通,且原则上可以任意连接,但应当具有一定的实 际含义,如商品节点和生产企业节点相连,表示商品和企业有生产或购买或运输等关系。将 对单张信息表构造的E1条有实际意义的连边称为表内部边,则在每张商品信息表中有K-1 ≤E1≤K(K-1)2条边;即复杂网络中构造了N·E1条内部边。 进一步地,步骤S1中表外部边为不同商品信息表中同种类型的实体节点间连线或 不同商品信息表中不同类型的实体节点间连线。 对不同商品信息表的同种类型节点进行连边,如图2中的A类和B类节点所示(即A1 与A2相连,B1与B2相连;不同类型的节点也可以相连,连接与否与实际数据有关),边代表了 两端的同类型的实体节点的关系。例如,不同商品信息表企业节点的连边,表示企业和企业 之间存在某种关系,如长期合作关系或者同时运输的关系等。如此,设在复杂网络中共构造 了E2条同类型节点不同信息表之间的边。 对不同商品信息表的不同类型节点进行连边,如图2中的C类和D类节点所示(即C1 与D2相连,C2与D1相连,连接与否与实际数据有关),边代表了其两端不同类型的实体节点存 在某种关系。例如,同一自然人作为多家企业的法定代表人、企业生产不同的商品等。如此, 构造了E3条边。 进一步地,步骤S1中所述实体节点包括商品节点、生产企业节点、运输公司节点、 代理公司节点和法定代表人节点。 进一步地,步骤S2中问题率包括实体节点问题率、表内部边问题率和表外部边问 5 CN 111598408 A 说 明 书 3/7 页 题率。 进一步地,实体节点问题率为该实体节点的检查结果异常次数与总检查次数的比 值。 例如,对于商品节点自身,通过统计历史检查数据,每一种商品都有一个问题率, 定义问题率为 R(G)即商品G的风险值,同理,生产企业、运输公司、代理公司、法定代表人等都可 以通过在信息表中的问题率作为复杂网络中该类节点的问题率。 进一步地,表内部边问题率以两端的实体节点计算,当两端的实体节点为商品和 生产企业时,表内部边问题率的计算模型如下: 进一步地,表外部边问题率以两端的实体节点计算,当两端的实体节点代表两种 商品时,表外部边问题率的计算模型如下: 进一步地,风险预警模型如下: 其中,S为商品信息表,K为商品信息表S中的实体节点数量,E1为表内部边数量, Eout为表外部边数量,W为权重函数,R为风险值。 一种贸易信息风险预警模型的应用,将构建的风险预警模型用于新运输行为中的 商品信息风险预测: 先按照构建风险预警模型的建模方法提取商品信息表中的实体节点与边;然后在 复杂网络模型中匹配,将复杂网络模型中相同实体节点及相同边的风险值赋给待预测的商 品信息表;按照风险预警模型中的加权求和方式预测商品信息风险。 本发明利用构建的风险预警模型预测商品信息表的风险值,能够减少实际的抽检 量并提高异常商品的命中率,从而提升检查人员的工作效率,且风险指标项也在一定程度 上固化了特征,降低了人员培养成本。 例如: 设待预测的商品信息表为Snew,它的某个节点是Va,在复杂网络模型中作匹配。若 模型中也有一个节点Vb与节点Va完全相同(即节点类型与内容相同,如相同的企业),则企业 风险值R(Va)=R(Vb),若Va没有匹配到,则R(Va)=Cv,Cv是常数。 设待预测商品信息表Snew的某条边为Ea,同理,若复杂网络中也有一条边Eb与Ea完 全相同(即边两端的节点类型和内容以R(Snew)及边代表的关系相同),则R(Ea)=R(Eb),若Ea 没有配到到,则R(Ea)=Ce,Ce是常数。 按复杂网络模型的加权求和方式,权重函数W与模型相同,得到新信息表Snew的风 6 CN 111598408 A 说 明 书 4/7 页 险预测值: 然后,设置一阈值T,当R(Snew)>T时,模型便提醒检查人员该运输商品可能有较高 风险,同时反馈商品信息表的实体节点和边关系的风险值辅助人工筛查。 本发明与现有技术相比,具有如下的优点和有益效果: 1、本发明采用了复杂网络方法对贸易风险进行数据建模,利用商品信息表的有效 实体信息构造复杂网络的实体节点,用实体节点之间的关系构造复杂网络的边,并利用历 史数据量化节点与边的风险值,即设计了有效特征,能够深刻表示数据实体自身特点及数 据之间的关系,能够较好地聚焦商品信息表的风险特征。利用构建的风险预警模型预测商 品信息表的风险值,能够减少实际的抽检量并提高异常商品的命中率,从而提升检查人员 的工作效率,解决了现有技术导致抽检准确率低、抽检工作量大的问题。 2、本发明通过构建的风险预警模型中的且风险指标项也在一定程度上固化了特 征,降低了人员培养成本。 3、本发明可以按任意连续时间统计并展示所有的检查结果与检查异常结果以及 模型预测结果,并统计检查的异常项与模型预测的整体风险值以及各类节点与边的风险指 标(如企业的风险指标、商品的风险指标),形成可视化的风险评估表,以供工作人员分析贸 易运输的异常趋势;除此以外,系统的数据库会存储新的商品信息表,模型应定期更新参 数,主要步骤有:1)、增删实体节点和边;2)、重新统计实体节点和边的问题率,更新风险值; 3)、更新权重函数。 附图说明 此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部 分,并不构成对本发明实施例的限定。在附图中: 图1为商品信息表的网络结构示意图; 图2为两张商品信息表的节点连边方式示意图; 图3为贸易信息风险预警流程示意图。
下载此资料需消耗2积分,
分享到:
收藏