logo好方法网

信用债发债主体违约风险评估方法、系统及装置


技术摘要:
本发明公开了信用债发债主体违约风险评估方法,包括,获取与发债主体匹配的公开新闻文本数据;定义风险主题和与其对应的风险种子词;对风险种子词进行扩展,构建风险关键词典;构建关键词多维风险特征体系;构建词评分模型,对风险关键词典中的词进行风险评分;计算新  全部
背景技术:
自2014年我国债券市场“刚性兑付”神话被打破后,债券违约现象日益升温,2018 年债券市场违约事件共涉及44家企业发行的160只债券,违约余额高达1505.25亿元,违约 严重程度达历史之最。在债券市场信用风险加速暴露、违约事件发生趋于常态化的背景下, 如何对发债主体违约风险进行有效评估与提前预测成为当前面临的重要监管难题。由于信 息不完全,单纯依靠财务报表、经济数据以及市场交易数据已难以充分解释违约风险溢价 问题。如何解决财务数据严重滞后问题,如何获取非上市公司相关信息从而对其信用风险 进行有效识别,以及如何实现对全市场信用债发债主体违约风险的动态监测预警成为当前 亟需解决的问题。 随着信息技术的迅速发展和网络媒体的广泛覆盖,来自开放互联网渠道的海量高 频新闻文本数据成为了金融行业监管和风险管理与评价的重要信息来源。与信用债发债主 体有关的新闻报道一方面可以揭示公司部分经营情况,另一方面能够揭露相关行业、监管 部门或其他市场参与者对企业发出的各类舆情。为了较为精准地识别和提取包含在新闻文 本中的重要信息,基于词典的文本挖掘方法被广泛使用。但是现有的舆情词典很难完成这 一任务,首先自然语言处理领域通用的舆情词典在金融背景下准确程度和适配程度低,难 以发挥作用;而专业的金融舆情词典也相对陈旧和笼统,无法精准描述企业的各类经营情 况及其面临的各类风险;再加上传统的舆情词典只包括词语及其词性和极性等简单特征, 不包括其他风险特征,信息含量不足。因此如何建立完善、准确、可扩展的风险关键词典,并 进一步构建关键词的风险特征体系,丰富舆情词典内涵,是当前研究的重点。
技术实现要素:
本发明的目的是提供一种信用债发债主体违约风险评估方法及装置,其通过定义 不同的风险主题种子词,利用来自公开互联网渠道的新闻文本数据,基于自然语言处理方 法,构建以“种子词-扩展词”为基本结构的风险关键词典,进一步构建关键词多维风险特征 体系,一方面获得了完整、准确、可扩展的风险关键词典,另一方面可实现对不同维度的违 约风险负面舆情进行评分,以更加准确地分析发债主体的违约行为。 为了实现根据本发明目的,提供了一种信用债发债主体违约风险评估方法,包括, 获取与发债主体匹配的公开新闻文本数据; 定义影响发债主体违约风险的风险主题和与其对应的风险种子词; 根据所述公开新闻文本数据,利用自然语言处理方法,对所述风险种子词进行扩 展,构建风险关键词典; 根据关键词多维风险特征,对所述风险关键词典中的每个词进行赋值,构建关键 4 CN 111598691 A 说 明 书 2/7 页 词多维风险特征体系; 根据所述关键词多维风险特征体系,构建词评分模型,对所述风险关键词典中情 感极性为负面的词进行风险评分; 根据关键词风险得分,计算新闻和/或发债主体违约风险负面舆情得分。 优选的是,所述的信用债发债主体违约风险评估方法,根据所述公开新闻文本数 据,利用自然语言处理方法,对所述风险种子词进行扩展,构建风险关键词典包括,在所述 公开新闻文本数据中随机抽样,形成训练样本;利用自然语言处理方法,对所述训练样本中 的种子词进行扩展,计算扩展词向量与种子词向量之间的相似性;去掉与种子词相似性低 于预设阈值的扩展词,构建以“种子词-扩展词”为基本结构的风险关键词典。 优选的是,所述的信用债发债主体违约风险评估方法,所述关键词多维风险特征 包括主题风险、词风险、词与主题的相关程度和关键词情感极性。 优选的是,所述的信用债发债主体违约风险评估方法,所述词评分模型为, word_score=1/word_risk_level 1/topic_risk_level×word_topic_ relationship 其中,word_score为关键词得分,word_risk_level为词风险,topic_risk_level 为主题风险,word_topic_relationship为词与主题的相关程度。 优选的是,所述的信用债发债主体违约风险评估方法,根据关键词风险得分,计算 新闻和/或发债主体违约风险负面舆情得分,包括,构建违约风险负面舆情评分模型: news_score=Σword_score/(news_length ave_length),其中,news_score为违 约风险负面舆情得分,∑word_score为预设范围内的新闻文本中关键词风险得分之和, news_length为预设范围内的新闻文本长度,ave_length为所述训练样本的平均长度;根据 所述违约风险负面舆情评分模型,计算新闻负面舆情得分,新闻-发债主体负面舆情得分、 新闻-风险主题负面舆情得分、新闻-发债主体-风险主题负面舆情得分,其中,计算新闻负 面舆情得分时,∑word_score为该条新闻文本中关键词风险得分之和,news_length为该条 新闻文本的长度;计算新闻-发债主体负面舆情得分时,∑word_score为以发债主体名称所 在句为中心句向前向后扩展预设句子数的新闻文本中关键词风险得分之和,news_length 为扩展后的新闻文本的长度;计算新闻-风险主题负面舆情得分时,∑word_score为该条新 闻文本中该风险主题下的关键词风险得分之和,news_length为该条新闻文本的长度;计算 新闻-发债主体-风险主题负面舆情得分时,∑word_score为以发债主体名称所在句为中心 句向前向后扩展预设句子数的新闻文本中该风险主题下的关键词风险得分之和,news_ length为该条新闻文本的长度。 优选的是,所述的信用债发债主体违约风险评估方法,还包括,将预设时间段内的 新闻-发债主体负面舆情得分,按照发债主体进行分类求和,得发债主体负面舆情得分;将 预设时间段内的新闻-发债主体-风险主题负面舆情得分,按照发债主体和风险主题进行分 类求和,得发债主体-风险主题负面舆情得分。 优选的是,所述的信用债发债主体违约风险评估方法,还包括,对预设时间段内的 新闻负面舆情得分、发债主体负面舆情得分和发债主体-风险主题负面舆情得分分别进行 降序排列,并按顺序推送。 本发明还提供了一种信用债发债主体违约风险评估系统,包括: 5 CN 111598691 A 说 明 书 3/7 页 获取模块,用于获取与发债主体匹配的公开新闻文本数据; 自定义模块,用于定义影响发债主体违约风险的风险主题和与其对应的风险种子 词; 风险关键词典构建模块,用于根据所述公开新闻文本数据,利用自然语言处理方 法,对所述风险种子词进行扩展,构建风险关键词典; 关键词风险特征体系构建模块,用于根据关键词风险特征,对所述风险关键词典 中的每个词进行量化,构建关键词风险特征体系; 关键词风险评分模块,用于根据所述关键词风险特征体系,构建词评分模型,对所 述风险关键词典中情感极性为负面的词进行风险评分; 负面舆情评分模块,根据关键词风险得分,计算新闻和/或发债主体违约风险负面 舆情得分。 本发明还提供了一种信用债发债主体违约风险评估装置,包括: 处理器; 存储器,其存储有可执行指令; 其中,所述处理器被配置为执行所述可执行指令,以执行权利要求1-7任一所述的 信用债发债主体违约风险评估方法。 本发明至少包括以下有益效果: 第一、本发明其通过定义不同的风险主题种子词,利用来自公开互联网渠道的新 闻文本数据,基于自然语言处理方法,构建以“种子词-扩展词”为基本结构的风险关键词 典,进一步构建关键词多维风险特征体系,一方面获得了完整、准确、可扩展的风险关键词 典,另一方面可实现对不同维度的违约风险负面舆情进行评分,以更加准确地分析发债主 体的违约行为。 第二、本发明的信用债发债主体违约风险评估方法,将关键词得分按照新闻、发债 主体以及风险主题分别进行聚合,可以更加准确地分析债券违约行为。 第三、本发明的信用债发债主体违约风险评估方法,基于大数据处理技术和文本 挖掘技术,利用实时更新的新闻文本数据进行信用债发债主体违约负面舆情的识别和打 分,提供按照新闻、发债主体和风险主题等多种聚合呈现方式,为投资者提供全面、直观、定 制化的债券违约风险评价。 第四、本发明的信用债发债主体违约风险评估方法,可扩展为适用于各种金融衍 生产品的信用风险评估方法,对既有的利用宏观经济指标及财务指标的信用风险评估方法 做出补充。 本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本 发明的研究和实践而为本领域的技术人员所理解。 附图说明 图1为本发明一个实施例中的信用债发债主体违约风险评估方法的流程示意图; 图2为本发明一个实施例中的信用债发债主体违约风险评估系统的结构示意图; 图3为本发明一个实施例中的信用债发债主体违约风险评估装置的结构示意图。 6 CN 111598691 A 说 明 书 4/7 页
下载此资料需消耗2积分,
分享到:
收藏