logo好方法网

汉字构形系统可视化的方法、系统、装置及可读存储介质


技术摘要:
本发明提供了汉字构形系统可视化的方法、系统、装置及可读存储介质,通过现代计算机手段,利用当下最流行的图形数据库和知识图谱技术,将构形系联通过计算机来实现和展现,本发明取代了传统的人工绘制手段;通过计算机的图形数据库技术和知识图谱,将错误率和遗漏率降  全部
背景技术:
】 构形系联是传统语言文字学研究的一个重要研究方法,根据构形学原理,将汉字 进行拆分,通过汉字的形体依一定的理据构成和演变的规律的而进行学习研究。原先科研 工作者只是通过手工画图或者制作卡片的方式进行简单的拆分,而汉字之间和部件之间的 系联关系也通过人工进行大量的检索,很容易出现错误和数据遗漏。而不同的学者和研究 人员需要利用大量的时间和大量的人力从事数据整理,而数据也不能得到很好的资源共 享。其展示形式比较单一,不能很好很形象的展现出来。而社会上对汉字构形感兴趣的人 群,由于资料有限和展示方式不够友好,所以没有很好的传播开来,也仅仅在本专业人士中 得到传播。 图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。 最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效 果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。 知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射 地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识 资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 现有的通过计算机实现汉字构形系统可视化的方法,成本高、误码率高且反应速 度慢,并且还存在以下问题: (1)从事相应科研人员要进行重复性劳动 (2)需要人力资源也比较多; (3)数据资料不全; (4)遗漏率,错误率高; (5)简单的计算机画图,界面不够友好. 因此,有必要研究一种汉字构形系统可视化的方法、系统、装置及可读存储介质来 应对现有技术的不足,以解决或减轻上述一个或多个问题。 【
技术实现要素:
】 有鉴于此,本发明提供了一种汉字构形系统可视化的方法、系统、装置及可读存储 介质,通过现代计算机手段,利用当下最流行的图形数据库和知识图谱技术,将构形系联通 过计算机来实现和展现。 一方面,本发明提供一种汉字构形系统可视化的方法,所述方法具体包括以下步 骤: S1:将汉字进行拆分和分类; 4 CN 111611401 A 说 明 书 2/6 页 S2:将S1中的拆分和分类结果校对后录入图形数据库中; S3:通过图形数据库对待构形系联汉字进行构形分析检索,获得所有的基础构件; S4:通过对S3中的基础构件进行构形系联,获得所有相关联的字。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S1具体 包括: S11:将汉字进行拆分并校对; S12:对拆分后的部分进行字段设计; S13:将拆分后的部分按照S12中的字段进行分类。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S12中的 字段设计包括:“正字”、“表形”、“表义”、“示音”和“标示”,其中,“正字”字段为具有相同标 准字形结构的集合;“表形”字段为具有相同的用来描绘物体形象的集合;“表义”字段为具 有相同的字义解释的集合;“示音”字段为具有相同读音的集合;“标示”字段为具有附着在 非基础构件上起区别和指事作用的集合。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S11中汉 字的拆分方法为:将汉字按照构形学进行拆分。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S3中构 形分析具体为:对汉字进行层层分析,直至分解出其所有的基础构件为止。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S4中构 形系联具体为:将拆分后的基础构件中的全部相关联的字均展现出来。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S2具体 包括: S21:将S13中的分类结果进行数据填充并录入计算机; S22:对录入的分类数据进行审核; S23:将审核通过的分类数据进行入库数据处理; S24:将S23中处理后的数据录入图形数据库; S25:完成系联数据。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S22中审 核内容为查漏补缺及错误更正。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S3和S4 中所有的基础构件和相关联的字均在web界面上通过知识图谱和前端展示的方法来完成构 形系联展示。 如上所述的方面和任一可能的实现方式,进一步提供一种汉字构形系统可视化系 统,所述系统具体包括: 分类模块:自动将汉字字形进行拆分和分类; 输入模块:将分类模块拆分和分类结果校对后录入图形数据库中; 构形分析模块:通过图形数据库对待构形系联汉字进行构形分析检索,获得所有 的基础构件; 系联模块:通过对所述基础构件进行构形系联,获得所有相关联的字。 如上所述的方面和任一可能的实现方式,进一步提供一种实现汉字构形系统可视 5 CN 111611401 A 说 明 书 3/6 页 化装置,所述可视化装置包括存储器、处理器、显示器以及存储在所述存储器上并可在所述 处理器上运行的汉字构形系统可视化的处理程序,所述汉字构形系统可视化的处理程序被 所述处理器执行时实现如所述的汉字构形系统可视化方法的步骤,所述处理器执行处理程 序的结果输出至显示器。 如上所述的方面和任一可能的实现方式,进一步提供一种可读存储介质,所述计 算机可读存储介质上存储有汉字构形系统可视化的处理程序,所述汉字构形系统可视化的 处理程序被处理器执行时实现如所述的汉字构形系统可视化方法的步骤。 与现有技术相比,本发明可以获得包括以下技术效果: 1、通过现代计算机手段实现构形系联,取代了传统的人工绘制手段; 2、通过计算机的图形数据库技术,将错误率和遗漏率降到最低; 3、利用知识图谱,将构形系联更好的展现; 4、减少巨大的人力和精力投入; 5、通过使用计算机网络技术,可以将科研成果更好的公开,便于知识共享和方便 其他学者学习。 当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。 【附图说明】 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域 普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。 图1是本发明一个实施例提供的方法中对汉字进行拆分、分类并后录入图形数据 库的流程图; 图2是本发明一个实施例提供的构形分析的检索原理图; 图3是本发明一个实施例提供的构形系联原理图。 【
下载此资料需消耗2积分,
分享到:
收藏