logo好方法网

财政百科应用系统


技术摘要:
本发明公开了财政百科应用系统,涉及数据处理技术领域;为了增加保密性,放心查看资料;具体包括数据存储中心、数据预处理模块、相关实体搜索及排序模块、实体聚类模块、OA系统接口单元、应用管理模块、应用注册单元和应用加载单元,所述数据存储中心包括数据爬取模块  全部
背景技术:
财政百科是以财政文件、政策、知识等非结构化数据为基础,通过搜索引擎、资料 分享、知识互动等方式,构建的政策落实、政策交流和政策学习的平台,较好的满足了财政 非结构数据分析和挖掘的需要,通过构建一个统一的搜索入口,实现文件、政策、项目、收 入、支出等多种业务应用,多种数据来源,多种分析对象的智能检索平台,使用户能够方便、 准确、快捷的从海量数据中迅速找到所需信息,财政百科作为财政大数据平台的重要组成 部分,依托财政专网,采用“1 N”系统架构,由省财政厅统一建设、大集中部署,各级财政部 门分级实施维护,全省共享共用,百科采用搜索引擎的应用模式,可灵活设置各项菜单模 块,并具有目录结构建立、数据资料上传、政策文件解读等功能。 经检索,中国专利申请号为CN201010222402.8的专利,公开了一种网络百科数据 获取方法及系统,包括根据百科数据库内的历史数据生成任务包,所述任务包包括词条和 编辑词条的提示信息;将所述任务包推送到用户终端;接收所述用户终端上传的根据所述 任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存 入所述百科数据库。本发明涉及一种网络百科数据获取系统。上述专利中的网络百科数据 获取方法及系统存在以下不足:所有用户查看的资料权限是一样的,没有保密性可言,无法 进行通用。
技术实现要素:
本发明的目的是为了解决现有技术中存在的缺点,而提出的财政百科应用系统。 为了实现上述目的,本发明采用了如下技术方案: 财政百科应用系统,包括数据存储中心、数据预处理模块、相关实体搜索及排序模 块、实体聚类模块、OA系统接口单元、应用管理模块、应用注册单元和应用加载单元,所述数 据存储中心包括数据爬取模块、直接获取模块和其他共享平台获取模块;所述数据预处理 模块对数据存储中心获取到的页面预处理,预处理包括去噪、文字区域提取、分词及词频处 理统计和构建索引;所述相关实体搜索及排序模块在预处理后的页面中搜索和财政相关的 实体并按相关度排序;所述实体聚类模块根据相关实体搜索及排序模块结果,聚类财政领 域的相似实体。 优选地:所述应用管理模块为用户中心和百科应用之间的通用型接口模块;应用 注册单元用于预先通过适配器代码中实现的必要接口将百科应用注册,注册后将各个百科 应用的标识存入标识存储单元;应用加载单元用于在系统运行时读取适配器配置文件,将 所有注册的百科应用作为插件加载,以实现插件功能。 优选地:所述数据爬取模块利用分布式网络爬虫将海量在线百科数据爬取到本 地;直接获取模块为从本地财政业务系统数据源获取;其他共享平台获取模块包括利用财 4 CN 111597332 A 说 明 书 2/6 页 税库银、涉税信息共享平台横向联网系统在线自动提取,导入其他省市相关数据。 优选地:所述数据预处理模块包括创建服务域,创建服务域包括文件服务、政策服 务,文件服务如财政收发文管理,中央及省、市、县各级文件资料;政策服务含民生政策、专 项资金、重点项目政策资料。 优选地:所述相关实体搜索及排序模块包括分类目录模块,分类目录模块包括以 下步骤: S1:建立首页搜索框模糊查询、精准搜索版块,如EXCEL、DOC、  PDF; S2:建立文件服务、政策服务网和知识点版块,进行按类别查找; S3:建立省级、市级、区级、县级的分级分地区版块,省级,搜索中央、省级文件;市 级,搜索市本级文件;区县级;搜索区县级文件。 优选地:所述S1中模糊查询为在首页搜索框中直接输入要查找内容,即可直接列 出相关内容,包括领导讲话稿、各级发文、名词解释包含要查找内容的资料;精准搜索为通 过明确的文号、文件名、发文日期进行精准检索;S2中按类别查找通过首页先选择要查找内 容分类,进入后选择明细分类,明细页中搜索具体要查找内容。 优选地:所述应用管理模块包括标识存储单元、权限管理单元、第一交互接口单元 和第二交互接口单元,标识存储单元为存储有每个百科应用分配注册的唯一标识;权限管 理单元基于各个百科应用的共有逻辑为用户在对应标识的百科应用里分配成员角色及其 权限;第一交互接口单元用于接受来自用户中心的用户访问,反馈交互结果至用户中心,实 现与用户中心之间的交互;第二交互接口单元用于根据用户访问启用权限管理单元,接管 百科应用的用户管理模块功能对百科应用进行访问,反馈交互结果至第一交互接口单元, 实现与各个百科应用之间的交互。 优选地:所述权限管理单元通过抽离并独立出各个百科应用的包括成员和权限管 理在内的共有逻辑,为用户在对应标识的百科应用里分配成员角色及其权限,用于将用户 参与百科应用的关系抽象成角色和权限,并为其编写配置类文件,通过编写应用适配器配 置文件将角色和权限抽象实现。 优选地:所述权限管理单元中分配成员角色及其权限,包括以下处理步骤: S10:获取每个百科应用分配注册的唯一标识; S12:获取各个百科应用的成员角色名单; S13:获取各个百科应用的成员角色在应用中的对应权限; S14:检查成员角色名单和成员角色权限之间的对应关系; S15:检查各个百科应用的关联关系或相似度; S16:根据成员角色名单、成员角色权限以及各个百科应用的关联关系/相似度,将 相关联或相近似的百科应用抽离出来并匹配相应的成员角色和成员角色权限。 优选地:所述文件服务包括文件资料梳理、政策资料梳理、资料统计分析,文件资 料梳理对近年来省、市级出台的各项文件进行梳理,并转换为PDF标准电子格式,对涉及的 文号、日期、发文机关、文件标题关键要素进行批量采集维护,按要求导入百科系统,满足收 录的要求;政策资料梳理对现行政策进行梳理,参照省级落实政策的要求,对民生政策、重 点项目支出涉及的标准、人数、分级负担比例信息进行梳理编辑,协助做好政策接龙,满足 学习、监督和管理的要求;资料统计分析对上传的资料及政策进行统计分析,及时了解政策 5 CN 111597332 A 说 明 书 3/6 页 落实及文件资料更新情况,指导和督促下级工作开展。 本发明的有益效果为:推进财政信息化管理,数据存储中心通过各个权威性平台 获取准确资料和数据,通过数据预处理模块对资料进行预处理,然后经相关实体搜索及排 序模块和实体聚类模块进一步对数据进行处理,及处理后的搜索结果,通过OA系统接口单 元进行标识各项资料实现共享,实现各个用户角色、权限管理,方便用户使用百科应用,及 时关注财政政策变化,借鉴外地先进的经验做法,为财政业务提供指导,设置科学的目录分 类体系,便于资料检索归档,上传资料准确,构件用户信息,建立分配各类人群权限,每种级 别查看或编辑的权限不统一,不同权限用户看到的菜单及内容根据权限配置动态调整,坚 持保密,严防泄漏财政相关数据,具有科学性、时效性和保密性等。 附图说明 图1为本发明提出的财政百科应用系统的数据存储中心结构示意图; 图2为本发明提出的财政百科应用系统的分类目录模块结构示意图。
下载此资料需消耗2积分,
分享到:
收藏