智能数据治理:基于大模型、知识图谱
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

近年来,我国深入实施网络强国和国家大数据战略,制定了数字经济发展战略,印发了《“十四五”数字经济发展规划》等,加快推进数字产业化和产业数字化,推动数字经济蓬勃发展。在政府工作报告中也多次提出应充分发挥我国海量数据和丰富的应用场景的优势,促进数字技术和实体经济深度融合,赋能传统产业转型升级,催生新产业、新业态、新模式。通过完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,更好地服务于我国经济社会发展和人民生活改善。2017年,国务院印发的《新一代人工智能发展规划》中明确指出“建立新一代人工智能关键共性技术体系”,并指出要“重点突破跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与学习、知识演化与推理、智能描述与生成等技术”。

本书给出了数据治理、智能数据治理的概念和智能数据治理架构;介绍了知识图谱的概念和体系架构,并对构建知识图谱的几个重要步骤进行了阐述;基于上述背景知识,给出了大模型时代的知识图谱智能数据治理框架,阐述了大模型时代知识图谱和智能数据治理之间的协同关系;为了引出行业领域的应用实践,介绍了智能数据治理在医疗、政务、低碳及知识服务等领域的应用概况;给出了科学知识图谱的分析方法和工具,并以儿童孤独症为例详细阐述了医疗知识图谱的构建流程;为了构建更具有通用意义的知识图谱,介绍了基于神经网络模型的个人健康信息知识图谱构建方法,并以案例形式给出了大模型技术在健康管理领域的应用;介绍了主动式政务服务数据治理平台的构建方法,并以主动式政务服务云平台为案例进行了分析;探讨了低碳领域智能数据治理的应用策略,阐述了低碳领域数据治理平台的设计与实现;给出了大模型技术在政务服务和低碳领域的创新实践。

随着经济活动数字化转型加快,数据成为最具有时代特征的新生产要素,我国于2020年发布了《关于构建更加完善的要素市场化配置体制机制的意见》,凸显了数据对提高生产效率的重要作用。我国的一系列政策指引将数据治理提升到了前所未有的战略高度,全社会对数据治理的重视程度也不断提升。在近几年国家重大项目审批指南中也反复提到“知识图谱”和“数据治理”等关键词,并鼓励在信息平台、金融、客服、教育、工业、医疗等领域构建行业知识图谱。本书中的数据治理流程、方法和大模型知识图谱技术有助于推进各行业领域中的数据资源整合和开放共享。本书结合大模型技术对知识图谱及数据治理架构涉及的关键技术进行了阐述,体现了数字技术和实体经济的深度融合。

本书获首都经济贸易大学资助。