1.2 数据治理模型
数据治理模型是一个框架,定义了数据创建、存储和维护,以及数据处置的系统和流程,并明确了决策者的角色,组织往往会使用多种类型的数据治理模型。国外的数据治理模型研究开展得较早,常见的有数据治理研究所(Data Governance Institute,DGI)数据治理框架、高等教育统计局(Higher Education Statistics Agency,HESA)数据治理模型和渐进式数据治理模型,如图1.1所示。
图1.1 数据治理模型
1.2.1 DGI数据治理框架
企业生存源于3个主要驱动力:增加利润、成本和复杂性控制,通过对风险与脆弱性的研究确保企业正常运作,这涉及合规、安全和隐私等。数据治理过程也相应地与这条通用价值准则紧密相连。DGI推出的DGI数据治理框架为企业基于数据的决策活动提供方法指导。模型从组织数据治理的目标或者需求出发,描述了谁可以采取什么行动来处理什么信息,以及何时在什么情况下使用什么方法。例如,如何管理数据以实现数据价值,如何最小化成本和复杂性,如何管理风险,以及如何确保遵守法律法规和符合其他要求。
DGI数据治理框架从组织数据治理的目标或需求出发进行设计,能帮助企业对复杂、模糊的概念做清晰的梳理,明确目标和行动计划,提高效率与成功率。如图 1.2所示,DGI数据治理框架的设计遵循5W1H原则。
图1.2 DGI数据治理框架
�·WHY,为什么要进行数据治理?
DGI数据治理框架中的1~2组件给出了数据治理的愿景使命和目标,也解释了企业为什么要进行数据治理,为企业数据治理指明了方向,是其他数据治理活动的总体策略。
�·WHAT,数据治理包括什么?
DGI数据治理框架中的3~6组件,即数据规则与定义、数据的决策权、数据问责制、数据管控4个组件定义了数据治理所包含的内容。数据规则与定义侧重于对业务规则(如相关的策略、数据标准、合规性要求等)进行定义;数据的决策权侧重于数据的确权,明确数据归口和产权,为定义数据标准、制定数据管理制度和编排数据管理流程奠定基础;数据问责制侧重于对数据治理职责和分工进行定义,用于明确参与数据治理的人员、数据治理时间和数据治理任务;数据管控侧重于制定保障数据质量和安全的具体措施,以及保障数据的合规使用。
�·WHO,谁参与数据治理?
DGI数据治理框架中的7~9组件,定义了参与数据治理的人员,包括数据利益相关者、数据治理办公室和数据专员,为数据治理的主导、职责分工给出了相关参考。
�·WHEN,什么时候开展数据治理?HOW,如何开展数据治理?
DGI数据治理框架中的10组件,即WHEN显示了数据治理的实施路径和行动计划。HOW描述了数据治理的重要活动和方法。
�·WHERE,数据治理位于何处?
位于DGI数据治理框架十大组件之外,需明确当前企业数据治理的成熟度,找到企业与先进标杆的差距,是定义数据治理内容和策略的基础。
作为重要的生产要素,数据是企业进行转型升级的重要基础。DGI发掘了数据治理对企业的价值,并基于此确定实施路线图和计划。通过DGI数据治理框架有利于获得利益相关方的资金、资源,以及政策方面的支持,有助于明确范围并建立SMART[具体(Specific)、可衡量(Measurable)、可实现(Attainable)、相关(Relevant)和有时限(Time-bound)]目标。最后执行与数据治理有关的过程,并监控执行结果,测量和报告数据治理状态。DGI数据治理框架条理清晰,对实际数据治理的指导性很强,普遍应用于企业数据治理中,具有良好的扩展性。
1.2.2 HESA数据治理模型
HESA提出了HESA数据治理模型,具体内容如图1.1所示。
HESA 是英国收集、分析和传播高等教育定量信息的官方机构,提出了大学数据受托人(University Data Trustee)的概念,其指出大学数据受托人要对数据管理战略进行协调。另外,由模型的整体结构可知,组织的数据治理既离不开操作层面的管理,也离不开政策层面的指导。HESA构建HESA数据治理模型的同时会定义和分配一些关键角色,使整个治理过程为一个整体,并使过程清晰化、具体化,如图 1.3所示。
图1.3 HESA数据治理模型
1.2.3 渐进式数据治理模型
渐进式数据治理模型是由美国一家软件咨询公司提出的,数据治理的核心价值是创建一个模型确保数据的保密性和完整性,以及保证数据的质量。渐进式数据治理模型建议采取渐进式方法进行数据治理,分7个步骤来实施,以确保数据的有效治理。渐进式数据治理简易模型兼具全面性与实效性,是一个更为具体和全面的数据治理模型,如图1.4所示。
图1.4 渐进式数据治理简易模型