最近在做名目环节中发现一个疑问:有些共事经常把目的数据规范中的业务属性、技术属性、控制属性当做业务元数据、技术元数据、控制元数据或许在数据目的规范定义的时刻间接分为业务元数据、技术元数据和控制元数据。这就造成无论是消息控制的技术部门还是运营控制的业务部门总是一头雾水,难以厘清。上方咱们谈谈目的数据规范中的属性和元数据类别的咨询和区别。
一、元数据的定义及分类
参照国内数据控制协会《DMBOK数据控制常识指南》的说法,咱们看看元数据及分类。
元数据最经常出现的定义是“关于数据的数据”。元数据通常分为三种类型:业务元数据、技术元数据和操作元数据。
在消息技术之外的畛域,如在图书馆或消息迷信中,元数据被形容为不同的类别:
1)形容元数据 (Descriptive Metadata)。形容资源并允许识别和检索,如题目、作者和主题等。
2)结构元数据 (Structural Metadata)。形容资源及其组成组件之间的相关,如页数、章节等。
3)控制元数据 (Administrative Metadata)。用于形容控制生命周期的元数据,如版本号、存档日期等。
这些类别有助于了解定义元数据需求的环节。
(1)业务元数据
业务元数据(Business Metadata)重要关注数据的内容和条件,另包括与数据控制相关的具体消息。业务元数据包括主题域、概念、实体、属性的非技术称号和定义、属性的数据类型和其余特色,如范围形容、计算公式、算法和业务规则、有效的域值及其定义。业务元数据的
示例包括:
1)数据集、表和字段的定义和形容。
2)业务规则、转换规则、计算公式和推导公式。
3)数据模型。
4)数据品质规则和检核结果。
5)数据的降级方案。
6)数据溯源和数据血统。
7)数据规范。
8)特定的数据元素记载系统。
9)有效值解放。
10)利益相关方咨询消息(如数据一切者、数据控制专员)。
11)数据的安保/隐衷级别。
12)已知的数据疑问。
13)数据经常使用说明。
(2)技术元数据
技术元数据(Technical Metadata)提供无关数据的技术细节、存储数据的系统以及在系统内和系统之间数据流转环节的消息。技术元数据示例包括:
1)物理数据库表名和字段名。
2)字段属性。
3)数据库对象的属性
4)访问权限。
5)数据CRUD(增、删、改、查)规则。
6)物理数据模型,包括数据表名、键和索引。
7)记载数据模型与实物资产之间的相关。
8)ETL作业具体消息。
9)文件格局形式定义。
10)源到目的的映射文档。
11)数据血统文档,包括抢先和下游变卦影响的消息。
12)程序和运行的称号和形容。
13)周期作业(内容降级)的调度方案和依赖。
14)复原和备份规则。
15)数据访问的权限、组、角色。
(3)操作元数据
操作元数据(Operational Metadata)形容了处置和访问数据的细节,例如:
1)批处置程序的作业执行日志。
2)抽取历史和结果。
3)调度意外处置。
4)审计、平衡、控制度量的结果。
5)失误日志。
6)报表和查问的访问形式、频率和执行期间。
7)补丁和版本的保养方案和执行状况,以及的补丁级别。
9)服务水平协定(SLA)要求和规则。
10)容量和经常使用形式。
11)数据归档、保管规则和相关归档文件。
12)荡涤规范。
13)数据共享规则和协定
14)技术人员的角色、职责和咨询消息。
二、目的数据定义及属性分类
参照《数据规范化:数据控制的基石》一书,数据目的是说明总体数量特色的概念,反映了企业的日常运营控制环节。普通从业务属性、控制属性、技术属性等角度制订目的规范。目的的规范化是增强数据控制和管控中最基础的上班,经过目的规范化,咱们可以获取数据的业务价值,技术价值与控制价值。
普通来说,目的分为基础目的、复合目的和派生目的三类。
基础目的是表白业务虚体原子量化属性的概念汇合,是可以间接对繁多变量的明细数据启动便捷计算获取的无法进一步拆解的目的。如“支出” 。
基础目的具备如下特色:
①目的计算规则中仅包括一个变量。
②其稳固性高,业务定义、计算公式和统计口径不易随业务控制视角频繁变动。
复合目的是建设在基础目的之上,由若干个基础目的经过必定运算规则计算构成,在业务角度无法拆解,如“签约率”、“利润率”。
复合目的具备如下几种类型:
①由基础目的计算获取。
②由基础目的和复合目的计算获取。
③由复合目的再度计算获取。
维度是报表宰割显示统计数值的角度,重要用来形容在业务优惠中会从哪些角度对规范项启动经常使用和剖析,表现为报表的一行或许表头中的一列。普通来说,维度具备团圆化取值的个性,即取值可以枚举。维度作为观察事物的视角,并不孤立存在,而是经过与目的联合经常使用,可以对目的的不同方面启动对比与剖析。罕用维度包括期间、空间、组织机构、业务类别等。
目的数据规范规则了目的数据规范的业务属性、技术属性和控制属性规范,可运行在企业报表编制、数据资产控制等相关畛域。
依据数据管控需求和业务运营状况,同时思索规范的编制介入人员、分期制订环节、规范运行场景等诸多起因设置属性梳理优先级,其中由业务人员提供或确认的属性称为基础属性,须要联合技术人员、控制人员后续启动补充的属性称为裁减属性,如下图虚线框所示。
业务属性:是目的数据在业务层面的定义,形容数据和企业业务相关联的个性,是数据业务含意的一致解释及要求。
业务属性包括:一级主题、二级主题、三级主题、目的称号、业务定义、处置逻辑、维度、基础计量单位、参考规范、上报频度、统计期间、映射类型等。
技术属性:是目的数据在技术层面的定义,形容了数据与消息技术成功相关联的个性,是数据在消息系统名目成功时一致的技术方面定义。
技术属性包括数据类型、数据格局、数据源系统、数据源表名、数据源字段名等。
控制属性:是目的数据在控制层面的定义,形容了数据与数据控制相关联的个性,是数据控制在数据规范控制畛域的一致要求。
三、目的数据规范中的属性分类和元数据的分类的相关
从背景和配置上说元数据是形容和解释数据的,它有自己的配置和作用。而目的数据规范中的属性分类是为了便于技术、业务和一切者对目的数据属性的控制而划分的。两者的背景和作用是不同的。
从以上的形容咱们也可以看出,在数据目的规范中定义的控制属性不宜用控制元数据代替,比如主责部门、规范控制部门是业务元数据的范围。而控制元数据往往用在图书馆相似的场景下。所以,为了防止惹起歧义和抵触的状况,倡导目的数据规范中关于属性的分类还是用业务属性、技术属性和控制属性。
关于专门从事数据控制的人员来说更应从基本概念和实质厘清不同术语,比如主数据、元数据、数据元、数据仓库、数据中台、大数据、数据湖、湖仓一体、数据网格、数据编织等,这样才干更好的疏导业务一同展开数据控制上班。数据控制不是IT人员唱独角戏的舞台,而是须要业务和技术更好帮忙,理念分歧、方法分歧、执行分歧,才干把数据控制上班做好,更大施展数据的价值。