1、元数据
元数据是描述数据的数据,所以在数据资产管理平台上建设就可以了(元模型管理、元数据采集、元数据查询、元数据管理(血缘分析、一致性核验等)),不涉及源系统表改造。
元数据分两大功能:描述数据静态信息和描述数据动态信息
静态信息:业务元数据、技术元数据、管理元数据,也就是元模型管理的东西、元数据需要记录的信息。业务元数据记录的是数据中英文名称,来自哪个业务领域等信息技术元数据记录的是数据的数据类型、是否为空、是否唯一等信息管理元数据记录的是对字段的操作和访问记录。
动态信息:数据从哪来、到哪去,如何去的(加工逻辑)。
2、数据标准
数据标准解决的问题是统一数据语言:统一命名规范,统一对数据的理解,完成数据的定义和规范。
数据标准分为数据标准制定、标准维护。其中
标准制定:数据标准一般是从数据最小颗粒度开始定义和规范,先有词根,词根组成字段,然后有编码规则,制定好标准(规定中英文名称、数据类型、文本长度、是否为空、是否唯一等)。
标准维护:事后检查,事前预防。事后检查:将标准下发至目标数据模型中进行贯标评估,将不符合标准的进行修改事前预防:建模时,引用定义好的数据标准。
3、两者区别
元数据和数据标准的区别在于:元数据是记录/描述数据的数据,数据标准是规范/定义数据的数据。即使数据是错的,元数据不管,只负责记录,而数据标准就是定义数据对与错。
从 从0-1新建数据模型 这个角度来说,应该是先制定数据标准,在制定元数据采集。
从数据治理这个角度来说,应该是先制定元数据采集,在制定数据标准。因为元数据记录了数据操作记录,是一个留痕的动作,再者,元数据一般是自动采集,相对于数据标准制定,经历的时间会比较短。