发布网友 发布时间:2022-04-20 15:54
共2个回答
热心网友 时间:2023-10-06 04:36
元数据(Meta Date),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。
元数据是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。
构建数据仓库的主要步骤之一是ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。
用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。
数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部数据源,改变数据清洗方法,控制出错的查询以及安排备份等。
元数据可分为技术元数据和业务元数据。技术元数据为开发和管理数据仓库的IT 人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据清洗与更新规则、数据映射和访问权限等。而业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。
由上可见,元数据不仅定义了数据仓库中数据的模式、来源、抽取和转换规则等,而且是整个数据仓库系统运行的基础,元数据把数据仓库系统中各个松散的组件联系起来,组成了一个有机的整体
热心网友 时间:2023-10-06 04:37
什么是元数据管理?
企业用户在创建了众多数据库信息时,需要一个查询功能可以及时高效地为用户查询数据库信息,如数据源、表以及视图等信息。DataPipeline元数据管理功能可以用户降低时间成本,提高查询效率。
元数据管理能做到什么?
元数据管理能带给用户的核心功能有:
1、支持筛选查询已创建的数据源/表/视图信息。
2、支持查看总览查询所有已创建的数据库信息。
3、支持用户输入数据源名称/类型/负责人/创建人查询数据源信息。
4、支持用户输入表名称、负责人、Comment查询表信息。
5、支持用户输入视图名称、负责人、Comment查询视图信息。
6、支持用户在搜索结果中对数据源和创建人进行筛选。
7、支持查询数据源类型为MySQL、Oracle、SQL Server、PostgreSQL、FTP、S3数据源。
8、支持用户在总览列表页进行搜索。
如何使用元数据管理?
元数据管理首页
顶部显示搜索入口
提示文案:请输入搜索关键词(如数据源、表、视图、字段、标签名称)
搜索范围:
数据源搜索范围:数据源名称、数据源类型、创建人、负责人、标签
表搜索范围:表名称、负责人、Comment、标签
视图搜索范围:视图名称、负责人、Comment、标签
字段搜索范围:字段名称、标签、别名、描述