BI Dev--ETL Introduce
Chap 1 认识 ETLfocus on :
1-1 ETL 简介
ETL的设计分三个部分:
下面看流程图: 一、数据抽取首先要搞清楚数据是从几个业务系统中来,各个业务系统的数据库服务器运行的是何种DBMS,是否存在手工数据, 非结构化数据等。 二、数据清洗与转换数据仓库分为ODS,DW连部分。通常的做法是从业务系统到ODS做清洗,将脏数据和不完整的数据过滤掉,在ODS到过程中转换,进行一些业务规则的计算和聚合。 1. 数据清洗 主要是过滤那些不符合要求的数据。
2. 数据转换 数据转换的任务主要进行不一致的数据转换、数据粒度的转换 三、数据的加载一般在数据清洗完了之后直接写入DW (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |