加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据仓库工作日记_记录(一)

发布时间:2020-12-14 03:28:13 所属栏目:大数据 来源:网络整理
导读:? 在传统行业从事数据仓库好几年了(不敢贸然写多年),从etl开发做到了架构师。由于行业因素的关系吧,像银行,电信这些单位(一些体制问题,就不细说了),会有自己的IT部门, 但IT部门的人丁一般都不怎么兴旺,也就更不会招聘自己的项目团队,这也就养育

? 在传统行业从事数据仓库好几年了(不敢贸然写多年),从etl开发做到了架构师。由于行业因素的关系吧,像银行,电信这些单位(一些体制问题,就不细说了),会有自己的IT部门, 但IT部门的人丁一般都不怎么兴旺,也就更不会招聘自己的项目团队,这也就养育了我天朝强大的外包事业,而我一直都是这外包大军中的一员。

? 准备把文章分成几个主题来写,这个主题是用来记现在刚启动项目的工作笔记的,工作中的一些奇闻轶事就放到其他主题了。

? 项目介绍:背景-某地方性商业银行;上线时间-n年前;系统结构-ods,dw,下游系统。

? ods层:源系统的映射层,与源系统同构,只保留当期数据。之所以设计ods层,是为了将数据仓库系统与实时业务系统隔离开。在一些事业单位(朝九晚五从不加班办业务的单位,大家懂的)或类似的项目中,由于下班以后不再产生新的业务,因此数据仓库可以采取简单的形式,如oracle的dblink,在下班以后直接将数据抽取过来。但像银行,通信这一类的企业,都是24时有业务处理的,直接去大批量地查询核心业务系统的数据,不仅会影响对方的处理效率,同时也不能保证数据的准确,这里所说的数据准确,是由于业务系统一直在处理业务,我们不能准确的获取当天24小时内的数据。ods(Operational Data Store)的功能也就体现出来了。当然,这只是ods的一部分功能了

? dw层:轻度汇总层,按照主题汇总,保留历史数据。在ods数据加载完成后,dw层开始调度任务。不过,这个项目中的dw层就稍稍有点惨不忍睹了,主题是划分了,但只是按照核心业务系统的表数据内容,大概的分了个类,与ods的表结构基本一样,只是名字都换了,并不是数据仓库中真正意义上的划分主题。当然了,存在即有道理,这个dw层以拉链和当期快照还有全量的形式保存了历史数据。

? 调度:有数据仓库就要有相关调度,这个项目中采用的是我国某中字开头公司的调度产品,这个产品,一个字烂,两个字恶心,三个字我艹了,但人家毕竟是产品!由java来做应用界面,底层功能由shell来实现,具体的分析会在后面的文章中进行刨析,因为我马上就要优化这玩意了。

? 讲完背景,下一篇将说明要做的工作。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读