我对数据仓库的感觉
发布时间:2020-12-12 15:48:09 所属栏目:MsSql教程 来源:网络整理
导读:我不知道该让这篇文章叫什么名。。。感觉写得有点乱。就暂叫:我对数据仓库的感觉 吧。 也许写得有不对的地方,请多包函。 对于数据仓库,我很早就看了一些相关的书,但由于客户一直没有相关的需求,所以仅仅知道MS有这么一个东西,但具体的东西是什么样的,
我不知道该让这篇文章叫什么名。。。感觉写得有点乱。就暂叫:我对数据仓库的感觉 吧。
也许写得有不对的地方,请多包函。 对于数据仓库,我很早就看了一些相关的书,但由于客户一直没有相关的需求,所以仅仅知道MS有这么一个东西,但具体的东西是什么样的,我并不知道。 后来,看了杨大川的一个关于MSOLAP2000的录像,感到MSAS的功能非常的强大。看他演示了经典的数据挖掘--决策树,我心里就想,原来,数据的真正的意义在这里,后来他再 用普科(ProClarity)来演示分解树的时候,我觉得MSAS真是帅呆了。心里感觉,BI无所不能。未来,尤其是商业市场的未来,高端部分非数据仓库莫属。 就这样,一个演示的录像,让我走上了数据仓库之路。人的改变就是这样的偶然。 就这样,我决心要在这条路上走,无论多困难,我都要走。 买了十几本关于OLAP,NDX 的书,放在电脑包里,空闲时看看,上班坐公交车的路上看看,下班的路上看看。回家空闲时也看看。我并没有急于去掌握这门技术,我觉得,只要点 点滴滴,细水长流。我相信,再大的桶,也会有滴满的一天。 当我觉得书看得差不多了,于是,自己假想了一个简单的商业方案。用这个假想的方案去做一次实实际际的操作。呵呵,很顺利,这个假想的方案并不困难。很顺利地完了了。 水,终于滴到能看到的那一天了。当时我在某学会上班,里面,最充足的资源就是各种的统计数据,我选了一个最完整,最连续 的一个库---某某库。作为我第一个MSAS项目。 确定该项目为三个页面:第一个是普通的浏览,第二个页面是分解树,第三个页面是KPI。 功能或需求定位了,动手吧。。。。 重新做一个适适合数据仓库的库---就是反规格化的库。重新建立相关的可索引的视图,将原来的数据倒进去。建立仓库,写一个针对MSAS的类,写一个WEB的分解树的控件, 写了一个WEB展示的控件。最后,一个多月后,这个仓库出来了。我觉得很顺利。其间最大的收获是什么?写了关于MSAS的类,和OLAP的网络控件,让我知道MSAS返回的CELLSET是 什么东西,也让我的MDX更熟练了。? :) 早两三周前,我辞去了某学会的职务,变成了无业者。呵呵,我并没有急着找工作,觉得自己应该考虑一下自己的未来,我的未来在哪里?哪里是出路? 现在,已很少灵光一闪的思维了,该闪的事,几年前就闪过了。。。我觉得应该好好地沉淀一下,整理一下。在众多的技术面前,哪里有出路?我决定---还是BI。 不错,还是它,没人有什么东西比它对我更有吸引力的了,也没有什么比它更让我着迷的了。 但我知道,我只是刚开始,路,还是很的。 思考一下中国目前的BI现状,是什么现状? 企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么 ?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求? /*********** 插一个是外话: 如果BI仅仅等于多维的报表,我上几个月曾在CSDN里与人讨论过一个问题:用SQL模拟MDX的多维报表。后来,我下定决心,开发一个这样的WEB网格工具。一周的时间,我做出来的 。就是用SQLSERVER模拟的MDX WEB报表展示。仅仅从外表看,你还真分不出这是数据库。 其实,我开发这个报表的目的也是生产的需要,因为客户就是要这个报表就够了。多了反而部署困难。而开发的直接灵感或者说思路,则是原原版版的仓库的思路. ***********/ 我突然想到,能不能将仓库与一些其它的工具配合起来,也许,BI会显得更完整。也会更容易. 我想到了MATLAB这个数学工具,MATLAB里有经典的工具箱,很多经典的算法,一些在其它编程语言很难做到的地方,它能轻易地做到,比如说,矩阵的运算,各种积分,多重积分 ,各种微分,各种插值,各种的仿真工程,各种的规划求解。更重要的,它的数据可视化,绝对是无敌的数据可视化,杀伤力太大了。而它比其它任何一门计算机语言更容易懂。 我心里的未来之路就是:数据仓库与MATALB的结合。 |