一个优秀的企业级 BI 架构师应该需要具备怎么样的素质
一个优秀的企业级 BI 架构师应该需要具备怎么样的素质? 第一,我所理解的BI架构师不是局限于聚焦于前台Report & Analytics分析平台的精深的专家,而是更普适的至少跨越三个领域:数据库,ETL,Report & Analytics的整体解决方案的架构师。此处需重点指出,本人对聚焦于前台R&A的专家只有敬仰,他们同样是架构师并且也存在世界级应用的架构师,只是不在我本次回答的范畴内。 第二,架构师也是分等级的,我姑且分为入门级,专业级,大师级和殿堂级。
(这里我没考虑数据volume,使用User数量等相关信息,因为这种东西很多时候和行业有关,有的行业就是天然有很多数据,比如互联网比如电信,不想把其他行业的漏掉。这里的项目人数要求绝对不是衡量架构师水准的硬性指标,只是一个参照而已) 当然,项目之复杂,岂能通过如上三言两语描述的清,只是给看官们一个借鉴的样子。 第三,就技能掌握的水平分类,又分为初级,中级,高级和大牛级。
再讲讲我对架构师的理解 通常,架构师的技术范围是T字形的,也就是在某一个或者某几个领域很精深,其他领域相对一般。很难找到所有技术范围都是大师级的选手,而很多时候不一定需要所有领域都是大师级的才能够成为架构师。所有的架构师都是Leader,因为你需要善用别人的长处来辅助你做架构的设计,架构设计很多很多时候都是集体智慧的结晶。如果有人抬杠说他的项目由他自己一个人搞定,要么这个人是各方面都卓越的大神(大神这词快被用滥了),而更多的时候或者说绝大多数的时候实在是因为项目的难度和复杂性不够。 此外,架构师非常重要的特质是,需要站在全局的考虑问题,而不是把眼光放在局部。因此需要架构师对各个领域的知识均有涉猎,建立我们称之为Insight的洞察能力,架构师很多很多时候都要对各种解决方案做取舍,没有整体架构的洞察力,就非常容易做出错误的决定。 另外,很有趣的是,只有你在某一个领域特别精深的,你才能在其他领域达到下一个级别。也就是说不存在T字形纵向一般,但横向很宽,并且能够交付合格出品物的架构师。这种架构师,通常嘴上功夫一流但没有实际的交付能力,不是我等技术人员所倡导的发展方向。T字形,纵向越深,往往触类旁通,在其他领域可能实操能力或许一般但也都有独到的见解。 好吧,从入门级别开始,至少你得懂DB,ETL,Report其中一种产品,能达到高级的水准,其他领域至少应该是中级。此外还需要懂得一些Unix的知识,怎么也应该是初级水准,如果能会一门编程语言,Java也好,Python也罢,都会是很好的补充。同时所参与的行业,需要达到中级的水准。而其余领域的知识,比如元数据管理,数据挖掘,主数据管理,数据质量等等如有涉猎当然更好。而这一级别的架构师通常的主要使命是完成当下项目的交付,一般来说不需要太强的系统工程(System Engineering)和项目管理经验,依赖个人能力为主,大部分架构师都是从这个层面成长起来的,这个阶段重点培养的是解决问题的能力。 等到了专业级别的架构师,除如上”硬“技能需要持续提高以外,需要站在项目以及系统工程的层面来思考问题。这时候仅仅”硬“知识就显得不够了,通常来说都需要管理10-15人的团队,这时依靠单打独斗的个人英雄模式就很难行得通了。再牛的架构师也会发现自己无论如何一个人无法搞定所有事情,会更依赖团队。同时又有大量的时间用于和PM,和需求方,对团队内部的沟通,需要考虑更多时间,成本等问题。因此,需要掌握更多项目管理,系统工程方面的知识,并且提高沟通的技巧,学会解放自己并把任务交给团队成员。这个时候的架构师需要大量的Review,制定规范等工作,并开始有些Trade off类的技术方向等决策性工作要做。 我不是大师级的架构师,只是作为普通一兵有幸辅佐过大师级架构师的工作,因此我很难给出准确的描述。只是尽可能描述我所接触过的牛人的特质:
殿堂级:这个我更没有资格评论了,也没有共同工作过。我所能理解的还是,他们看的更远,我们着眼于当下以,他们着眼于未来。 林林总总,说起来高大上,但即使是殿堂级架构师也是普通的人类一步步走上去的。Bigdata时代对技术有了更多的要求,持续学习能力也是架构师必备的素质。我也看到过快60岁的老头儿还对新技术怀有热烈的学习动力. 以上,无非是个人片面的看法,只是一个参照而已。 Appendix: 技术列表,视个人情况而定,没人能都学全。 1. DB 1) Data Modeling: 3NF,Dimensional Modeling,Data Vault,Anchor(后两种没有太大必要学,尤其最后一种) 2) DB Repository: i. 商用传统:Oracle,DB2,MS SQL Server,Sybase,Informix ii. 商用数据仓库专用:Oracle ExatraData,SAP HANA,Netezza,Teradata,SybaseIQ,GreenPlum,Vertica, iii. 开源:PostgreSQL,MySQL iv. NOSQL:MongoDB,Neo4j,Cassandra,HIVE,HBASE,... 大部分我也只是知道名字而已。 3) Data Modelling Tool: ERWIN,PowerDesigner,Oracle SQL Developer Data Modeler,IBM Infosphere Data Architect 4) ETL: Datastage,Informatica,Ab Initio,Kettle, SSIS 5)多维数据库:Essbase,TM1,Cognos Powerplay,MS AS, 6) Report: Cognos,BO,Hyperion Performance Suite,OBIEE,MSTR,Qlikview,Tableau,... 7) Metadata 8) Data Mining: SAS,SPSS,R,Excel,Matlab... 9)MDM 10) Data Quality 11) Data Governance 林林总总,还有各种bigdata的平台,我连名字都不知道。 职业生涯是有很多偶然性的,如果离实际工作很远,我不是很建议去学习,因为很难深入且容易遗忘,去学习离你近的东西。 吾生而有涯而知也无涯。学海无边,回头是岸。 转自:爱数据网;作者:BAO胖子 商业智能BI社区专家 www.flybi.net; 版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。 商务合作|广告软文投放请加qq:365242293 。 更多相关知识请回复:“ 月光宝盒 ”; 数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群 公众号推荐,永洪BI(ID : yonghongbi ),大数据小数据,一天实现可视化分析。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |