携程技术中心BigData Offsite Meeting圆满落幕
7月31日至8月1日,携程技术中心bigdata offsite meeting在上海顺利举办。本次活动由Jason主持,会议中各BU、SBU的同事分享各自领域中大数据的应用及发展,介绍并展示了大数据与其业务工作相关的内容和工具,互通有无,相互交流。除了各团队大数据应用的干货分享之外,Grace还带领大家进行了团队教练活动。活动最后,Eric对针对大数据技术在携程的发展做出了部署及展望,我们即将会有big data committee和定期开展的big data talk。 大数据平台(Data Platform,简称DP)是2015年6月携程技术中心新设立的部门,工作职责是提供稳定高效的大数据传输,分析,展示框架和平台以及各种易用的工具。Jason的介绍结束后,酒店、攻略、地面等各BU、SBU的同事分享了大数据在各自工作领域中的实践发展情况。其中攻略社区李健指出攻略信息目前主要是以文字为载体,因此以自然语言处理NLP为基础的信息处理技术应用显得尤为重要。在信息抽取和自动文摘方面,大数据技术目前都已投入使用。 而大数据建设实践相对比较突出的是地面SBU。据介绍,地面数据团队于去年8月正式建立,到年底12月份,地面SBU的BI服务器,数据库完成分拆独立,BO的服务器集群得到扩容优化,困扰已久的日报无法稳定发送的问题也得到了解决,整体团队对业务和产品的数据支持工作趋向稳定。今年3月,地面数据团队与开发团队配合,完成了地面的第一个大数据项目-玩乐无线看了又看项目。为了确保实验环境下算法择优结论的可靠性,团队在线上设计了AB Testing,上线3周后,根据AB的数据分析,证实了实验环境的判断结论“从销量的角度,算法B优于算法A”是可靠的。测试完成后,算法B的版本正式上线。此后,AB Testing验证效果广泛使用于推荐和搜索类项目,后续地面的数据团队又参与完成了行程中推荐项目、门票智能排序项目,及周边城市门票项目,Q3更计划上线基于HBase的业务分析平台狄米特(Demeter)。随着这些项目的开发,地面数据团队逐渐走向成熟,相信未来数据团队会在BU中发挥出越来越大的作用。 目前DP团队主要分为数据基础架构、数据开发和展示平台、实时数据平台三个工作方向。各组与会代表随后对本组工作进行了介绍和展示,并分享了各自的软件工具产品。 数据基础架构小组由CDI的DI小组演化而来,目前已有产品包括Hadoop,HIVE,HBase,Spark,HBase和DI Portal。 数据开发和展示平台小组由原BI的工具团队演化而来,已有产品Zeus、DataX、ODS和ART,质量中心和主数据系统两个产品预计下半年将完成并投入使用。 实时数据平台Muise开发于今年4月份,是基于Kafka和Storm提供实时数据流转和分析的平台。目前已经有框架,搜索,基础,运维,地面,用车,团队游等BU或SBU的近10个项目使用Muise平台或预订接入Muise平台。 会议最后,Eric对大数据技术各团队的工作表示了肯定,指出了发展空间和方向,同时对携程技术中心大数据技术的未来发展做出了工作部署和工作期望。Eric提出以下两大点:一是成立big data committee,管理处理大数据技术方面的工作;二是建立big data talk机制,每一至两周可安排一次活动,分享精彩话题。 8月1日中午,big data offsite meeting顺利落幕,我们期待携程技术中心大数据技术未来更好的发展讯息。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |