2015年9月5日国务院印发《促进大数据发展的行动纲要》,加快政府数据开放共享,推动产业创新发展。9月15日,国家知识产权局局长申长雨在以“专利运用新业态支撑经济发展新常态”为主题的专利信息年会上指出:“要实现专利信息服务与互联网和大数据的深度结合,既要依托互联网提高专利信息的传播利用效率,也要借助大数据对专利数据信息进行深度整合、加工、挖掘、处理,并实现与经济、贸易等数据的关联分析,使得更有价值的隐性信息浮出水面,加以利用。”
经过近几年的发展,基于大数据的专利分析已经从“蹒跚学步”逐步迈入到了“茁壮成长”的阶段。然而,要实现专利支撑经济发展新常态的发展目标,仍然任重而道远。这其中有需要自身苦练内功的地方,同时更需要越来越多来自外部的工具的支持与帮助。
俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代更是如此。我们需要强有力的工具来帮助处理繁杂的多元数据,需要灵活多样的工具来使数据以有意义的方式呈现,需要更高效的工具来让我们与数据进行交互,需要更便捷的工具来满足跨学科团队的协同工作。
1. Microsoft Excel
Microsoft Excel
作为日常办公必备工具应该是最为人熟知的数据工具。作为一个入门级产品,它可以进行各种数据的处理、统计、分析和决策等操作,被广泛应用于管理、统计财经、金融等众多领域。随着时代的进步,Excel
也在不断加入新的数据处理功能和图表样式,特别是Power BI
的加入让Excel的功能更加完备,操作更加便捷,
也让Excel
始终占据着不可或缺的重要地位。但对于复杂的、多元的数据结构及大数据量的支持仍然较弱,限制了其使用范围。
2. Thomson Data Analyzer
Thomson Data Analyzer(简称TDA)
是一个具有强大分析功能的文本挖掘软件,可以对文本数据进行多角度的数据挖掘和可视化的全景分析。它主要包括数据导入、数据清理、数据分析、生成报告等功能,其灵活的数据处理和多样的分析报告,加之与Derwent
数据的无缝衔接,为发现竞争情报和技术情报,洞察科学技术的发展趋势、发现行业出现的新兴技术、寻找合作伙伴,确定研究战略和发展方向提供了强有力的支撑。从早期TDA
作为技术秘密被美国政府限制使用就可看出其重要作用和价值。随着限制的解除,TDA
正在向不同领域延伸。
3. Hadoop
Hadoop
严格来说是一个大数据存储的框架,可以让用户轻松架构和使用的分布式计算平台,开发和运行处理海量数据的应用程序。其具有高可靠性、高扩展性、高效性和高容错性四个特点,能够轻松处理PB
级数据,是目前众多大数据服务商的基础平台。但其部署与开发的复杂度也限制了普通用户的使用,同时其实时处理效率也限制了其应用的范围。
4. Spark
Spark是
类似Hadoop
、MapReduce
的通用并行框架,拥有Hadoop
和MapReduce
所具有的优点,但由于可以将中间步骤通过内存处理,从而提高了整体性能,尤其适合用来构建大型的、低延迟的数据分析应用程序,更有利于实现即席查询和实时统计分析。但与Hadoop
类似,其部署与开发的复杂度也限制了普通用户的使用。
5. R
R
是一套完整的数据处理、计算和制图软件系统。R
最早是诞生于1980
年的S
语言的一个分支。经过多年努力,其功能不断完善,目前功能包括:数据存储和处理系统;数组运算工具(向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;统计制图功能;简便的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。R
的灵活性是其一大特点,但需要具有一定的编程能力,这也导致了较高的使用门槛。
6. Pentaho BI
Pentaho BI
是一个以流程为中心,面向解决方案的框架,较其它工具更接近于实际的应用。Pentaho BI
可以将一系列企业级商业智能产品、开源软件、API
等等组件集成起来,方便集成应用的开发。它的出现,使得一系列的面向商务智能的独立产品能够集成在一起,构成一项项复杂的、完整的解决方案。作为一个集成框架,需要对其它各类工具有所了解,无疑提高了使用的门槛。
7. D3
D3
(Data Driven Documents
)是一个JavaScript
库,这也意味着只要有浏览器的地方就可以使用它。D3
能够提供大量线性图和条形图之外的复杂图表样式,例如关联图、树形图、圆形集群和单词云等。需要强调的是,其核心并不是图形,而是将“数据可视化”抽象为数据与可视化元素的匹配,在图形与数据之间搭建了一座桥梁,可以轻松的实现图表互动与复杂图表的设计,是数据可视化和图形交互方面的重要工具。
8. Echarts
Enterprise Charts
,百度出品的商业级数据图表工具,与D3
类似,是一个纯Javascript
库,可以流畅的运行在PC
和移动设备上,兼容当前绝大部分浏览器。ECharts
提供了直观,生动,可交互,可高度个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性增强了用户体验。支持12
类图表,同时提供标题,详情气泡、图例、值域、数据区域、时间轴、工具箱等7
个可交互组件,支持多图表、组件的联动和混搭展现,是一款简单、易用、美观的图表工具。
当然,我们仅能向大家展示冰山一角,还有很多优秀的工具有待我们去发现、了解和使用。相信随着得到越来越多优秀工具的支持与帮助,“专利支撑经济发展新常态”的目标必将更快实现。
作者:邓鹏
编辑:王瑞阳、孙玮
版权声明:由“大数据人”推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。(www.bigdata.ren)
扫码快速加入微信群,每日行业资讯!
干货大放送啦!大放送啦!大放送啦!
获取方式:
第一步:关注微信公众号(大数据人)
第二步:后台回复相关的关键词,将有惊喜!
关键词列举:大数据、大数据书籍、数据挖掘、数据库、Hadoop、SAS、SPSS、Clementine、Python、Stata、Minitab、Tableau、R语言、Matlab、行业资料等
只要回复其中的某个关键词,就会获取相关资料下载地址!
数据分析挖掘千人交流QQ群:325414822。
点击下方【阅读原文】加入大数据行业通讯录