-
大数据分析在石化企业的应用
所属栏目:[大数据] 日期:2020-12-14 热度:107
一、大数据应用现状 1、数据量在不断增加,且数据结构不断复杂。 根据IDC 监测,人类产生的数据量正在呈指数级增长,大约每两年翻一番,这个速度在2020 年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。于此同时,大[详细]
-
大数问题
所属栏目:[大数据] 日期:2020-12-14 热度:117
?? ?? 比大小 时间限制: 3000 ? ms ?|? 内存限制: 65535 ? KB 难度: 2 描述 给你两个很大的数,你能不能判断出他们两个数的大小呢? 比如123456789123456789要大于-123456 输入 每组测试数据占一行,输入两个不超过1000位的10进制整数a,b 数据保证输入的a[详细]
-
【观点】做产品要多挖掘人性的好
所属栏目:[大数据] 日期:2020-12-14 热度:115
?? ? 点击上方 "人人都是产品经理" 可以订阅哦 作者 :灼老师 (微信公众号:share-pm) 来源:授权发布,转载请注明来源于人人都是产品经理并附带本文链接 这是一个突然间产生一个念头,就是电视这个产品必须要改变了,因为电视已经失去了一个重要的功能,[详细]
-
大数据处理时的字符串处理
所属栏目:[大数据] 日期:2020-12-14 热度:123
最近在做文本的shingles时,遇到了一个问题,希望把每个句子按照5个字符一组进行map,因此碰到了字符串分割的问题,这里罗列三种方法; split; substring; StringTokenize 上网调查了一下,StringTokenize性能最优, substring其次,split最差。 但是! 请看[详细]
-
华为机试-大数相减
所属栏目:[大数据] 日期:2020-12-14 热度:179
/*输入两行字符串正整数,第一行是被减数,第二行是减数,输出第一行减去第二行的结果。 备注:1、两个整数都是正整数,被减数大于减数 示例: 输入:1000000000000001 1 输出:100000000000000*/#include stdio.h #include string.h #define N 100void char[详细]
-
颠覆大数据分析之Spark为Shark所提供的扩展
所属栏目:[大数据] 日期:2020-12-14 热度:66
颠覆大数据分析之 Spark 为 Shark 所提供的扩展 译者:黄经业 ? ?购书 在Spark的RDD上执行SQL查询遵循的是传统并行数据库的三步流程: 查询解析 逻辑计划的生成 将逻辑计划映射为物理的执行计划 Shark使用Hive查询编译器来进行查询语句的解析。它会生成一棵[详细]
-
颠覆大数据分析之类似Spark的系统
所属栏目:[大数据] 日期:2020-12-14 热度:141
颠覆大数据分析之类似 Spark 的系统 译者:黄经业 ? ?购书 Nectar (Gunda 等2010),HaLoop (Bu 等2010),以及Twister(Ekanayake等2010)都是类似于Spark的系统。HaLoop是修改后的Hadoop,它增加了一 个支持循环的任务调度器以及一定的缓存机制。缓存一方面是[详细]
-
Pentaho Report Designer 教程(一)初识
所属栏目:[大数据] 日期:2020-12-14 热度:125
软件版本 Pentaho Report Designer 5.0.1-stable 一、 Pentaho Report Designer? 的安装 Pentaho Report Designer(PRD) 由Java编写所以在使用之前应该先安装JRE(有关JRE的安装非本文内容请自行到网上搜索),配置JAVA_HOME。 ?PRD下载地址?http://sourcefor[详细]
-
【字符串】大数的乘法(包括浮点数)
所属栏目:[大数据] 日期:2020-12-14 热度:68
一.大数乘法 我们知道,要运算两个数的乘法,c、c++语言里有专门的运算符*。但是当两个数超过一定的范围时,用普通的运算符会产生溢出,并不能得到正确的结果。如何进行运算呢? ? ? ? 首先,要想保存一个大数,用正常的整形或浮点类型是不够的。所以我们可[详细]
-
【模逆元】大组合数模运算 _CDTemplate
所属栏目:[大数据] 日期:2020-12-14 热度:93
制作起因: 便签纸上一直有这一行 【整理模逆元 exgcd / 大数同余模运算】 今天嵌入式专业课一狠心一咬牙,把它完成!给它打上勾!于是—— 还真被我弄出来了…… 模板来源: 依照以前Astar第二场的AC代码敲了半天,捣鼓出来一个大数组合数模运算代码,提供[详细]
-
两篇文章相似度:TF-IDF与余弦相似性的应用
所属栏目:[大数据] 日期:2020-12-14 热度:60
TF-IDF与余弦相似性的应用(一):自动提取关键词 作者:?阮一峰 日期:?2013年3月15日 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预[详细]
-
大数据没用?5个通过大数据分析提升客户体验的方式
所属栏目:[大数据] 日期:2020-12-14 热度:171
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net ”选择关注D1net旗下的各领域(包括云计算,智慧城市,数据中心,大数据,视频会议,视频监控,服务器,存 储,虚拟化,软件等)的子公众号。 ======= 在互联时代,拥有一个大数据战略来收集、存储、组织[详细]
-
22本数据分析、挖掘的好书推荐—绝对干货,不看后悔
所属栏目:[大数据] 日期:2020-12-14 热度:145
1. 深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了 R 是大加分。 难易程度:非常易。 2.啤酒与尿布 通过案例来说事情,而且是最经典的例子。 3.数据之美 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理[详细]
-
颠覆大数据分析之Mesos:集群调度及管理系统
所属栏目:[大数据] 日期:2020-12-14 热度:168
颠覆大数据分析之Mesos:集群调度及管理系统 译者:黄经业 ? ?购书 正如前面“Mesos:动机”一节中所述,Mesos的主要目标就是去帮助管理不同框架(或者应用栈)间的集群资源。比如说,有一个业务需要在同一个物理 集群上同时运行Hadoop,Storm及Spark。这种情[详细]
-
Dollar Dayz (大数dp fuck!不是多组数据!!)
所属栏目:[大数据] 日期:2020-12-14 热度:62
Dollar Dayz Time Limit: 1000ms Memory Limit: 65536KB 64-bit integer IO format: %lld ???? Java class name: Main Prev Submit Status Statistics Discuss Next Farmer John goes to Dollar Days at The Cow Store and discovers an unlimited number of[详细]
-
Power BI for Office 365(六)Power Map简介
所属栏目:[大数据] 日期:2020-12-14 热度:128
Power BI for Office 365(六)Power Map简介 本文是转载; 来自 ?http://www.cnblogs.com/aspnetx/p/3290085.html#undefined 如果说Power BI中最给力的功能是什么,我觉得是Power Map。Power Map第一次是出现在SQL Server 2014的新特性里被提及,前身就是Ge[详细]
-
Pentaho BI Platform安装
所属栏目:[大数据] 日期:2020-12-14 热度:188
Pentaho BI Platform安装 1.?安装步骤 将下载下来的biserver-ce-X.X.X-stable.zip(biserver-ce-4.8.0-stable)文件解压,将会产生administration-console和biserver-ce两个文件夹,前者是pentaho控制台,后者是pentaho BI服务器。 默认时,Pentaho BI 平台[详细]
-
IT企业专利工程师之三:计算机技术领域专利挖掘刍议
所属栏目:[大数据] 日期:2020-12-14 热度:145
摘要 : 本文从计算机程序的本质出发,分析了计算机程序相关专利的特点以及相关专利挖掘工作的内容和注意事项,并且提出了IT公司专利工作者在研发项目进行过程中进行分阶段专利挖掘的一种具体操作过程。最后,本文提出快速有 ... 作者:李想(北京中天安泰信[详细]
-
22本数据分析、挖掘的好书推荐——经典中的经典,不看后悔
所属栏目:[大数据] 日期:2020-12-14 热度:187
【数盟致力于成为最卓越的数据科学社区,聚焦于大数据、分析挖掘、数据可视化领域,业务范围:线下活动、在线课程、猎头服务、项目对接】 【促销月】 4.9~5.8 国内独家数据可视化课程 六折 优惠 , 现价 358¥ ! 23课时 ! 超值体验 !课程链接点击文末:[详细]
-
数据挖掘算法之关联规则挖掘(一)apriori算法
所属栏目:[大数据] 日期:2020-12-14 热度:176
关联规则挖掘算法在生活中的应用处处可见,几乎在各个电子商务网站上都可以看到其应用 举个简单的例子 如当当网,在你浏览一本书的时候,可以在页面中看到一些套餐推荐,本书+有关系的书1+有关系的书2+...+其他物品=多少¥ 而这些套餐就很有可能符合你的胃口[详细]
-
颠覆大数据分析之第二章结束语
所属栏目:[大数据] 日期:2020-12-14 热度:136
颠覆大数据分析之第二章结束语 译者:黄经业 ? ?购书 本章讨论了一些业务场景,以及它们在BDAS框架中的实现。同时还介绍了什么是BDAS框架,并重点介绍了Spark,Shark,以及Mesos。Spark在那些涉 及到优化的场景中非常有用——比如说Ooyala希望基于约束条件来动[详细]
-
数据挖掘算法之关联规则挖掘(二)FPGrowth算法
所属栏目:[大数据] 日期:2020-12-14 热度:163
之前介绍的apriori算法中因为存在许多的缺陷,例如进行大量的全表扫描和计算量巨大的自然连接,所以现在几乎已经不再使用 在mahout的算法库中使用的是PFP算法,该算法是FPGrowth算法的分布式运行方式,其内部的算法结构和FPGrowth算法相差并不是十分巨大 所[详细]
-
【算法】16个无序数最多20次比较找到第二大的数
所属栏目:[大数据] 日期:2020-12-14 热度:189
这个题是刚刚在微博上看到的,第一想法就想到了leetcode上关于注水的题,Trapping Rain Water,当时的解法是这样的:通过求第二大的数,来解决注水问题 class Solution { public : int trap( int A[], int n) { int left = 0 ; int right = n- 1 ; int trap[详细]
-
漫谈:机器学习中距离和相似性度量方法
所属栏目:[大数据] 日期:2020-12-14 热度:95
漫谈:机器学习中距离和相似性度量方法 原文:http://www.cnblogs.com/daniel-D/p/3244718.html 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如[详细]
-
【算法竞赛入门经典】阶乘的精确值
所属栏目:[大数据] 日期:2020-12-14 热度:196
【算法竞赛入门经典】阶乘的精确值 问题描述 输入不超过1000的正整数n,输出n! = 1x2x3x4x···xn的精确结果. 样例输入:5 样例输出:120 算法分析 我们需要解决两个问题: 怎么保存结果 乘法过程是怎样的 对于第一个问题:因为1000的阶乘是无法用整数保存[详细]
