-
挖掘目标文件
所属栏目:[大数据] 日期:2020-12-14 热度:148
一般C语言编译后的执行语句都编译成及其代码,保存在.text段;已初始化的全局变量和局部静态变量都保存在.data段;未初始化的全局变量和局部静态变量一般放在.bss段里。我们知道未初始化的全局变量和局部静态变量默认都是0,本来他们可以存放在.data段中,但[详细]
-
深度解读2016大数据版图(2):数据处理与存储篇
所属栏目:[大数据] 日期:2020-12-14 热度:133
【数盟致力于成为最卓越的数据科学社区,聚焦于大数据、分析挖掘、数据可视化领域,业务范围:线下活动、在线课程、猎头服务、项目对接】 【免费福利】觉得DTCC2016大会的票价壕无人性?数盟请你免费来听人工智能专场!五位重量级嘉宾全程干货分享,不仅仅是[详细]
-
DeepLearning: 数据处理4:将caffe训练时屏幕输出保存到文本文件
所属栏目:[大数据] 日期:2020-12-14 热度:72
Tips:代码中路径记得自己替换就行了。。。 1.训练次数比较多 的时候,屏幕好多信息可能没有及时看到,所以需呀把屏幕所有的输出都保存下来。 #!/usr/bin/env sh # 删除路径下的txt文件 rm -vf ~/lilai/myDL/clothes/mymodel/model/*.txt # 运行caffe,并将屏[详细]
-
DeepLearning: 数据处理5:将caffe训练时屏幕输出可视化(matlab
所属栏目:[大数据] 日期:2020-12-14 热度:64
说明:必须再前一篇博文的基础上使用本文中的代码。先将屏幕输出保存到文本中,然后在使用本文中的代码。。。同样,这里只是我的环境下调通的,根据个人,适当调整代码就行了。。。都是重复造轮子,没啥技术含量。。。 % 根据caffe输出文档,作出accuracy,lo[详细]
-
BI cube的前世今生:商业智能BI为什么需要cube技术
所属栏目:[大数据] 日期:2020-12-14 热度:129
企业中常常会出现这样一幕幕尴尬的场景: 企业的决策人员需要从不同的角度来审视业务,协助他们分析业务,例如分析销售数据,可能会综合时间周期、产品类别、地理分布、客户群类等多种因素来考量。 IT 人员在每一个分析角度上都建了一张报表。然而,决策人员[详细]
-
一共81个,开源大数据处理工具汇总(上)
所属栏目:[大数据] 日期:2020-12-14 热度:63
作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一[详细]
-
一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集
所属栏目:[大数据] 日期:2020-12-14 热度:157
作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设[详细]
-
uva 10523 Very Easy !!! 大数模拟加法和乘法
所属栏目:[大数据] 日期:2020-12-14 热度:109
题意:求Σi*a^i,1=i=n,因为n过于庞大,只能用大数做 思路:就大数模板题,注意下a==0就可以了 题目链接:?https://uva.onlinejudge.org/index.php?option=com_onlinejudgeItemid=8category=17page=show_problemproblem=1464 #include cstdio#include cstring[详细]
-
[BZOJ3110][Zjoi2013]K大数查询(主席数套线段树 )
所属栏目:[大数据] 日期:2020-12-14 热度:54
题目描述 传送门 题解 外层权值线段树,权值线段树的每一个位置都是一棵线段树,线段树用动态开点。 注意pushdown或者查询的时候还有可能要继续开点。 注意最顶端的点的权有可能是炸了int了,因为有可能加入了50000^2个点。 代码 #includealgorithm#includei[详细]
-
大数据处理的一些总结和应用(有关舆情监控)
所属栏目:[大数据] 日期:2020-12-14 热度:57
? ? 说到大数据处理可能大家都不会陌生,这是近年来非常火热的话题,各行各业都想借助大数据为自己助力,有了这个工具,就好像在飞机上看农田一般清晰,一目了然,也也就是业内人士常说的大数据提供了一个------上帝视角 大数据的概念: 1、指的是所涉及的资[详细]
-
余弦相似性:找出相似文章
所属栏目:[大数据] 日期:2020-12-14 热度:152
上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cos[详细]
-
bzoj 3110: [Zjoi2013]K大数查询(树套树,整体二分)
所属栏目:[大数据] 日期:2020-12-14 热度:135
3110: [Zjoi2013]K大数查询 Time Limit:? 20 Sec?? Memory Limit:? 512 MB Submit:? 4020?? Solved:? 1547 [ Submit][ Status][ Discuss] Description 有N个位置,M个操作。操作有两种,每次操作如果是1 a b c的形式表示在第a个位置到第b个位置,每个位置加[详细]
-
数据流和批量大数据分析技术 Apache Apex 提升为 Apache 顶级项
所属栏目:[大数据] 日期:2020-12-14 热度:165
数据流和批量大数据分析技术Apache Apex近日被Apache软件基金会提升为顶级项目。这项技术已被包括第一资本(Capital One)和通用电气(GE)在内的企业组织使用,可以帮助开发人员更快速地创建充分利用实时数据的应用程序。 Apache Spark日益受到关注,表明了[详细]
-
机器学习中的相似性度量
所属栏目:[大数据] 日期:2020-12-14 热度:146
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目[详细]
-
大数加法运算
所属栏目:[大数据] 日期:2020-12-14 热度:115
void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen(a);int lenb = strlen(b);for (int i = lena - 1,j = 0; i = 0; i--)[详细]
-
大数乘法
所属栏目:[大数据] 日期:2020-12-14 热度:112
void mul(char a[],char b[]){/****************装换****************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen(a);int lenb = strlen(b);for (int i = lena - 1,j = 0; i = 0; i--){num1[j++][详细]
-
大数取余
所属栏目:[大数据] 日期:2020-12-14 热度:55
void mod(char a[],int mod){///****************装换****************///int num1[LEN];//int num2[LEN];//for (int i = 0; i LEN; i++){//num1[i] = 0;//num2[i] = 0;//}int lena = strlen(a);//int lenb = strlen(b);//for (int i = lena - 1,j = 0; i =[详细]
-
机器学习中距离和相似性度量方法
所属栏目:[大数据] 日期:2020-12-14 热度:83
作者:daniel-D 来源:http://www.cnblogs.com/daniel-D/p/3244718.html 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均[详细]
-
大数减法
所属栏目:[大数据] 日期:2020-12-14 热度:126
这个程序比较多,但是思路很简单,只要求取大数减小数,如果是小数减大数,转换成大数减小数,输出负号 void sub(char a[],char b[]){int alen = strlen(a);int blen = strlen(b);int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[详细]
-
大数加,减,乘,取余一起
所属栏目:[大数据] 日期:2020-12-14 热度:79
#includeiostream#includestring#define LEN 100using namespace std;void add(char a[],char b[]){/*********************装换*********************/int num1[LEN];int num2[LEN];for (int i = 0; i LEN; i++){num1[i] = 0;num2[i] = 0;}int lena = strlen[详细]
-
余弦相似性算法
所属栏目:[大数据] 日期:2020-12-14 热度:180
余弦相似性算法的具体介绍参考:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 下面是我根据上边的介绍进行的java语言的实现: import java.io.IOException; import java.io.StringReader; import java.util.Collections; import java.util.[详细]
-
图像相似性搜索的原理
所属栏目:[大数据] 日期:2020-12-14 热度:127
本文转自: http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html http://www.voidcn.com/article/p-nvcdxgfv-bnx.html http://blog.sina.com.cn/s/blog_b27f71160101gp9c.html http://www.voidcn.com/article/p-ojqegjmq-wy.html[详细]
-
FZU- Problem 1147 Tiling,递推坑题,大数水过~~
所属栏目:[大数据] 日期:2020-12-14 热度:185
Problem 1147 Tiling Time Limit: 1000 mSec?? ??Memory Limit : 32768 KB http://acm.fzu.edu.cn/problem.php?pid=1147 ?Problem Description In how many ways can you tile a 2x n ?rectangle by 2x1 or 2x2 tiles? Here is a sample tiling of a 2x17 re[详细]
-
POJ 3101 素数分解+大数
所属栏目:[大数据] 日期:2020-12-14 热度:196
题目 Astronomy Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 5643 Accepted: 1252 Description There are n planets in the planetary system of star X. They orbit star X in circular orbits located in the same plane. Their tangent[详细]
-
求大数的阶乘和末尾0个数的计算
所属栏目:[大数据] 日期:2020-12-14 热度:56
求末尾 0 的个数: 至于末尾有多少个 0 ,这个简单, 0 的个数为(其中的 “/” 是取整除法): 例子:( 1000 的阶乘末尾 0 的个数) ?? ? ? ? 1000 ? / ? 5 ? + ? 1000 ? / ? 25 ? + ? 1000 ? / ? 125 ? + ? 1000 ? / ? 625 ?? ? = ? 200 ? + ? 40 ? + ? 8[详细]