-
Kettle plugin 插件开发
所属栏目:[大数据] 日期:2020-12-14 热度:66
Kettle本身提供了很多组件,多个组件一起构成一个transformation(转换),多个转换一起构成一个job(任务)。kettle的组件已经非常丰富,在组件不满足需求时可以在kettle上面开发自己的组件,kettle支持的组件开发如下: ? Kettle 中的插件包含两部分: 一[详细]
-
推荐系统相似性计算
所属栏目:[大数据] 日期:2020-12-14 热度:163
推荐系统中常用的相似度计算方法。 1. pearson correlation coefficient 计算两个变量之间存在的线性关系(积矩相关系数) 该式计算简单,但必须满足一定的条件(依赖于线性回归模型): 1. 两个变量之间有线性关系; 这个可以通过变量之间的散点图看出来。 2. 变[详细]
-
TF-IDF结合余弦相似性 判断文章相似性
所属栏目:[大数据] 日期:2020-12-14 热度:119
摘自: 阮一峰的网络日志(http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html) 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。 为了简单起见,我们先从句子着手。 句子A:[详细]
-
IBM数据处理与分析综合解决方案
所属栏目:[大数据] 日期:2020-12-14 热度:138
轻松落地,IBM信息管理产品在分销行业上的解决方案。 信息管理软件覆盖分销业务所有需求,使用产品包含了经典产品数据库DB2、mpp新一代数据库netezza及非结构化分布式数据库biginsight,数据治理软件归档漂白工具optim、安全软件guardium,ETL工具datastage[详细]
-
UVA 10069 ---Distinct Subsequences +DP+大数
所属栏目:[大数据] 日期:2020-12-14 热度:141
可以定义dp[i][j]表示第一个串的前i个字符中含有第二个串的前j个字符的总情况数; 则:如dp[i][j]=dp[i-1][j],如果str1[i]==str2[j]则dp[i][j]+=dp[i-1][j-1]; 初始时讲所有的dp[i][0]赋值为1,其他为0。 然后这个题目需要用到大数,可以用C++重载运算符,[详细]
-
Hello Flink
所属栏目:[大数据] 日期:2020-12-14 热度:191
Setup $? wget?-O?~/data/gutenberg/hamlet.txt?http://www.gutenberg.org/cache/epub/1787/pg1787.txt $? cd?~/soft/flink-0.7.0-incubating $? bin/start-local.sh $?jps?-m 18689? JobManager?-executionMode?local?-configDir?/home/hadoop/soft/flink-0[详细]
-
Hello Tez
所属栏目:[大数据] 日期:2020-12-14 热度:191
Tez http://www.infoq.com/cn/articles/apache-tez-saha-murthy ?? http://hortonworks.com/blog/apache-tez-a-new-chapter-in-hadoop-data-processing/ ? http://www.cnblogs.com/fxjwind/p/3377695.html ? http://zcdeng.iteye.com/blog/1897208 ? http://[详细]
-
表达式解析计算器源码(完整实现)
所属栏目:[大数据] 日期:2020-12-14 热度:142
大一下时做的大数非图形界面计算器,自己在这个过程中收获较大,希望和大家分享下 分三个(面向过程浮点版,面向对象浮点版和面向对象大数版)版本:: 完整实现如下: Version1: 面向过程浮点版 (从文件读入并输出) divexcept.h(存储各种错误信息) #inclu[详细]
-
HDU-求大数的阶乘
所属栏目:[大数据] 日期:2020-12-14 热度:122
问题及代码: /* *Copyright (c)2014,烟台大学计算机与控制工程学院 *All rights reserved. *文件名称:HDU.cpp *作 者:单昕昕 *完成日期:2015年1月27日 *版 本 号:v1.0 *问题描述:Time Limit : 10000/5000ms (Java/Other) Memory Limit : 65536/32768K[详细]
-
HDU-多个大数加法问题
所属栏目:[大数据] 日期:2020-12-14 热度:114
问题及代码: /* *Copyright (c)2014,烟台大学计算机与控制工程学院 *All rights reserved. *文件名称:HDU.cpp *作 者:单昕昕 *完成日期:2015年1月27日 *版 本 号:v1.0 *问题描述:One of the first users of BIT's new supercomputer was Chip Diller.[详细]
-
[暖手][学习阶段-各路杂题][HDU-1002]A + B Problem II
所属栏目:[大数据] 日期:2020-12-14 热度:150
这种大数题 用java简直和开挂一样 Problem Description I have a very simple problem for you. Given two integers A and B,your job is to calculate the Sum of A + B. ? Input The first line of the input contains an integer T(1=T=20) which means t[详细]
-
[算法系列之八]大数问题(高精度运算)
所属栏目:[大数据] 日期:2020-12-14 热度:127
【大数相加】 【代码一】 /********************************** 日期:2015-01-28* 作者:SJF0115* 题目: 大数加法(高精度加法)* 博客:**********************************/#include iostreamusing namespace std;string AddString(string num1,string num2[详细]
-
[LeetCode]43.Multiply Strings
所属栏目:[大数据] 日期:2020-12-14 热度:113
【题目】 Given two numbers represented as strings,return multiplication of the numbers as a string. Note: The numbers can be arbitrarily large and are non-negative. 【分析】 高精度乘法(大数乘法) 其实更多地是考察乘法运算的本质。基本思路是[详细]
-
大数阶乘
所属栏目:[大数据] 日期:2020-12-14 热度:151
在计算阶乘的时候,结果如果用int 用4个字节表示无符号最大值是2^32-1 = 4294967295,共10位,而n=12的时候为479001600是9位,n=13的时候就溢出了。这时候自己可以定义一个大数类,比如用一个int数组存储结果,数组长度可以很长。与数组类似也可以用链表存储[详细]
-
[算法系列之九]Karatsuba快速相乘算法
所属栏目:[大数据] 日期:2020-12-14 热度:98
【概述】 Karatsuba乘法是一种快速乘法。此算法在1960年由Anatolii Alexeevitch Karatsuba 提出,并于1962年得以发表。 此算法主要用于两个大数相乘。普通乘法 的复杂度是n 2 , 而Karatsuba算法的复杂度仅为3n log3 ≈3n 1.585 (log3是以2为底的) 【步骤[详细]
-
[暖手][学习阶段-各路杂题][HDU-1018]Big Number
所属栏目:[大数据] 日期:2020-12-14 热度:91
Problem Description In many applications very large integers numbers are required. Some of these applications are using keys for secure transmission of data,encryption,etc. In this problem you are given a number,you have to determine the n[详细]
-
寻找数组第二大数和第K大数
所属栏目:[大数据] 日期:2020-12-14 热度:176
一、寻找第二大数 #include "stdio.h"#include "stdlib.h"int findsecondmaxvalue(int *a,int size){ int i,max,s_max; max=sub_max=-65536; for(i=0;isize;i++) { if(a[i]max) {s_max=max; max=a[i]; }else if(a[i]max a[i]s_max) //max有可能不持续更新(第[详细]
-
直击大数据——敏捷BI提升企业数据分析效率
所属栏目:[大数据] 日期:2020-12-14 热度:173
【数盟致力于成为最卓越的数据科学社区,聚焦于大数据、分析挖掘、数据可视化领域,业务范围:线下活动、在线课程、猎头服务、项目对接】 数盟战略合作伙伴永洪BI的线下沙龙,欢迎小伙伴们前来捧场~ 永洪BI将于2015年1月31日与中关村8bit咖啡主办“直击大数[详细]
-
寻找第k大数
所属栏目:[大数据] 日期:2020-12-14 热度:148
/************************************************************************* File Name: k_fenshu.cpp Author: wangzhicheng Mail: 2363702560@qq.com Created Time: Sun 18 Jan 2015 10:47:12 PM WSTThis is a free program,you can modify or redistrib[详细]
-
基于链表的四位存储大数计算
所属栏目:[大数据] 日期:2020-12-14 热度:108
数据结构的大型实验,和之前写的计算器不同的是,少了词法解析,多了链表指针操作,写完感觉,指针操作能力上了一个台阶,有时间有兴趣的亲,也可以尝试一下,下附实验报告及源码。 1. 实验内容 1.1 实验目的 实验通过实现基于链表类实现的大数类,从而锻炼[详细]
-
新启动企业正在挖掘数据来帮助营销人员回答困难问题(英文)
所属栏目:[大数据] 日期:2020-12-14 热度:180
Startups are digging the data to help marketers answer tough questions This sponsored post is produced by Microsoft. How much extra reach is social media adding to your broadcast advertising spend? What creative approaches are clicking wit[详细]
-
MOD 10,11算法(GB/T 17710-1999 数据处理 校验码系统 ),使用
所属栏目:[大数据] 日期:2020-12-14 热度:116
原文链接:http://chunniu.info/p/74.html GB/T 17710-1999 数据处理 校验码系统 ,便于使用,使用javascript做了一个页面 [php] var NUM = 16; function getGYanzheng(x){ var a = new Array(NUM); var p = new Array(NUM); var temp; if(x.length != NUM-2[详细]
-
MOD 10,11算法(GB/T 17710-1999 数据处理 校验码系统 ),使用
所属栏目:[大数据] 日期:2020-12-14 热度:77
原文链接:http://chunniu.info/p/74.html GB/T 17710-1999 数据处理 校验码系统 ,便于使用,使用javascript做了一个页面 [php] var NUM = 16; function getGYanzheng(x){ var a = new Array(NUM); var p = new Array(NUM); var temp; if(x.length != NUM-2[详细]
-
MOD 10,11算法(GB/T 17710-1999 数据处理 校验码系统 ),使用
所属栏目:[大数据] 日期:2020-12-14 热度:100
原文链接:http://chunniu.info/p/74.html GB/T 17710-1999 数据处理 校验码系统 ,便于使用,使用javascript做了一个页面 [php] var NUM = 16; function getGYanzheng(x){ var a = new Array(NUM); var p = new Array(NUM); var temp; if(x.length != NUM-2[详细]
-
支持中文文本的数据挖掘平台开源项目PyMining发布
所属栏目:[大数据] 日期:2020-12-14 热度:160
本文转自http://www.cnblogs.com/LeftNotEasy/archive/2011/02/27/py_mining_first_release.html 前言 ???? 最近一个月,过年的时候天天在家里呆着,年后公司的事情也不断,有一段时间没有更新博客了。PyMining是我最近一段时间构思的一个项目,虽然目前看来[详细]
