-
玩玩文本挖掘-wordcloud、主题模型与文本分类
所属栏目:[大数据] 日期:2020-12-14 热度:99
数据挖掘资料,点击底部" 阅读原文 ",手慢无 本文主要介绍文本挖掘的常见方法,主要包括词频分析及 wordcloud 展现、主题模型、文本分类、分类评价等。分类主要包括无监督分类(系统聚类、 KMeans 、 string kernals ),有监督分类( knn 、 SVM )。 一、[详细]
-
乐逗高级数据分析师谢佳标:基于R语言的大数据处理及建模技术
所属栏目:[大数据] 日期:2020-12-14 热度:73
WOT2015"互联网+"时代大数据技术峰会于2015年11月28日于深圳前海华侨城JW万豪酒店盛大揭幕,42位业内重量级嘉宾汇聚,重磅解析大数据技术的点睛应用。秉承专注技术、服务技术人员的理念。 DBA+社群作为本次大会合作方,将通过图文直播为大家全程跟踪报道这[详细]
-
杭电-1715大菲波数(大数)
所属栏目:[大数据] 日期:2020-12-14 热度:100
大菲波数 Time Limit: 1000/1000 MS (Java/Others)????Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 15585????Accepted Submission(s): 5213 Problem Description Fibonacci数列,定义如下: f(1)=f(2)=1 f(n)=f(n-1)+f(n-2) n=3。 计算[详细]
-
1024. Palindromic Number (25)【简易大数加法+回文】——PAT (A
所属栏目:[大数据] 日期:2020-12-14 热度:71
题目信息 1024. Palindromic Number (25) 时间限制400 ms 内存限制65536 kB 代码长度限制16000 B A number that will be the same when it is written forwards or backwards is known as a Palindromic Number. For example,1234321 is a palindromic numbe[详细]
-
BI Component开发(3)--处理输出
所属栏目:[大数据] 日期:2020-12-14 热度:99
以下方法用来处理Component的输出信息 ①getOutputContentItem方法 参数:String outputName 返回值: org.pentaho.core.repository.IContentItem 为指定的输出返回一个IContentItem对象。该对象可以用来访问输出流。 在访问输出前,调用isDefinedOutput方法[详细]
-
区间k大数查询
所属栏目:[大数据] 日期:2020-12-14 热度:127
问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整数m,表示询问个数。 接下来m行,每行三个数l,r,K,表示询问序列从左往[详细]
-
七牛数据处理架构变迁
所属栏目:[大数据] 日期:2020-12-14 热度:111
据统计,互联网数据量正以每三年翻一番的速度膨胀,其中, 95%以上都是非结构化数据,且这个比例仍在不断提升。如今,互联网已全面覆盖大家生活的方方面面,每个人的消费行为、娱乐行为和社交行为都将产生海量的图片、音视频、网络日志等非结构化数据。非结[详细]
-
13招神技 : 让你在数据科学和数据分析工作中脱颖而出
所属栏目:[大数据] 日期:2020-12-14 热度:129
简介:我有幸在很早参与了一个大数据科学项目,我非常喜欢其中的工作,甚至我意识到我的努力可以增加一些公司的价值。 然而,可悲的是,只有不到30%的数据科学项目最终实施了。我备受打击的意识到我的努力被浪费了。但是,我不是唯一的一个。几乎,每一个分[详细]
-
大斐波那契数杭电1250
所属栏目:[大数据] 日期:2020-12-14 热度:110
?? Hat's?Fibonacci Time?Limit:?2000/1000?MS?(Java/Others)????Memory?Limit:?65536/32768?K?(Java/Others) Total?Submission(s):?9518????Accepted?Submission(s):?3135 Problem?Description A?Fibonacci?sequence?is?calculated?by?adding?the?previous?[详细]
-
杭电HDU1023卡特兰大数
所属栏目:[大数据] 日期:2020-12-14 热度:147
?? Train?Problem?II Time?Limit:?2000/1000?MS?(Java/Others)????Memory?Limit:?65536/32768?K?(Java/Others) Total?Submission(s):?7198????Accepted?Submission(s):?3885 Problem?Description As?we?all?know?the?Train?Problem?I,?the?boss?of?the?Ignat[详细]
-
哈理工2019大数阶乘n!problemII
所属栏目:[大数据] 日期:2020-12-14 热度:100
?? n!?problem?II Time?Limit:?1000?MS Memory?Limit:?32768?K ? Total?Submit:?368(185?users) Total?Accepted:?135(114?users) Rating:? Special?Judge:?No ? Description 求阶乘看起来是一个很简单的问题,现在我们要计算一个不超过100的整数的阶乘。 Inp[详细]
-
大数减法
所属栏目:[大数据] 日期:2020-12-14 热度:102
?? #includestdio.h #includestring.h using?namespace?std; char?a[1000]; char?b[1000]; int?c[1000]; char?temp[1000]; int?main() { ????while(~scanf("%s%s",a,b)) ????{ ????????int?flog=0; ????????memset(c,sizeof(c)); ????????int?la=strlen(a);[详细]
-
杭电HDU1002(大数加法)
所属栏目:[大数据] 日期:2020-12-14 热度:110
?? A?+?B?Problem?II Time?Limit:?2000/1000?MS?(Java/Others)????Memory?Limit:?65536/32768?K?(Java/Others) Total?Submission(s):?277311????Accepted?Submission(s):?53511 Problem?Description I?have?a?very?simple?problem?for?you.?Given?two?intege[详细]
-
R案例操作:RQDA和tm包结合进行文本挖掘
所属栏目:[大数据] 日期:2020-12-14 热度:101
数据挖掘资料,点击底部" 阅读原文 ",手慢无 应用定性数据分析包RQDA(Qualitative Data Analysis)和文挖掘框架包tm结合进行文本挖掘。 在对访谈内容或剧本、小说部分内容进行文本挖掘时,如果用不断的剪粘保存的方法非常繁琐而且容易漏掉一些内容。好在黄荣[详细]
-
七牛数据处理架构变迁
所属栏目:[大数据] 日期:2020-12-14 热度:167
据统计,互联网数据量正以每三年翻一番的速度膨胀,其中,95%以上都是非结构化数据,且这个比例仍在不断提升。如今,互联网已全面覆盖大家生活的方方面面,每个人的消费行为、娱乐行为和社交行为都将产生海量的图片、音视频、网络日志等非结构化数据。非结构[详细]
-
安装R可视化挖掘工具Rattle
所属栏目:[大数据] 日期:2020-12-14 热度:197
安装R可视化挖掘工具 Rattle install.packages("RGtk2")install.packages("rattle")library(rattle)rattle()[详细]
-
hdu 5568 sequence2(dp + 大数)
所属栏目:[大数据] 日期:2020-12-14 热度:127
题目链接:hdu 5568 sequence2 代码 #include cstdio #include cstring #include algorithm using namespace std ; const int maxn = 105 ; struct Bign { int n,s[maxn 1 ]; Bign ( int t = 0 ) { init(); s[ 0 ] = t; } void init () { n = 1 ; memset (s,[详细]
-
大数相乘——分治法(lua版)
所属栏目:[大数据] 日期:2020-12-14 热度:172
首先,什么是大数相乘?大数相乘通过字面的意思也能知道,就是量很大的相乘。他的解法有很多种,想穷举,分治法等等。但是如果是通过穷举法来解决大数相乘,他的时间复杂度是n的平方。但是,如果使用分治法,它的时间复杂度就降低很多。 在这里,我们不讲怎[详细]
-
杭电1063 hdu1063Exponentiation
所属栏目:[大数据] 日期:2020-12-14 热度:134
Exponentiation Time Limit: 2000/500 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 8385????Accepted Submission(s): 2393 Problem Description Problems involving the computation of exact values of very larg[详细]
-
星环科技喜获 BIGDATA 100 评选两项大奖
所属栏目:[大数据] 日期:2020-12-14 热度:59
近日讯,在 商业伙伴咨询机构主办的 BIGDATA 100 评选活动中,作为 国内极少数掌握大数据核心技术的 星环科技荣获 BIGDATA 100 ‘ 2015 优秀大数据平台提供商’,以及‘ 最具网络影响力大数据企业’两项大奖。 2015年11月25日,由商业伙伴咨询机构主办的“20[详细]
-
杭电-2674N!Again(大数阶乘)
所属栏目:[大数据] 日期:2020-12-14 热度:86
N!Again Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 4267????Accepted Submission(s): 2279 Problem Description WhereIsHeroFrom: ????????????Zty,what are you doing ? Zty: ?????????[详细]
-
七牛数据处理架构变迁
所属栏目:[大数据] 日期:2020-12-14 热度:74
架构师(JiaGouX) 我们都是架构师! 据统计,互联网数据量正以每三年翻一番的速度膨胀,其中, 95%以上都是非结构化数据,且这个比例仍在不断提升。如今,互联网已全面覆盖大家生活的方方面面,每个人的消费行为、娱乐行为和社交行为都将产生海量的图片、音[详细]
-
对加密数据的高效的相似性搜索(一)
所属栏目:[大数据] 日期:2020-12-14 热度:117
? ? ? 近年来云计算的广泛应用,大量数据已经被存放在云中。虽然云服务提供了很多优点,敏感数据的隐私和安全问题仍然仍然让人担忧。为了消除这种担忧,以加密的形式外包敏感数据是值得期待的管理方式。加密存储防止对数据进行非法访问,但使得一些基本操作[详细]
-
OAF学习笔记-不基于EO的数据处理
所属栏目:[大数据] 日期:2020-12-14 热度:53
主要功能 : 手工建立 PAGE 及上面的 ITEM, 所有 ITEM 均为普通的 ITEM, 非 VO 的 ATTRIBUTE. 然后在 ITEM 中输入信息 , 并保存到表中 . 主要使用的包及方法 : 包 Import oracle.apps.fnd.framework.OAApplicationModule; 方法 getTransaction().executeComma[详细]
-
poj 3181 Dollar Dayz 钱币兑换问题 大数/高精度 完全背包
所属栏目:[大数据] 日期:2020-12-14 热度:200
Dollar Dayz Time Limit: ?1000MS ? Memory Limit: ?65536K Total Submissions: ?5289 ? Accepted: ?2006 Description Farmer John goes to Dollar Days at The Cow Store and discovers an unlimited number of tools on sale. During his first visit,the[详细]
