-
文本挖掘
所属栏目:[大数据] 日期:2020-12-14 热度:138
什么是文本挖掘 文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。1998年底,国家重点研究发展规划首批实施项目中明确指出,文本挖掘是“图像、语言、自然语言理解与知识挖掘”中的重要内容[详细]
-
BI 是什么管理软件系统
所属栏目:[大数据] 日期:2020-12-14 热度:189
BI是20世纪90年代美国分析师所创造出来的新名词,不过,它并不是一个凭空冒出的东西。事实上,已经兴起的企业信息系统(EIS)、决策支持系统?(Decision?Support?System)、ERP、CRM等即是为满足同样的目的而兴起的IT潮流。BI是在ERP等信息化管理工具的基础[详细]
-
R语言做文本挖掘 Part1安装依赖包
所属栏目:[大数据] 日期:2020-12-14 热度:195
原帖地址:http://blog.csdn.net/cl1143015961/article/details/44082731#comments Part1安装依赖包 R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装Java。 ? 第一步 是安装Java,请安装JDK,JRE不行。请对应机型,下[详细]
-
R语言做文本挖掘 Part3文本聚类
所属栏目:[大数据] 日期:2020-12-14 热度:122
原帖地址:http://blog.csdn.net/cl1143015961/article/details/44313025 Part3文本聚类 分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介: 分类算法:http://www.voidcn.com/a[详细]
-
R语言做文本挖掘 Part2分词处理
所属栏目:[大数据] 日期:2020-12-14 热度:170
原帖地址:http://blog.csdn.net/cl1143015961/article/details/44108143 Part2分词处理 在RStudio中安装完相关软件包之后,才能做相关分词处理,请参照Part1部分安装需要软件包。参考文档:玩玩文本挖掘,这篇文章讲用R做文本挖掘很详尽,并且有一些相关资[详细]
-
R语言做文本挖掘 Part4文本分类
所属栏目:[大数据] 日期:2020-12-14 热度:180
原帖地址:http://blog.csdn.net/cl1143015961/article/details/44413631 Part4文本分类 Part3文本聚类里讲到过,分类跟聚类的简单差异。所以要做分类我们需要先整理出一个训练集,也就是已经有明确分类的文本;测试集,可以就用训练集来替代;预测集,就是[详细]
-
R语言做文本挖掘 Part5情感分析
所属栏目:[大数据] 日期:2020-12-14 热度:50
原帖地址:http://blog.csdn.net/cl1143015961/article/details/44460873 Part2情感分析 ? 这是这个系列里面最后一篇文章了,其实这里文本挖掘每一个部分单拎出来都是值得深究和仔细研究的,我还处于初级研究阶段,用R里面现成的算法,来实现自己的需求,当[详细]
-
白话空间统计二十:相似性搜索(上)
所属栏目:[大数据] 日期:2020-12-14 热度:87
莎老爷子著名的四大悲剧之一的哈雷王子。。。里面这句话一直是文艺小青年们 zhuangbility 的金牌用语……实际上说出了这样一句大实话:千古艰难惟一死。 ? 人为什么怕死,无非就是没有死过而已。如果想一个人没事一天就死个十回八回的,那么有何可怕?这就是[详细]
-
Miller_Rabin · 大数
所属栏目:[大数据] 日期:2020-12-14 热度:182
51nod 1186 质数检测?V2 http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1186 给出一个很大的数字N,2=N=10^30。判断他是不是素数。 分析:数字很大,使用java的BigInteger解决。 在这个过程中犯了许多低级错误。哎,我的java基础[详细]
-
利用apriori算法进行关联规则挖掘
所属栏目:[大数据] 日期:2020-12-14 热度:175
在关联规则挖掘中,最经典的算法就是apriori算法。下面结合实例介绍下该算法 该算法主要分为两步,第一是进行频繁项集的挖掘,第二部是利用频繁项集进行关联规则挖掘[详细]
-
挖掘算法&模型
所属栏目:[大数据] 日期:2020-12-14 热度:135
数据挖掘资料,点击底部" 阅读原文 ",手慢无 原文:一只鸟的天空 (http://blog.csdn.net/heyongluoyao8) ? ? ? ? ? 在进行数据挖掘时,首先要进行商业理解,即我们需要达到什么目的,解决什么问题;其次需要进行数据理解,我们需要哪些数据以及需要什么样的[详细]
-
干货 :让高管了解大数据分析[完整版]
所属栏目:[大数据] 日期:2020-12-14 热度:72
过去三十年,许多公司增设新的管理层以应对变幻莫测的商业环境。上世纪80年代中期,对于多数公司而言,首席财务官还是个陌生的职位。然而,伴随着价值管理以及企业与投资人关系日趋透明,越来越多的公司有了首席财务官。随着品牌建设与客户管理对公司的重要性与日[详细]
-
这才是真正的对用户有帮助的大数据分析!!
所属栏目:[大数据] 日期:2020-12-14 热度:116
点击标题下「广州传智播客」快速关注 让你看看什么大数据分析: 这才是真正的对用户有帮助的大数据分析!! 话说你这个数据是怎么分析出来的?是用王八蛋的头部想出来的吗? 解决屌丝的生存问题、生理问题、生产问题、工作问题、婚姻问题等等,才是一个好的[详细]
-
蓝桥杯 - 区间k大数查询
所属栏目:[大数据] 日期:2020-12-14 热度:56
算法训练 区间k大数查询 时间限制:1.0s ????内存限制:256.0MB 问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整数m,表[详细]
-
从 LinkedIn 的数据处理机制学习数据架构
所属栏目:[大数据] 日期:2020-12-14 热度:103
(点击 上方公号 ,可快速关注) 英文:Vitalflux 译者:伯乐在线-塔塔 网址: http://blog.jobbole.com/69344/ LinkedIn是当今最流行的专业社交网站之一,本文描述了LinkedIn是如何管理数据的。如你对文中的观点有异议亦或文中有遗漏的部分请随时告诉我。 Lin[详细]
-
大数模板
所属栏目:[大数据] 日期:2020-12-14 热度:144
acm竞赛版 #includeiostream#includestring#includeiomanip#includealgorithmusing namespace std;#define MAXN 9999#define MAXSIZE 10#define DLEN 4class BigNum{private: int a[500]; //可以控制大数的位数 int len; //大数长度public: BigNum() { len =[详细]
-
神马是商业智能(BI)?
所属栏目:[大数据] 日期:2020-12-14 热度:115
商业智能(Business Intelligence,简称BI)的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、联机分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。 BI在学术界基[详细]
-
【案例分析】地产集团公司BI项目建设方案
所属栏目:[大数据] 日期:2020-12-14 热度:69
一、项目建设背景 经过持续推进,ERP系统、OA协同办公系统、财务软件等系统都充分发挥出了各个系统应有的功能,优化了公司的业务流程,但是随着公司业务越来越壮大,对内部管理要求也越来越高,在上述系统的应用中暴露出一些问题。 从宏观角度来看,这些问题[详细]
-
【案例分析】地产集团公司BI项目建设方案
所属栏目:[大数据] 日期:2020-12-14 热度:178
一、项目建设背景 经过持续推进,ERP系统、OA协同办公系统、财务软件等系统都充分发挥出了各个系统应有的功能,优化了公司的业务流程,但是随着公司业务越来越壮大,对内部管理要求也越来越高,在上述系统的应用中暴露出一些问题。 从宏观角度来看,这些问题[详细]
-
POJ 2536 大数取模运算
所属栏目:[大数据] 日期:2020-12-14 热度:167
The Embarrassed Cryptographer Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 13356 Accepted: 3630 Description The young and very promising cryptographer Odd Even has implemented the security module of a large system with thousa[详细]
-
麦肯锡报告:让高管了解大数据分析
所属栏目:[大数据] 日期:2020-12-14 热度:66
原标题:Mobilizing your C-suite for big-data analytics 过去三十年,许多公司增设新的管理层以应对变幻莫测的商业环境。上世纪80年代中期,对于多数公司而言,首席财务官还是个陌生的职位。然而,伴随着价值管理以及企业与投资人关系日趋透明,越来越多的[详细]
-
某公司基于FineBI数据决策平台的试运行分析报告
所属栏目:[大数据] 日期:2020-12-14 热度:190
一、数据平台的软硬件环境 二、组织机构和权限体系 组织机构:平台中已集成一套组织机构,可以建立部门、人员。也可以与现有系统的组织机构集成,将组织机构导入到平台中。 功能权限:通过配置功能点URL的方式实现各个用户相应的BI访问权限。用户第一次访问[详细]
-
视音频数据处理入门:RGB、YUV像素数据处理
所属栏目:[大数据] 日期:2020-12-14 热度:158
有段时间没有写博客了,这两天写起博客来竟然感觉有些兴奋,仿佛找回了原来的感觉。前一阵子在梳理以前文章的时候,发现自己虽然总结了各种视音频应用程序,却还缺少一个适合无视音频背景人员学习的“最基[详细]
-
浅谈CRM系统之客户数据分析
所属栏目:[大数据] 日期:2020-12-14 热度:136
最近好长一段时间没有回来csdn更新博客了,近来一直在搞CRM业务。零售、制造、医药、汽车这几个行业的CRM多多少少做了一些,算是刚刚推门进入一只脚。 今天就来初步聊聊企业内的CRM系统数据分析: 在企业和经销商搭建CRM系统,到最后需要根据数据分析结果,[详细]
-
智能称体脂称实现(代码与基本数据处理篇)
所属栏目:[大数据] 日期:2020-12-14 热度:191
(本文均出于个人理解而写,仅用于学习和交流,某些过程可能不一定正确,希望各位提出意见进行交流,共同进步) AFE4300的配置是比较简单的,从配置到处理基本的数据,主要有3个方面:SPI配置,AFE4300配置,基本的数据处理。(由于当时板子没做成一块,用ST[详细]