大数据_站长网

内衣大数据分析：透过女生内衣的需求变化，看年轻人的情趣生活

所属栏目：[大数据] 日期：2020-12-14 热度：112

报道大数据企业：大数据产品、大数据方案、 ? 大数据人物分享大数据干货：大数据书籍、大数据报告、大数据视频本文系大数据人精选自网络。欢迎更多优质原创文章投稿给大数据人：admin@bigdata.ren 小编微信：data985 End. 版权声明：由“大数据人”[详细]
大数阶乘

所属栏目：[大数据] 日期：2020-12-14 热度：149

题目描述输入一个正整数 n ，输出 n !的值。其中 n !=1*2*3*…* n 。算法描述 n !可能很大，而计算机能表示的整数范围有限，需要使用高精度计算的方法。使用一个数组 A 来表示一个大整数 a ， A [0]表示 a 的个位， A [1]表示 a 的十位，依次类推。将 a[详细]
[bigdata-041] python3+re 正则表达式手机号微信号qq号

所属栏目：[大数据] 日期：2020-12-14 热度：166

import reREGEX_PHONE = re.compile(r'1d{10}',re.IGNORECASE)REGEX_QQ = re.compile(r'[1-9]d{4,10}',re.IGNORECASE)REGEX_WX1 = re.compile(u'微信[w,-]{1,20}'.encode('utf8'),re.IGNORECASE)#正则手机号码def get_all_phone_num(s1): global REGEX_PH[详细]
[bigdata-041] python3+re 正则表达式手机号微信号qq号

所属栏目：[大数据] 日期：2020-12-14 热度：66

import reREGEX_PHONE = re.compile(r'1d{10}',re.IGNORECASE)REGEX_QQ = re.compile(r'[1-9]d{4,10}',re.IGNORECASE)REGEX_WX1 = re.compile(u'微信[w,-]{1,20}'.encode('utf8'),re.IGNORECASE)#正则手机号码def get_all_phone_num(s1): global REGEX_PH[详细]
数据挖掘：手把手教你做文本挖掘

所属栏目：[大数据] 日期：2020-12-14 热度：80

1 文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识，它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类，前者是有监督的挖掘算法，后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1）读取数据库或本地外部文本文[详细]
蓝桥杯-区间k大数查询

所属栏目：[大数据] 日期：2020-12-14 热度：96

从题目上看，用int类型数据就够了，没必要考虑long这些~~ 在题目中，直接用了Collection工具类中的sort方法，是从小到大排序，据了解，Java自带的排序算法应该是优化过的快速排序，算法可靠。 package 区间k大数查询 ; import java .util .ArrayList ; impor[详细]
数据挖掘中的模式发现（五）挖掘多样频繁模式

所属栏目：[大数据] 日期：2020-12-14 热度：187

挖掘多层次的关联规则(Mining Multi-Level Associations) 定义项经常形成层次。如图所示那么我们可以根据项的细化分类得到更多有趣的模式，发现更多细节的特性。 Level-reduced min-support 使用的是Level-reduced min-support方法来设置最低支持度，即，[详细]
关于评论话题挖掘的研究及其实现代码（一）LDA

所属栏目：[大数据] 日期：2020-12-14 热度：173

引言在 2016年中，我们参加了一个由厦门信研院举办的大数据比赛。当时，我们拿到的题目为影迷关注点分析。数据是来自于微博与豆瓣的影迷评论数据，其数据量达600多万条评论数据，分别对应于2000多部不同的电影。我们的想法是将影迷关注点分析尽量往评论话题[详细]
数据挖掘中的模式发现（六）挖掘序列模式

所属栏目：[大数据] 日期：2020-12-14 热度：132

序列模式挖掘序列模式挖掘(sequence pattern mining)是数据挖掘的内容之一，指挖掘相对时间或其他模式出现频率高的模式，典型的应用还是限于离散型的序列。。其涉及在数据示例之间找到统计上相关的模式，其中数据值以序列被递送。通常假设这些值是离散的，[详细]
关于评论话题挖掘的研究及其实现代码（二）词图切分

所属栏目：[大数据] 日期：2020-12-14 热度：91

引言在上一篇的博客谈到使用LDA的方法挖掘影迷关注点可谓是无功而返。后来我思考了许久，决定将原来的向量空间模型转变为词语网（WordNet），然后通过社区检测算法来把网络划分不同的社区，从而确定为不同的话题。社区检测算法现实世界中的许多系统都可以[详细]
《MySQL必知必会》学习笔记五(数据处理函数)------掌握部分

所属栏目：[大数据] 日期：2020-12-14 热度：152

MySQL必知必会知识预览第一章——了解SQL 第二章——MySQL简介第三章——使用MySQL 第四章——检索数据第五章——排序检索数据第六章——过滤数据第七章——数据过滤第八章——用通配符进行过滤第九章——用正则表达式进行搜索第十章——创建计算字[详细]
数据挖掘 : 手把手教你做文本挖掘

所属栏目：[大数据] 日期：2020-12-14 热度：191

文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识，它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类，前者是有监督的挖掘算法，后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1）读取数据库或本地外部文本文件[详细]
基于大数据分析的安全管理平台技术研究及应用

所属栏目：[大数据] 日期：2020-12-14 热度：152

转自：http://www.36dsj.com/archives/30027 基于大数据分析的安全管理平台技术研究及应用基于大数据分析的安全管理平台技术研究及应用 Research and Application of Big Data Analysis Based Security Management Platform Last Modified By yepeng @ 2014[详细]
BI解决方案资料收集

所属栏目：[大数据] 日期：2020-12-14 热度：86

ETL工具：Kettle（官网，Pentaho公司开源）、?Informatica、Datastage、OWB、微软DTS、Beeload、久其ETL，Oracle GoldenGate等等……开源的工具（16款开源工具，OSchina ETL工具列表），有eclipse的ETL插件: cloveretl 工作流引擎：jBPM，Activiti，H3 BPM,?[详细]
文本挖掘：手把手教你分析携程网评论数据

所属栏目：[大数据] 日期：2020-12-14 热度：144

文本分析的应用越来越广泛，这不，我的工作也开始涉及了文本分析，今天就讲讲关于评论数据的那点事。首先评论数据如何获取？一般通过网络爬虫的方式抓取各大网站的评论数据，本次分析数据就来源于携程网某酒店的评论，在同事的协助下，成功爬取该酒店的[详细]
R中文舆情包cnSentimentR

所属栏目：[大数据] 日期：2020-12-14 热度：173

该包使用jiebaR分词,svm[e1071]进行分类; 包括三个函数:cnsr.prepare,cnsr.train,cnsr.predict 目前还在开发中,功能不完整. 请见: https://github.com/leeshuheng/cnSentimentR[详细]
工作坊 | 大数据智能分析和挖掘在互联网中的应用实战案例

所属栏目：[大数据] 日期：2020-12-14 热度：107

大数据分析和挖掘在互联网公司中已经得到实质性的推进和应用，典型的应用场景包括搜索引擎的搜索结果和搜索广告排序、电商网站的商品推荐和虚假信息检测、电子邮件服务中垃圾邮件检测、互联网安全公司的病毒和木马检测、视频和新闻分享网站中视频和新闻推荐[详细]
亚马逊前首席科学家:大数据价值体现在AI、BI、CI、DI

所属栏目：[大数据] 日期：2020-12-14 热度：74

「技术领导者」的订阅首选本文转载自灯塔大数据无人机送货、阿法狗下棋、小冰和你谈场恋爱……人工智能领域的成果，一直是企业在大数据运用能力上的主要外在体现，但在亚马逊原首席科学家安德雷斯·韦思岸(Andreas Weigend)看来，大数据能为企业做的，还[详细]
bzoj 1670: [Usaco2006 Oct]Building the Moat护城河的挖掘（凸

所属栏目：[大数据] 日期：2020-12-14 热度：186

1670: [Usaco2006 Oct]Building the Moat护城河的挖掘 Time Limit:? 3 Sec?? Memory Limit:? 64 MB Submit:? 524?? Solved:? 384 [ Submit][ Status][ Discuss] Description 为了防止口渴的食蚁兽进入他的农场，Farmer John决定在他的农场周围挖一条护城河。[详细]
《Speed-BI云平台-基于Excel数据源的技巧应用：区域销售收入分析

所属栏目：[大数据] 日期：2020-12-14 热度：157

对于刚接触speed-BI的朋友们，一些看似很简单很琐碎的动作，当没有小窍门和智能化的操作就会使得工作量变大，时间耗起来真要命。本次课就将围绕speed-BI常用的功能进行串讲，还有特别的小技巧一并教授，成为speed-BI的技巧王！ ? 课程应用：本次课程以销售[详细]
[bigdata-042]从头搭建 spring+mvc+boot+tomcat

所属栏目：[大数据] 日期：2020-12-14 热度：194

1. 需求 1.1 在spring.io下载一个spring mvc的demo，能运行成功。 1.2 按照自己的理解，重写这个例子，并做适当修改，运行成功。 1.3 将这个例子打包成war包，放到tomcat运行成功。 2. 在spring.ip下载spring mvc并运行 2.1 spring的例子在 http://spring.io[详细]
[bigdata-042]从头搭建 spring+mvc+boot+tomcat

所属栏目：[大数据] 日期：2020-12-14 热度：65

1. 需求 1.1 在spring.io下载一个spring mvc的demo，能运行成功。 1.2 按照自己的理解，重写这个例子，并做适当修改，运行成功。 1.3 将这个例子打包成war包，放到tomcat运行成功。 2. 在spring.ip下载spring mvc并运行 2.1 spring的例子在 http://spring.io[详细]
[bigdata-043] tomcat的一些资料和文档试用（未整理）

所属栏目：[大数据] 日期：2020-12-14 热度：176

1. tomcat的官网在这里 http://tomcat.apache.org/whichversion.html 2. tomcat的版本跟jdk相关。jdk1.8已经广泛使用，选择tomcat 9优先。 3. 下载tomcat 9 3.1 首先要阅读文档 https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-9/v9.0.0.M17/REA[详细]
[bigdata-043] tomcat的一些资料和文档试用（未整理）

所属栏目：[大数据] 日期：2020-12-14 热度：182

1. tomcat的官网在这里 http://tomcat.apache.org/whichversion.html 2. tomcat的版本跟jdk相关。jdk1.8已经广泛使用，选择tomcat 9优先。 3. 下载tomcat 9 3.1 首先要阅读文档 https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-9/v9.0.0.M17/REA[详细]
[bigdata-044] CDH的官方文档部分翻译（未整理且未完成）

所属栏目：[大数据] 日期：2020-12-14 热度：65

1. cloudera官网 http://www.cloudera.com/ 2. cloudera文档 http://www.cloudera.com/documentation.html 3. 文档分为三个部分 ? 3.1 cloudera enterprise: cdh,cloudera manger,search,impala,spark。 ? 3.2 cloudera director: 安装指南，配置，以及使用c[详细]

63967

首页

2556