-
证券行业文本挖掘技术应用现状与探讨【案例】
所属栏目:[大数据] 日期:2020-12-14 热度:171
热门下 载 ?【下载】2015中国数据分析师行业峰会精彩PPT下载(共计21个文件) (点击标题即可) 文: 白雪,熊昊 转自: 上交所技术服务 白雪,熊昊, 上海证券交易所 研究中心,上海 200120 E-mail :xbai@sse.com.cn 摘 要: 证券行业的海量信息由结构化数[详细]
-
基于文本挖掘的量化投资应用
所属栏目:[大数据] 日期:2020-12-14 热度:184
1. 金融文本挖掘背景介绍 文本挖掘作为数据挖掘的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页中的论坛、微博、新闻等。文本挖掘是目前金融量化研究的一个非常热门的领域,其主要原因有以下三点: 关注对冲量化与金融工程行业的[详细]
-
大数据测试之初识Hadoop1
所属栏目:[大数据] 日期:2020-12-14 热度:135
大数据测试之初识Hadoop ? ? ? ?POPTEST老李认为测试开发工程师 是面向测试的开发,也就是说,写代码就是为完成测试任务服务的,写自动化测试(性能自动化,功能自动化,安全自动化,接口自动化等等)的case或者开发测试工具完成不同类型的测试。其实自动化[详细]
-
大数据测试之初识Hadoop2
所属栏目:[大数据] 日期:2020-12-14 热度:96
HDFS的关键元素: Block:将一个文件进行分块,通常是64M。 NameNode:保存整个文件系统的目录信息、文件信息及分块信息,这是由唯一一台主机专门保存,当然这台主机如果出错,NameNode就失效了。在Hadoop2.*开始支持activity-standy模式----如果主NameNode[详细]
-
MiniUI使用
所属栏目:[大数据] 日期:2020-12-14 热度:108
1 . MiniUI 页签定位 bodyinput?name?=?"bizType"?class="mini-hidden"?value="${bizType}"div?class="mini-fit"?style="margin-top:0px;"????div?id="tabs1"?class="mini-tabs"?activeIndex="0"?style="width:100%;height:100%;"?plain="false"????????s:i[详细]
-
DVWA系列之10 命令执行漏洞的挖掘与防御
所属栏目:[大数据] 日期:2020-12-14 热度:130
通用的命令执行漏洞防御方法通常是使用两个函数:EscapeShellCmd和EscapeShellArg,下面分别来分析这两个函数。 EscapeShellCmd()函数可以把一个字符串中所有可能瞒过Shell而去执行另外一个命令的字符转义,比如管道符(|)、分号(;)、重定向()、从文件[详细]
-
hdoj Find the maximum 4002 (欧拉函数&&大数打表)
所属栏目:[大数据] 日期:2020-12-14 热度:193
Find the maximum Time Limit: 2000/1000 MS (Java/Others)??? Memory Limit: 65768/65768 K (Java/Others) Total Submission(s): 1929??? Accepted Submission(s): 807 Problem Description Euler's Totient function,φ (n) [sometimes called the phi fun[详细]
-
中国工程院院士高文:多媒体大数据分析与搜索
所属栏目:[大数据] 日期:2020-12-14 热度:105
【CSDN现场报道】2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办, 以“数据安全、深度分析、行业应用”为主题的2015中国大数据技术大会 (Big Data Technol[详细]
-
大数据测试之Hadoop的基本概念
所属栏目:[大数据] 日期:2020-12-14 热度:180
大数据测试之Hadoop的基本概念 ? ? ?poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标,也是国内最早探索大数据测试培训的机构,开发了独有的课程体系。如果对课程感兴趣,请大家咨询qq:90[详细]
-
大数据测试之hadoop系统生态
所属栏目:[大数据] 日期:2020-12-14 热度:64
大数据测试之hadoop系统生态 MapReduce:分布式数据处理模型和执行环境、运行于大型商用机集群。 ZooKeeper:一个分布式、高可用的协调服务。ZooKeeper提供分布式锁之类的基本服务用于构建分布式应用。 HDFS:???分布式文件系统,运行于大型商用机集群。 Hadoop[详细]
-
老李分享:大数据测试之HDFS文件系统
所属栏目:[大数据] 日期:2020-12-14 热度:175
老李分享:大数据测试之HDFS文件系统 ? ???poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标。如果对课程感兴趣,请大家咨询qq:908821478,咨询电话010-84505200。POPTEST是国内最早在大数[详细]
-
hdoj Big Number 1212 (大数取余) 水
所属栏目:[大数据] 日期:2020-12-14 热度:141
Big Number Time Limit: 2000/1000 MS (Java/Others)??? Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 6532??? Accepted Submission(s): 4525 Problem Description As we know,Big Number is always troublesome. But it's really impor[详细]
-
基于R语言的文本挖掘——朴素贝叶斯分类器
所属栏目:[大数据] 日期:2020-12-14 热度:117
文本分类的核心是18世纪的条件概率理论在20世纪的广泛运用。条件概率就是在已知一个事件的发生的前提下,另一个事件发生的概率。不难想象,数据并不是总体或待建模系统的唯一可用的信息资源。贝叶斯方法提供了一套将这些外部信息融入数据分析过程的原理和方[详细]
-
永洪科技获 1 亿元 B 轮融资,帮零技术背景的业务人员实现大数据
所属栏目:[大数据] 日期:2020-12-14 热度:132
今日,永洪科技对外宣布,完成 1 亿元人民币的 B 轮融资,由东方富海领投,经纬中国、达泰、艾瑞咨询跟投。2015年1月,该公司完成五千万人民币 A+轮融资,资金来自经纬创投。 36 氪曾报道,永洪科技提供敏捷型大数据分析工具,可以实现 5 分钟一键安装、5[详细]
-
【报告】福布斯:2015大数据分析产业调研报告
所属栏目:[大数据] 日期:2020-12-14 热度:175
热门下 载 ?【下载】2015中国数据分析师行业峰会精彩PPT下载(共计21个文件) (点击标题即可) 转自:Teradata ▌专题 : 点击蓝色字即可 院士: 李国 杰【( PPT )( 全文 )】【 数据开放 】, 邬贺铨 , 倪光南【大数据时代 ( 上 )( 下 )】, 怀进[详细]
-
文本挖掘之特征选择(python 实现)
所属栏目:[大数据] 日期:2020-12-14 热度:153
http://www.cnblogs.com/wangbogong/p/3251132.html 机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度规约(Dimensionality reduction)则是一种被用于降低输入数据维数的方法。维度规约可以分为两类: 特征选择(feature selection),从原始的d维空[详细]
-
一个日志挖掘流系统
所属栏目:[大数据] 日期:2020-12-14 热度:104
? ? ? ? ? 在某厂工作中这个业务系统的复杂由于数据的庞大造成的。分为实时部分、批量挖掘部分。 ? ? ? ? ?由于批量挖掘系统利用hadoop的map reduce挖掘, 假设所有输入的数据位(DataA)一起合并到一个对外服务的分布式的key-value数据库(设为DataBase的A[详细]
-
lightoj--1214--Large Division(大数取余)
所属栏目:[大数据] 日期:2020-12-14 热度:79
Large Division Time Limit: 1000MS ? Memory Limit: 32768KB ? 64bit IO Format: %lld %llu Submit Status Description Given two integers, a and b ,you should check whether a is divisible by b or not. We know that an integer a is divisible by an[详细]
-
大数据实力解读:《伪装者》、《琅琊榜》、《他来了,请闭眼》
所属栏目:[大数据] 日期:2020-12-14 热度:187
从去年开始,一大批优质国产电视剧以井喷的姿态走入了大家的视野。平时刷惯了英剧美剧日剧韩剧TVB的小伙伴们,喜大普奔,奔走相告,安利起了国产剧。去年的《北平无战事》,《战长沙》,《红色》,《舞乐传奇》,再到今年的《伪装者》,《琅琊榜》……就算你[详细]
-
大数据测试之hadoop命令大全 1
所属栏目:[大数据] 日期:2020-12-14 热度:91
大数据测试之hadoop命令大全 1、列出所有Hadoop Shell支持的命令 ??$ bin/hadoop fs -help 2、显示关于某个命令的详细信息 ??$ bin/hadoop fs -help command-name 3、用户可使用以下命令在指定路径下查看历史日志汇总 ??$ bin/hadoop job -history output-di[详细]
-
大数据测试之hadoop命令大全 2
所属栏目:[大数据] 日期:2020-12-14 热度:190
31、获取或设置每个守护进程的日志级别(daemonlog)。 用法:hadoop daemonlog -getlevel host:port name 用法:hadoop daemonlog -setlevel host:port name level 命令选项 ???????????????????????????????????????描述 -getlevel host:port name ?????????[详细]
-
IBM Power全面推动认知时代大数据分析发展
所属栏目:[大数据] 日期:2020-12-14 热度:109
近日, IBM在2015中国大数据技术大会上分享了其在大数据分析领域的最新成果,阐述了面向大数据分析领域的IT基础架构的最新战略。 针对企业在认知时代面临的大数据分析工作负载,IBM坚信要以全新的IT基础架构作为支持。凭借产品和解决方案的持续革新, IBM致[详细]
-
DB、ETL、DW、OLAP、DM、BI关系结构图
所属栏目:[大数据] 日期:2020-12-14 热度:141
DB、ETL、DW、OLAP、DM、BI关系结构图 DB、ETL、DW、OLAP、DM、BI关系结构图 在此大概用口水话简单叙述一下他们几个概念: (1) DB/Database/数据库 ——这里一般指的就是OLTP数据库,在线事物数据库,用来支持生产的,比如超市的买卖系统。DB保留的是数据[详细]
-
精度计算-大数乘小数
所属栏目:[大数据] 日期:2020-12-14 热度:128
语法: mult(char?c[],char?t[],int?m); 参数: c[] : 被乘数,用字符串表示,位数不限 t[] : 结果,用字符串表示 m : 乘数,限定 10 以内 返回值: null 注意: ? ? 需要? string.h 源程序: ? #include stdio.h #include stdlib.h #include string .h v[详细]
-
精度计算-乘法(大数乘大数)
所属栏目:[大数据] 日期:2020-12-14 热度:77
语法: mult(char?a[],char?b[],char?s[]); 参数: a[] : 被乘数,用字符串表示,位数不限 b[] : 乘数,用字符串表示,位数不限 t[] : 结果,用字符串表示 返回值: null 注意: ? ? 空间复杂度为? o(n^2) ? 需要? string.h 源程序: ? ? #include iostre[详细]
