加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据挖掘-噪声数据处理

发布时间:2020-12-14 04:14:12 所属栏目:大数据 来源:网络整理
导读:数据挖掘中对噪声数据的处理主要有 1、分箱法 通过考察数据的周围值来光滑有序数据的值。 例子: 假定箱子大小:3 4,8,15 用均值进行光滑: 9,9,9 用边界光滑(用距离最近的值替换原值): 4,4,15 2、回归 用一个函数拟合数据来光滑数据。主要有线性拟合和多

数据挖掘中对噪声数据的处理主要有

1、分箱法

通过考察数据的周围值来光滑有序数据的值。

例子:

假定箱子大小:3

4,8,15

用均值进行光滑:

9,9,9

用边界光滑(用距离最近的值替换原值):

4,4,15

2、回归

用一个函数拟合数据来光滑数据。主要有线性拟合和多远线性拟合等。

拟合:形象的说,就是用一个曲线将平面上的点连接起来。

拟合以及插值还有逼近是数值分析的三大基础工具,通俗意义上它们的区别在于:拟合是已知点列,从整体上靠近它们,插值是已知点列并且完全经过点列;逼近是已知曲线,或者点列,通过逼近使得构造的函数无限靠近它们。(引自百度百科http://baike.baidu.com/view/1148275.htm)

3、聚类

通过聚类将类似的值组织成群或者簇,可以直观检测离群点。

?

摘自:《数据挖掘-概念与技术》

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读