加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c – 计算一组数字的均值而忽略异常值

发布时间:2020-12-16 03:41:03 所属栏目:百科 来源:网络整理
导读:首先,这是一个数学问题,而不是编码问题,所以请耐心等待. 我试图找出一种算法来计算一组数字的均值.但是,我需要忽略任何与大多数结果不相近的数字.这是我想要做的一个例子: 假设我有一组类似于以下的数字: { 90,91,92,95,2,3,99,300,400 } 很明显,对于上面
首先,这是一个数学问题,而不是编码问题,所以请耐心等待.
我试图找出一种算法来计算一组数字的均值.但是,我需要忽略任何与大多数结果不相近的数字.这是我想要做的一个例子:

假设我有一组类似于以下的数字:

{ 90,91,92,95,2,3,99,300,400 }

很明显,对于上面的集合,大多数数字介于90和99之间,但是我有一些异常值,如{300,400,3}.我需要计算这些数字的平均值而忽略异常值.我确实记得在统计课上读过类似的东西,但我不记得它是什么或如何处理解决方案.

将不胜感激任何帮助..

谢谢

解决方法

你能做的是:

>估算数据中异常值的百分比:约为提供数据集的25%(4/15),
>计算足够的分位数:数据集的8分位数,以排除异常值,
>估计第一个和最后一个分位数之间的平均值.

PS:构成数据集25%的异常值很多!

PPS:对于第二步,我们假设异常值是“对称分布的”.请参见下图,我们使用4分位数和Q1和Q3的四分位数范围(IQR)的1.5倍:

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读