c – 计算一组数字的均值而忽略异常值
发布时间:2020-12-16 03:41:03 所属栏目:百科 来源:网络整理
导读:首先,这是一个数学问题,而不是编码问题,所以请耐心等待. 我试图找出一种算法来计算一组数字的均值.但是,我需要忽略任何与大多数结果不相近的数字.这是我想要做的一个例子: 假设我有一组类似于以下的数字: { 90,91,92,95,2,3,99,300,400 } 很明显,对于上面
首先,这是一个数学问题,而不是编码问题,所以请耐心等待.
我试图找出一种算法来计算一组数字的均值.但是,我需要忽略任何与大多数结果不相近的数字.这是我想要做的一个例子: 假设我有一组类似于以下的数字: { 90,91,92,95,2,3,99,300,400 } 很明显,对于上面的集合,大多数数字介于90和99之间,但是我有一些异常值,如{300,400,3}.我需要计算这些数字的平均值而忽略异常值.我确实记得在统计课上读过类似的东西,但我不记得它是什么或如何处理解决方案. 将不胜感激任何帮助.. 谢谢 解决方法
你能做的是:
>估算数据中异常值的百分比:约为提供数据集的25%(4/15), PS:构成数据集25%的异常值很多! PPS:对于第二步,我们假设异常值是“对称分布的”.请参见下图,我们使用4分位数和Q1和Q3的四分位数范围(IQR)的1.5倍: (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |