统计算法_数值/线性关系度量
继续统计算法,这次也没什么特别的,还没到那么深入,也是比较基础的1、方差-样本2、协方差(标准差)-样本3、变异系数4、相关系数 依然是先造个list,这次把这个功能写个函数,方便以后调用,另外上一篇写过的函数这次也会继承def create_rand_list(min_num,max_num,count_list):? case_list = []? while len(case_list) < count_list:??? rand_float = random.uniform(min_num,max_num)??? if rand_float in case_list:????? continue??? case_list.append(rand_float)? case_list = [round(case,2) for case in case_list]? return case_list 下面是历史函数sum_fun() #len_fun() #multiply_fun() #sum_mean_fun() #sum_mean_rate() #median_fun() #modes_fun() #ext_minus_fun() #geom_mean_fun() #geom_mean_rate() #新函数代码 <span style="color: #008000">#<span style="color: #008000"> 先生成一个随机list,已有函数,不赘述 rand_list = [15.79,6.83,12.83,22.32,17.92,6.29,10.19,10.13,24.23,25.56<span style="color: #000000">] <span style="color: #008000">#<span style="color: #008000"> 1、方差-样本S^2,list中的每个元素减整个list的平均数的平方累加,结果比个数-1,方差总量不-1 <span style="color: #008000">#<span style="color: #008000"> 2、协方差(标准差)-样本S,这个简单,用方差开平方就可以了 <span style="color: #008000">#<span style="color: #008000"> 3、变异系数CV,变异程度度量,协方差/算数平均数*100%<span style="color: #008000"> <span style="color: #008000"> 说明(百度百科):在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据可能不正常,应该剔除<span style="color: #0000ff">def<span style="color: #000000"> trans_coef_fun(rand_list): <span style="color: #008000">#<span style="color: #008000"> 4、相关系数-样本r,表示两个维之间的线性关系,-1 < r < 1,越接近1关系维间的关系越强<span style="color: #008000"> <span style="color: #008000"> 因为是两个维,因此需要输入两维的list,算法比较麻烦<span style="color: #800000">'''<span style="color: #800000"> (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |