加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

“变异”统计和数据分析之源

发布时间:2020-12-14 02:07:16 所属栏目:大数据 来源:网络整理
导读:统计学的渊源是什么呢?所有统计学的发展,或者说统计学之所以存在,只有一个原因,那就是变异以及变异所导致的抽样误差。没有变异,没有抽样误差,就没有统计学存在的理由。想象一下,如果全世界所有人的身高都是 1.70 米,那还有必要进行抽样做统计推断吗

统计学的渊源是什么呢?所有统计学的发展,或者说统计学之所以存在,只有一个原因,那就是变异以及变异所导致的抽样误差。没有变异,没有抽样误差,就没有统计学存在的理由。想象一下,如果全世界所有人的身高都是1.70米,那还有必要进行抽样做统计推断吗?只要随便量一个人的身高,就知道了全世界人的身高。那统计学还有存在的必要吗?

造物主在创造这个世界的时候,没有把每类事物都按照一个模子去套用,这样给予我们做统计和数据分析的机会。

所以说,变异和抽样误差是统计学的渊源,我们一定要先搞清楚这一点,然后才能开始学习统计学


那么到底什么是变异呢?变异(variation)也就是不同,通俗来说也就是不一样,可能有的人觉得不一样这个字眼太俗气,所以起了个文雅的词叫变异。我们的身高都不一样,这就是变异;我们的血压不一样,这也是变异;我们吃了同一种感冒药,我1天就好了,你7天才好,这也是变异。总之,世界上没有完全相同的两片叶子,更不用说两个人,即使双胞胎,也不是完全一样的。所以变异是到处存在的。、

可能有人说了,既然每个人都不一样,那还研究什么?尽管变异存在,但我们依然能够在变异之中找到一定的规律,这也正是统计学的目的和作用。比如,尽管我们体质都不一样,但不管怎么样,服了药之后可能都治好了某种疾病;而没有服药的人可能大多数人都没有治好,这就是规律。或者说,尽管每个人体格有异,但多数吸烟的人肺都有一定问题,这也是规律。所以我们要在小变异中发现大规律,这也是统计学存在的目的 既然统计学是要阐明某种规律,那就要证明这种规律是放之五湖四海皆准的规律,只在一小部分人中存在的规律不一定是真的规律,有可能是偶然。就像某些大师声称自己治好了多少例疑难杂症,然后说自己的疗法包治百病。结果一查,一共只治好了3例。只在这例中有效,这不是规律,这是瞎猫撞上死老鼠,这是偶然 那怎么证明这种规律是真正的规律呢?起码有一点,那就是一定要在大量人群中都存在这种规律,最好是全世界人都有这种规律。然而这听起来就难以实现,怎么可能把全世界人都调查一遍呢,即使是一个县都很难全部调查。所以统计学家就想了一个办法,调查部分人群,然后用统计学的方法根据这部分人的结果来推广到全县、全国、甚至全世界。这就是抽样调查 我们已经说了,每个人都是不一样的,比如全县有30万人,我只调查了万人,这万人肯定跟其余的29万是不一样的,那我怎么就能说明这万人的结果能推广到万人呢?这就需要一定的抽样和调查技巧,所以统计学发展出了很多抽样方法,如随机抽样。通过这些好的抽样方法,可以尽量保证这万人与万人特征差不多。比如可能这万人中男女比例是1.2,那这万人也按这个比例选择。等等 当然,不管如何抽样,总会存在抽样误差。举个例子,这一次你用随机方法抽取了万人,能够计算一个数值,比如糖尿病发病率。假设你重新抽取万人,仍然用随机方法,那第二次抽取的万人肯定跟第一次不一样(万个随机数不可能完全一样),那么计算的糖尿病发病率肯定也不一样。如果你再抽取第次、第4次、……,每一次抽取的万人都不一样,每一次计算的发病率也都不一样。这种不一样就是抽样误差。如果每次抽样样本的发病率差别都很小,就表明抽取的样本较为稳定,代表性比较好,也就是抽样误差小。如果各次抽样样本的发病率差别很大,则表明抽取的样本不稳定,代表性较差,也就是抽样误差大

如何估计抽样误差?我们已经说过,可以用多次抽样的结果之间的差别大小来估计抽样误差,但实际中我们不可能真的做这么多次的重复抽样,否则你的老板要疯掉了。医学统计学中,抽样误差一般用标准误来估计。标准误这一名词在很多统计方法中都会碰到,如t检验、线性回归、logistic回归等各种回归。如果标准误较小,说明抽样误差小,样本代表性较好,结果较为可靠。但如果标准误较大,说明抽样误差大,提示样本代表性不强,这种情况下一般需要加大样本量,否则结果不可靠 这么多年来,这么多统计学家拼了命地研究新方法是为了干什么呢?就是为了减少那么一点点的抽样误差,让结果变得更可靠。所以我们说不同数据用不同的方法,条件不一样时用不一样的方法,是为了干什么呢?就是为了减少标准误,让结果更可靠 最后一句话结尾:统计学起源于变异,发展于变异,结束于变异,整个统计学发展都是围绕变异


(来源:金融投资智库







跨国名师开讲:建立系统的量化数理分析思维能力


深入理解金融市场----(数据科学下的视角)
统计、概率分析回顾以及金融分析中的应用
金融中的统计和量化的编程实践
禅修课: 生命故事里数字的灵性之美——曼陀罗思维法
金融中的统计和计量
经济学中时序分析方法
初识衍生工具及对冲策略
算法交易实践

1月16、17日,北京

咨询报名手机/微信:13061694649

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读