当前位置:灵感范文网 >

教学资源 >班主任工作总结 >

读书实践活动总结

读书实践活动总结

一、实践目的

读书实践活动总结

就我个人而言,觉得这本书语言风趣幽默,引人入胜。通过大量的例子和详实的数据证实来论证一门严谨的学科——或者说一个比较复杂的工具。这本书是对统计这个工具加深基本了解不可多得的好书。于是我选择在这个实践周读这本书。在这个数据为王的时代,人们可以不在乎微积分等算法步骤,但却应该重视统计工具,因为它在社会学、娱乐、体育、金融几乎所有涉及人类参与的领域都有着大量应用。

(一)素养提升

全书的重点主要是讲述统计工具是什么,怎么样去应用,有哪些常见的使用问题等等。就这样来看,有点像一本使用说明书,但它其实远不止一本说明书,首先概括来说它很有趣,其次由内深化讲述了统计的思想方法内核是量化,并理解数量及其之间的意义。统计学有着非常多且重要的功能,但究其根本,人类喜欢简化后的信息,我们总希望从杂乱的各种事情提炼出精简最简单的信息,用于指导我们的决策或者形成判断的依据,这些判断可能包括:这所学校如何?我们班怎么样?我们毕业后从事什么工作工资待遇最高?或者指导我们的决策:如手头上有笔钱,我该去买期货还是去买股票?造地铁对房价有直接的影响?等等。

1.心智训练

基于以上的原因,人类就发明了用数字来总结信息,仅凭一组数字,你就可以知道两个样本的好坏,两个选择的未来的收益的好坏去计算出当前最优的选择;描述统计学的存在意义就是简化,但不可避免的会丢失一些内容和细节;就像古人说的那样,尽信书不如无书;也像查理芒格说的那样,需要有多元的思维模型,仅靠着数据思考模型,定难乘风破浪。所以我感觉通过阅读这本书,让我整个人的心智以及思想都上升了不少。

2.工具运用

统计学可以让我们从大堆数据中找到可以代表群体的水平,同时也可以从少量数据中得出不可思议的结论。这个工具叫中心极限定理,其核心要义是一个大型样本的正确抽样与其代表的群体存在相似的关系。通俗的说,任意一个群体的样本平均值都会围绕在该群体平均值周围,并且呈正态分布。 举个例子,当你已经知道一个群体的描述性数据,假设某次参赛选手的平均体重是80KG,标准差为36,每辆大巴载64人;那么任意一台载着此次参赛运动员的大巴里的运动员平均体重有99.7%的可能性落在样本平均数的3个样本标准差之内,样本标准差= 36/8=4.5,故任意一台大巴的运动员平均体重99.7%的可能性80±13.5kg内;当然,如果想缩小平均数的范围,可以标准差放至1个标准差,准确率为68%;两个标准差为95%的准确率。

二、实践内容

(一)统数局限

统计数据的局限性表现为统计数据可能产生与初衷相悖的负面激励。统计指标越简单对事物的客观描述扭曲的越多。那就是相关关系并不等于因果关系。两个变量存在正相关或负相关的关系,这并不代表其中一个变量的改变是由另一个变量的变化引起的。比如,家里电视机数量多的学生往往比电视机数量少的学生学习成绩少,电视机数量和成绩成正相关,但显然不构成因果关系。之所以正相关,原因在于电视机数量多的家庭,经济实力更雄厚,能够更好辅导孩子功课。为能够承担的风险购买保险不是一个理智的决定。通过研究分析大量数据可以推测出一个人的消费习惯,预测犯罪活动等,得出一个人的行为特点,预测其行为。蒙提霍尔悖论好有意思,与人对概率的本能理解相悖。小概率事件也是有可能发生的,甚至是经常发生,原因是发生的次数太多了,比如中彩票的概率低,但买的人多,所以经常听见中大奖的消息。有喝菠菜汤习惯的人比没有这个习惯的人身体更健康。这个结论不能充分证明菠菜汤有利于健康,背后的原因可能是那些有喝菠菜汤的人往往具有健康意识,经常锻炼身体,有健康的饮食习惯等,而那些不喝菠菜汤并的没有这些健康的生活习惯。所以起作用的不是菠菜汤而是有这些意识的人。即相关性不能推导出因果性。到底是喝菠菜汤的功劳,还是因为这群爱喝菠菜汤的人恰好具备的其他行为或个人素质?分清楚“相关关系”和“因果关系”将有助于我们更好地理解统计结论。可以使用中心极限定理判断两个群体是不是同一类群体。

(二)数据在线

随着移动互联网的兴起,数据变得在线,我们逐渐走进大数据时代,一个前所未有的时代。在许多地方我们可以看到大数据展现的神奇魔力,也一再担忧大数据所带来的隐私问题。然而,有一点却被大家无意识地忽略或者根本没有注意到,在各种数据图流行的当今社会,我们每天都会看到媒体制作的信息图,很漂亮,也有不少的信息量,但是我们不知道这些数据是怎么来的,经过了怎么样的处理方法,我们得到的只是最后的结果,如此,数据也变成了一种快速消费品。举个例子,像麦当劳、肯德基等快餐店卖的汉堡,我们只是知道那是汉堡,可以吃,但是原料怎么来的制作过程是怎么样的,大部分人都不知道,知道的人也许就不那么喜欢汉堡了。现在说数据都习惯带个大字,数据受到如此重视也是在大数据兴起之后,一时之间数据驱动的呼声甚嚣尘上,好像谁都可以在大数据这个行当里露个脸,一如从前的互联网浪潮,有个电脑就可以建网站,有个点子就可以拉风投,在数据的时代自然是靠数据说话,谁掌握的数据越多,谁拓展的业务边界就越宽,谁的壁垒就越巩固。随着数据的积攒,深挖数据产生新业务的能力越强、数据支撑业务的力度也就越大,而这一切都成本反而会越低。并且新的业务又会反哺到数据,形成一个正循环,时髦的词叫数据闭环。在这个环里的,自然就会成为我的领地。逆趋势潮流行事的人,自然会死的很惨。数据的重要性越来越凸显,终有一日,数据会像以前的计算机那个走进千家万户,变得稀松平常,但是我觉得,数据会像吃的食物、饭菜那样渗透我们的生活,变得像空气一样变得无处不在,处处、时时影响着我们,只是现在我们还感觉不到。所幸,吃吃汉堡只会影响我们的身体,大不了变得胖胖的,说不定还能像大白那样萌萌哒,然而数据是信息的载体,它所传达的是一种知识或者说是思维,如果在生产数据的各个环节出了问题,甚至说有意为之,那么日子一长,就不知道我们的思想会变得怎么样。不干净的数据就感觉好像是街边小饭店做菜参了地沟油,大不了我们不吃了,回家自己做,自己做的总要安心许多。然而在这个网络世界,我们却没有生产数据的能力,哦不,应该是权力。是的,数据将会是一种权力。我们只能等待巨头们把数据生产出来,然后吃下去。

(三)“反实现”过程

创造实验组和对照组的最佳方法就是将研究对象随机分配到两个组里。随机性的好处就在于,与实验无关的变量一般会在两个小组里实现平均分配,既包括那些显而易见的特性如性别、种族、年龄和教育,也包括其他难以察觉但可以干扰实验结果的特性。对于任何一个项目评估来说,其目的都是为评价治疗或介入手段的效果提供某种“反现实”。在随机控制实验中,对照组就是“反现实”;但当对照实验不具有可行性或有违道德时,我们就需要寻求其他方式来模拟“反现实”。对这个世界的探索在很多时候就依赖于寻找“反现实”的聪明才智。

三、实践体会

全书从描述性统计学讲到了相关性、假设检验和回归分析。内容以身边简单例子为主,很少涉及生涩的统计学公式,风趣幽默通俗易懂,是一本很好的统计学入门读物。通过这本书你会发现原来统计学也可以这么简单有趣,并且认识到了数据的谎言,比如你的工资被平均了,这就是很大的数据谎言。我还更深刻的认识到了选择性偏见和幸存者偏差等数据偏见,数据让我们方便,方便到不用去思考我们想要什么信息就会推送过来。可是,当我们真正习惯了这些算法后,我们是不是只是他们算法中的一环,换句话说,我们还是我们吗?还是我们只是流量。这里值得我们去深思。

标签: 读书 实践
  • 文章版权属于文章作者所有,转载请注明 https://lgfww.com/jxzy/banzhuren/5w66qv.html
专题