场景一:
金秋九月,苹果刚刚上市,你是个“苹果控”,傍晚你来到家附近的一家水果超市,在苹果摊前刚好有切好的试吃样品,你尝了一片苹果,口感清甜,你决定买一些,你自己从中挑了几个形状端正、色泽鲜亮、没有外伤的苹果,随后到结算口付款。
你刚刚通过一个总体(水果超市里的所有苹果)中的小样本(苹果试吃样品)进行了推断(这家水果超市的苹果好吃),进而做出了一个决定。
回到家后,你发现:
1)你买回家的苹果吃起来和在超市品尝的样本一样,满意!--推断正确。当然也可能你没挑到的那些很难吃(一类错误or二类错误?)。
2)你买回家的苹果不如在超市品尝的样品好吃,感觉自己被骗了,不开心!--错误推断,样本不是总体的一个代表性样本。当然也可能试吃的样品是特意挑选的,不能代表那一摊水果。
场景二:
周末,你到超市采购下一周的生活用品,到了结帐口的时候,你发现虽然有10多个结帐台,但是每个结帐台的旁边都有人排队,你扫了一眼所有的结帐台,思考了10秒后,决定在第7个结帐台排队,
你可能都没有意识到,你刚刚在脑海里瞬间就建立了一个统计模型:
只是对于你而言,这个模型的建立和使用是在瞬间完成的,即你内化的思考方式。结果是:
1)第7结帐台比你预期的要慢很多,因为在第7结帐台排队的人中有不少上了年纪的人,找钱和兑钱的时间比较长(你漏掉了一个重要的解释变量);
2)第7结帐台比你预期的要快很多,因为在前面排队的人中有2个人中途走了(随机因素,误差项);
3)第7结帐台和你预期的差不多(你的模型预测力不错);
几乎人人都经历过类似的购物经历,不可否认的是,在这个过程中,你已经使用了各种统计知识,并做出了统计推断,而你却全然不自知。在这个“量遍天下”的时代,人人都是数据分析师,天天都在做判断和决定(其实就是统计推断),但是这里的数据分析和统计推断尚停留在朴素、日常的阶段,如果真正想利用统计知识和技术进行科学研究和决策,还需要把这种朴素的统计思维上升到科学的统计思维层面。要实现这个“质的飞跃”就必须要深究统计知识的细节,“细节是魔*”同样适用于统计学习。要想真真正正地运用统计知识提高自己的生活质量,优化自己的工作和决策,只能实实在在地吃透统计知识,没有任何捷径!取巧只是自欺欺人。
为什么你年年学统计,却年年还在学?
我们发现身边有这么一类人,他们每年暑假都在学统计方法,参加各种暑期班,什么回归分析、类别数据、结构方程模型、多元统计分析等等。学完了之后非常兴奋,觉得收获满满。可是过了一段时间,就发现那些模型怎么又看不懂了,那些结果怎么又不会解释了。明明上课的时候全部都明白的。本来能看懂的量化文章,怎么也看不懂了,这里怎么多出来一个残差项,这个系数是什么意思,这个检验为什么是t检验而不是其他。只要条件稍微有一点变化,那个模型就变了样子,如果没有完全搞懂模型背后的原理,只靠死记硬背适用条件,注定是不会真的理解。这样的统计学学习,记住的只是死的知识,没有get到统计技术,也谈不上理解统计知识背后蕴含的统计思维,更无法将其内化为自己的一种思考模式。
打个比方说,在方法班学习的统计方法,好比是在驾校学开车,全部都是在标准环境下学习的。而真实的路况远比驾校里的路况复杂,真实的统计数据也远比暑期班提供的数据更为复杂。这就是为什么刚刚从驾校毕业的人一般都无法上路开车,而学完暑期班统计方法的人,也无法去分析一个真实数据。要摆脱这种困境,唯有“以不变应万变”,不变的是统计原理,不断变化的是统计技术和统计模型。
还有一种声音经常出现:我们文科生学习统计学,只要秉持用户视角就好了,我们把统计学当工具,只需要记住在什么情况下使用什么方法就好,我们学会开车不一定要懂得造车原理。应该说,我很认同这句话,但也持有一些保留意见。当我们靠死记硬背去记住模型的适用条件时,其实我们并没有真的搞懂。所谓的用户视角实际上是一种无奈的选择,对于一看到公式就条件反射式感到头疼的人来说,用户视角确实是能够抓住的最后一根统计学学习的救命稻草。
难道对非统计学专业的人来说,只能用学语文的方式来学统计吗?真的不能理解统计学背后的原理吗?真的无法习得统计思维吗?而统计难学的结论又从何而来?这种难学的观念会不会只是你的一种主观建构呢?
搞懂统计学背后的原理真的有那么难吗?究竟是谁告诉你有那么难?这不禁让人想到了中学的英语学习,当我们问英语老师“为什么这两个词连用?”,得到的回答一般就是“固定用法”,对固定用法没有任何解释,而固定用法这个回答,是很多人在中学阶段英语学习时听到最多的答案,是令人无法反驳的、来自老师的最权威解释。学统计也是一样,为什么计算置信区间的公式是:(统计量±抽样误差)==(标准分±?个标准差)这个标准分是总体的参数?还是样本的统计量?还是抽样分布的统计量?这里的标准差是总体的标准差?还是样本的标准差?还是抽样分布的标准差?(好吧,也许你从来都没有想过这个问题。)为什么抽样分布服从正态分布?如果你只满足于记住公式就好,这是固定用法,那统计学不好、掌握不了的原因就有了:这种简单粗暴的学习方式注定是无法学好统计的。
为什么在看一本统计书的时候感觉看懂了,合上书就感觉脑子一团浆糊,令人抓狂的是永远都不知道怎么把书中的统计知识应用到实际生活中,更要命的是过了一段时间再看这本书的时候就跟看一本新书一样?
要学好统计既要了解概念,更要深究细节。细节是魔*同样适用于统计学习。只要看过统计学的人对“均值”和“标准差”就都应该不陌生,毕竟这两个概念是在描述统计阶段就要讲的,而且计算方法也很简单,只要具备小学数学知识的人就能够计算出一个变量的均值和标准差,可是会计算、能算出来就说明你真正学会了这个概念吗?你能严谨地说明算术平均数、加权平均数和期望值的联系和区别吗?标准差和标准误之间又是什么关系呢?你真的理解均值和标准差背后蕴含的统计思想和统计原理了吗?有位统计学家说“标准差是统计学最重要的工具”,是言过其实还是却是如此吗?是不是在你的印象中,标准差太简单了(计算过程很简单),怎么会是统计学最重要的工具呢?
除了上述原因,难住大家的应该还有数学基础知识吧?虽然目前市面上出现了很多类似“白话统计”“极简统计”这样的书籍,这些书里一般都没有数学符号和数学公式,也能出传达统计学思维方式的本质。但这些毕竟都是入门级的书,用白话来描述统计公式固然有意义,但如果因为不擅长数学符号而回避数理统计学内容就太可惜了。大家如果有兴趣,可以再看看自己曾经看过的统计课本,有多少是包含了公式推导过程的?(貌似绝大部分书都没有,一般只提供一个最终公式)如果碰巧你看的书里有推导过程,你真的、真的看不懂吗?大部分的公式推导过程用到的都只是初中、高中的数学知识,对大部分人来说这理应不是一个难点和障碍。而大家一定要明白:只有学好数学,只要学好数学,就可以参考各种统计学的书籍自主学习啦。
除了刚刚谈到的,我们还总结了很多人学不好统计的其他原因(详见下图),大家可以对号入座。
我们想做一个大胆的实验,你敢不敢一起来?
上述种种困难、困惑和疑问也一直困扰着咱们这次的主讲老师,作为一名文科生,对这些痛苦的学习体验她也感同身受。最近几年她一直在思考“到底是什么妨碍了文科生学统计?到底怎么能让文科生真正学会、学好统计”?她深刻感受到,统计学思维或者叫做数据思维是人类在自然进化过程中自然而然发展出来的一种思考方式和解决问题的路径,更是当代人都应该具备的底层思维方式,而不仅仅限于学术领域。因为我们已经无可逃避地身处大数据时代了,如何辨别真伪,如何做出决策,都需要数据思维的支持,每个人、每个人的生活、每个人的工作都在被量化,善于使用数据的人正在用数据帮助自己设计、优化和迭代自己的人生。如果你抓住生活的机遇,想成为一个具备理性思维的人,学习统计学能在极大程度上帮你建立理性思维的框架,提高分析问题与处理问题的能力。
经过多年的学习、思考、反思与探索,她摸索出一点头绪、开发出了一些方法,于是在年暑假,为了进一步验证她的想法,她从人大几个文科专业(新闻、哲学、公管、社会学等)招募了一些小伙伴,用这套讲课方式连续讲了9天(计划是10天,最后实在精力不济,因为大家讨论得实在是太充分,而她每天都要根据大家的学习情况来修改完善第二天的内容,真的是筋疲力尽),事实证明,这些零基础或有一些基础的小伙伴都学得很好。很多人惊呼,原来统计学还可以这样学!
虽然是小试牛刀,但她对自己以往在数据中心教授小伙伴统计学和给学生上课的过程、对国内外几十本专著的研读和琢磨、对思维导图法的教学方式的深入研习,都在这个夏天慢慢串联到一起,形成了自己的统计学授课方法论。她想用全新的授课方式来讲统计,让小白完全理解统计学、爱上统计学、最终做到对统计学的“知其然并知其所以然”。她希望通过她的努力,能够帮助你理解统计学以及统计方法背后的核心思想,熟悉统计术语,知道如何评估统计结果,学会正确使用统计工具,帮助你在面对很多可能的时候作出合适的决策。在教学方式上,她会用思维导图的方式来授课,增加课前和课后的水平测试,并最终让你自己画出具有自我风格的统计学知识图谱(思维导图)。
这是部分课件:
其实统计学的知识是环环相扣的,统计书的内容安排上都大同小异尤其是基本的统计学思维,比方说概率思维,以及重要的基础概念,比方说均值、标准差、总体分布、样本分布、抽样分布、标准正态分布、假设检验等,这些就像建设统计学知识体系的地基,必须彻底搞懂。否则你的统计学学习,永远处于似懂非懂、混沌不清的状态。如果让你现在画出一张关于统计的思维导图,大概很多人都画不出来吧。
我们想用上述方式给带领大家来一次统计学学习探索,你敢不敢来挑战?
是时候打碎你头脑中的统计学学不好的固有观念了!
是时候用全新的方式来学习统计学并建立清晰的思维框架了!
是时候参与一场伟大的统计学教学实验了!
年国庆节,我们准备了5天的课程,希望你能和我们一起,来见证自己在统计学学习过程中的蜕变!
课程收费:
5天的课程,费用一共是元。我们可以一起来算一笔账,目前国内高校的统计课一般是2-3个学分,也就是1.5-2.25个小时,一个学期一般有16次课,合起来大概的上课时间在24-36个小时左右。本次实验班每天6小时上课时间,同时至少有2个小时的课后练习时间,至少有40个小时,相当于上了一个完整学期的统计课,这样算下来每个小时平均不到元。
如果通过这5天你锻炼出来统计思维这块肌肉,那我相信这个付出是值得的。她愿意用10年的数据调查与管理经验+6年的给小白讲统计学的探索+几十本国内外统计学著作的加持+模拟实验+创新的思维导图教学方式,给你一个全新的、从未体验过的统计学学习体验和效果,让你的大脑真正锻炼出“统计思维”这块肌肉,最终让你以前的知识积累和这次学习的新知识融会贯通,绘制出属于自己的统计知识图谱,从此以后自己就可以参考各种统计学书籍自主学习了。
为了保证学习效果,只招收40人。我们还会配备两名助教,这两名助教就是曾经以小白身份和我一起学习过统计学的小伙伴。
我们的课程将覆盖以下内容:
课前测验
专题一:查看数据的基本特征(很多人都觉得很简单的内容,但却是推断的基础)
专题二:概率与分布(很多人在学习的时候不知道其用途所在,只限于记住一些名词术语,但却是推断的原理)
专题三:统计推断的原理(很多人都是套公式学习的地方)
专题四:统计应用(很多人学习统计的最终目标)
课后测验
三个月后测验
再次重申一下本次实验班的主旨与目标:统计思维与数据意识。
统计知识还是那些统计知识,不同的是讲授方式和理解方式:
用提问的方式回答你的问题;(用问题不断逼近真实答案,这样提出问题本身就已经是答案了)
用学生讲课的方式来精准定位学习盲点;(只有你能用逻辑的思路把你脑海中的知识连贯地讲出来,才说明这些知识已经内化成你的一部分了)
通过计算推导强化理解;(常用公式的推导过程必须拿下,而且你有能力拿下,一辈子只需推导一次)
用模拟实验来击破顽固知识点;
连续5天燃烧大脑,统计学习一气呵成。(在大学里每周只上1次课,一学期上40个学时,在这个实验班,一周上5天课,上满40个学时。对体力和精力的要求很高哦。)
当你把这四个专题里的每个知识点都一一击破后,你会惊喜地发现很多公式再也不用死记硬背了,它就印在你的脑海中了,你突然一下子就能看懂回归的结果和表格了,从此以后再也不怕阅读学术类定量文章。这就好比你想写一手好的英文文章,在单词不够(统计知识点)和语法(统计原理)不扎实的时候,怎么也写不出来,当你掌握了足够多的单词并且将英语语法内化为母语用法时,写出一篇还不错的文章就是水到渠成的事了。
课程效果,可以从刚刚结束的校内实验班来看,
这是实验班小伙伴画的统计学思维导图,从一张张漂亮的思维导图来看,他们已将统计学思维内化为自己思维体系的一部分,这正是我们课程的目的。
如果你是统计学小白,从未接触过统计学;
如果你曾经反反复复学过统计学,却依然感觉一知半解,无法融会贯通;
如果你想建立统计学思维,改善工作和思维效果;
如果你属于年年学统计,却年年还在学;
如果你正在复习统计学,打算应付各种考试;
如果你想通过建立统计学思维来改善工作和思考;
那么,欢迎你来。
我们准备好了,期待和你开启不平凡的学习之旅,让我们一起在统计这片茂密而神奇的森林中探索。
要不要先瞄一眼老师准备的课后小练习呐?
1.行为经济学中一个非常著名的关于基础率的例子:
就在刚才,一群来历不明的僵尸袭击了某个有0人的村庄,这些受害者被袭击后要过一段时间才能表现出明显的僵尸症状,而科学家刚刚开发了一种检测僵尸病*测试,确保有99%的准确率,假设到目前为止僵尸袭击的人数较少,只有1%的人被咬过,如果我们成功地把这个村庄所有的人都隔离起来,对其进行僵尸病测试,那么有多少测试出阳性的人真的被僵尸咬过呢?
如果把被僵尸咬过,换成是得了某种严重的疾病,比如癌症,那么在0个人中,测试出生阳性的人中又有多少是真的病了呢?
2.假设有一天你想吃云南菜,随便找一家店,好吃的概率有多大?你咨询朋友后,找到好吃的云南菜馆的概率又是多少?
3.如何正确解释95%的置信区间?(肯定不是:这个区间有95%的概率包含总体真值)
4.总体分布的横、纵坐标是什么?样本分布的横、纵坐标是什么?抽样分布的横、纵坐标是什么?概率分布的横、纵坐标是什么?标准正态分布的横、纵坐标是什么?
5.区间估计时1-95%=0.05,和假设检验时设定的p=0.05,这两个0.05是什么关系?
6.为什么总体的方差是除以N,样本的方差是除以n-1,而抽样分布的方差是除以n?
7.为什么大样本用z检验,小样本用t检验?
8.类别变量的均值和标准差是多少?
9.为什么原假设H0都是假设无关呢?
。。。。。还有很多哦
这个国庆假期,给自己一个彻底搞懂统计学的机会吧!本年度仅此一次,错过便错过。
一一
训练营信息地点:北京(详细地点另行通知)
时间:年10月2日-6日(10月1日报到)
招生人数:40人(为了保证学习效果,只招收40人,并配备两名助教)
报名费:元/人(食宿及交通费用自理)
二
咨询及报名方式1、请于9月25日前将回执发送至会务组邮箱,会务组邮箱:xueshuxuezhang
qq.