你有没有遇到过这样的困惑?
——想做大创、小创、科研基金,但许多数据分析方法还没学、没人教。
——对一些社会现象很感兴趣,脑子里想法很多,但不知如何用数据作为自己的证据和支持。
——层出不穷的数据分析方法,不知道先学哪个?有什么用?去哪里学?有没有什么地方可以一键get啊?
——线上线下的数据分析课程看着挺美好的,但学费对学生*超级不友好,囊中羞涩。
如果你确实遇到过这些问题,那“定量数据分析方法及其应用”荣誉研究辅修学位项目就是你最好的选择。
我们的优势是:
学得多——多种难度、多内容、多情景的各类数据分析方法一网打尽。
低门槛——我们不讲公式推导,重在怎么做和怎么用,各种专业都可以学。
有意思——结合托幼、养老、流动人口、劳动力等各类社会热点问题全面铺开课程学以致用,学方法不再枯燥单调。
不要钱——课程完全免费!免费!免费!与社会上的数据分析班相比,一下子省下好几个亿!!!
而且,我们的项目已经成功运行两年啦!一起来听听项目老学员的评价吧!
年招生学员
学员1:非常有帮助!本专业并没有太多的数据分析相关的课程,因此项目帮助特别大~
学员2:相比第一年的学习,这一年对各类课程能有更强的把握了,可以确实感到自身在定量方法学习和使用上的进步。定量数据分析方法作为实用的研究方法,是各学科学习过程、实证研究过程中重要的方法工具箱的组成部分。同时,实践项目的开展促使我们将方法与实践相结合,能得出不错的探索成果。学无止境,相信每一位参与成员都能在突破中带着收获的快乐。
学员3:强烈给科研实践环节的老师们打call!从讨论选题都最终定题,从描述统计到回归分析,论文写作的各个环节老师们都给予我们十分详细的指导。特别怀念课程的全班交流环节,宛如真正地召开学术研讨会,每位同学展示、老师和同学们依次提问或者点评……非常喜欢这种热烈交流、共同进步的感觉!!!
学员4:通过本学年的课程学习,我进一步掌握了统计学的基本原理和常用统计软件的基本使用,同时在项目做中学的理念指引下我的动手能力也有了一定了提升。我作为一名人文学科的学生能够在项目中能够受到数据分析的训练实在是大开眼界、受益匪浅。
学员5:今年是进入定量荣誉辅修项目的第二年了,它带给我的收获比当初“机遇巧合”下加入时想象的要多。其中最大的收获是数据分析能力的提高,荣辅项目让我在大二下就提前接触了stata等软件,还学习分层模型等比较高级的统计方法。另外,荣辅也让我遇到和结识了很多厉害的大佬,荣辅的课基本上都是在努力跟上各大佬的步伐。最后说一点,荣辅的小班教学很nice,老师和学生,以及同学之间的交流都很紧密,课程氛围也很轻松活泼(当然课还是很硬核的)。总体来说,定量荣辅还是很不错滴!安利安利~
年招生学员
学员1:虽然有的课程真的很难,学起来也挺头秃,但感觉收获很大,对自己的专业也很有帮助。课堂上干货满满,老师很耐心认真。总之参加就是赚到。
学员2:收获超级大!社会统计学讲得比较基础,很容易上手,但是前面简单部分花的时间太长了,希望可以稍微讲难一点吧~数据分析案例特别有用,对各种数据都能基础认识,布置的作业也很合理,一边了解数据一边还能学会统计软件,真是一举两得!
学员3:参与项目一年,我最大的收获就是视野,人文社科不分家,作为新闻学院的学生,课堂上讲授的许多社会现象及其背后的原理、做社会调查的方法与本专业的课程形成了很好的补充,我始终认为,拥有社会学思维对我们理解世界是必要的,当然也是十分有趣的!此外,项目课程负责的老师也都是社人的权威教授们,老师们非常nice,真正有志于做社会研究的同学绝对能从他们身上学到很多;还要提及的一点是,本项目重实践,偏应用,也要学习许多工具性的分析软件等等,在这方面此前没有基础的话课外还是要多花一些心思的;当然了,项目总体体验还是非常不错的,值得一试~
学员4:通过在本项目一学期的学习收获很大,老师们教授的不仅是数据处理的方案和知识,还十分注重结合社会学的相关背景,从各个学科背景的角度去解析数据,案例非常生动。
学员5:通过该课程,锻炼了我统计分析应用能力,同时增加了对一些典型数据库的了解。课程实用性强,内容丰富多样,尤其是论文讲解部分,增进了我对研究思路与论文写作规范的了解。
学员6:让我对统计与数据分析方法有了一定了解,老师们也非常棒!!这对我做大小创以及论文阅读有很大帮助,总之还是很有收获的,很幸运选上这门辅修。
如果看到这里你很感兴趣,就听小编一本正经地讲下去吧。
“定量数据分析方法及其应用”
荣誉研究辅修学位项目
★项目介绍★
数据革命的到来,深刻而又全面地影响了传统学科知识结构体系以及社会对人才的定义与需求。成为既具有科学研究思维又具有社会人文关怀、既精通定量数据分析方法又善于应用方法解决现实问题的复合型人才,是适应不断变化的社会需求的重要途径。本荣誉辅修学位立足于当前“大数据”的时代背景、迎合国际公共*策领域“循证决策”的热门实践,致力于培养新时代发展所需的兼具人文社科素养和数据分析能力的跨学科人才。
在这样的培养目标下,我们将着力培养学生人文社会科学和自然科学的通识基础,实施社会调查研究的能力,定量数据分析的技术,以及执行公共*策与商业金融分析的基本技能。
一、项目资源
本荣誉辅修学位项目所依托的中国人民大学人口与发展中心具有突出的学科优势与丰富的教学、科研资源,为该荣誉学位的实施提供了夯实的基础。
首先,本中心具有非常典型的多学科交叉属性。项目团队由10名教授、12名副教授以及3名讲师构成,从人员的专业背景构成上看,多样性、多元化非常突出,涉及人口学、经济学、统计学、社会学、老年学、社会医学、管理学等。这样就为跨学科、跨专业整体融合教学提供了便利。
其次,大部分团队成员主要从事着基于循证原则的学术研究,同时具有丰富的决策咨询经验,能很好满足对学生理论、技术与实践的多重培养需求。
最后,本中心作为教育部人文社科重点研究基地,多年获评优秀基地,基地的资料中心拥有丰富的包括老年、生育、迁移、经济、健康、管理等各类数据资源和图书资源,这些资源都将向该项目的成员及学员开放,能为学生提供多元的科研实践和项目应用的机会。
二、项目特色
在对学生的培养过程中,我们将突出以下的培养模式和特色:
第一,立足于学以致用和创造力提升的人才培养理念,在课程设计上,强调实践过程。将学生带入到具体的科研项目中,以实际问题为导向,引导学生在“做中学(learning-by-doing)”,实现“所学即所用”,培养整合各种智识资源创造性解决问题的能力。
第二,在课程设置中夯实知识基础和优化知识结构。通过必修的基础课、选修的方法课以及研究实践课三个模块的构成方式,对学生知识体系进行优化重组。
第三,促进自主探究和实践应用的教学制度体系。本项目入选本科生将被要求参与到教师科研项目。学生有机会与资深教授、知名学者进行密切合作。同时拟计划直接向本科生开放一些科研项目和必要的研究资助,资助他们以团队形式开展学术研究。
第四,倡导研讨交流的教学组织形式。本项目将尝试引进专业导向性的研讨班课程制度,小班研讨能够为师生提供自由交流的条件,在研讨教学中学生的主体性可以得到充分的尊重和发挥,创新思维能够得到锻炼和提高。
★培养体系与课程简介★
总学分为30分。完成学分修读要求者,可授予由学校自主颁发的荣誉研究辅修学位证明。
一、必修课(6学分)
必修课为本项目要求学生必须掌握的基础理论与方法相关的内容,是后续选修本项目能力提升课程与完成实践教学课程的基础与前提。
1.社会研究方法,2学分
(课程主要介绍社会科学的研究方法及其规范,包括社会研究的基本概念、基本原理和基本方式。课程内容将涵盖研究的理论基础,研究设计,实际研究的操作化、概念化、测量以及各种观察和分析方法。)
2.社会统计学,2学分
(课程主要介绍统计与数据、数据类型、特点与数据库;数据的特征与数据分布、可视化工具;统计显著性与统计检验;特定类型的研究问题与特定的统计类型;变量间关系与预测分析。)
3.数据分析应用案例,2学分
(课程主要讲授从数据到结论的分析方法,通过对大量案例的讨论与讲解,使学生掌握如何对一手资料和二手资料进行分析,以最大化地开发数据资料,发挥数据的作用,通过对数据加以详细研究和概括总结,提取有用信息并形成报告。其间涉及的科学逻辑和学术规范是定量数据分析的基本逻辑、规范和原则,不因统计方法和统计软件的不同而异。具体内容包括:数据分析方法论、数据分析方法体系、常见数据分析模型及各自作用、数据理解与数据准备、模型应用与分析报告、案例讨论、各类统计陷阱(包括过度解读、忽略变量偏误、区群谬误与简化论等)。
二、选修课(8学分)
选修课包括数据收集方法、数据分析方法和计算机语言与统计软件应用三个类别。其中,数据收集方法应修不少于2学分,数据分析方法应修不少于4学分,计算机语言与统计软件应用应修不少于2学分
第I类:数据收集方法(不少于2学分)
1.抽样技术与应用,2学分
(课程系统讲授抽样方法,从简单随机抽样入手,介绍抽样的统计学原理,深入介绍几大抽样方法,包括系统抽样、分层抽样、整群抽样、多阶段抽样、PPS抽样、比率估计、二重抽样。)
2.调查问卷设计与评估,2学分
(课程以问卷设计为中心,重点介绍问卷的设计策略,包括问卷结构、问题设计方法、答案设计方法、敏感问题设计、问卷格式与排版、预调查,同时,也简要介绍最初的研究选题和研究设计,到操作过程中的抽样方案制定,最后到实地调查、收集数据和数据分析、撰写报告等,全面系统展示问卷调查的过程,以丰富的案例说明问卷调查操作过程中的技巧和经常遇到的问题,帮助学生掌握最基础的问卷调查方法,培养学生的社会实践能力。)
3.数据质量评估,2学分
(数据是*府科学决策、企业现代管理以及个人投资选择的重要参考依据。数据质量是定量研究和决策工作的生命。进入大数据时代以后,数据用户对数据的质量、产生过程、以及数据公开等的要求越来越高。统计数据质量是一个多维度体系,本课程在现实需求的基础上,吸收国内外已有的研究成果和教学资料,系统讲授数据质量的测定与评估方法。具体来讲,本课程分别从数据质量维度、调查过程以及人们认识规律等角度讲授数据质量的测度和评估相关框架、思路和方法。)
II类:数据分析方法(不少于4学分)
1.分类数据分析,2学分
(社会科学研究中,遇到的研究因变量往往是这样的:你是否被荣誉辅修项目录取?你觉得数据分析师是一个非常有前景、比较有前景、前景一般还是很没有前景的职业?大学毕业时你选择国内读研、国外读研还是直接工作?本学期你有几门课没有通过?统计学文献中将这些二分类取值、定序取值、多分类取值和有限个离散整数取值的变量统称为分类数据。面对分类数据,常规多元回归方法无法简单直接地挪用过来完成分析,而需要适用于分类数据的专门统计分析方法。结合Stata应用,本课程将系统介绍这类方法以丰富你的研究工具箱。这些方法具体包括:二分类logit模型、序次logit模型、多分类logit模型以及计数变量回归模型。课程坚持实用导向,仅要求有多元线性回归作为背景知识,努力将统计方法的技术细节降到最低,而更加注重对模型的理解以及Stata输出结果的解读。)
2.事件史分析,2学分
(事件史分析(EventHistoryAnalysis)是用于对风险期、存活或事件发生时间数据进行分析的一类专门统计技术。它也被称作生存分析或持续期分析,是社会、行为、医学和生命科学以及教育学、经济学、商学和市场营销学中近年来日益流行的一种定量数据分析方法。本课程拟介绍事件史分析的基本概念与主要方法。我们将讨论用于探索性和描述性分析的非参数方法,Cox回归模型、参数的回归模型以及针对离散时间的事件史分析技术。针对每一方法,都会介绍模型表达、数据结构、估计技术、模型设定、参数解释、假设检验以及模型诊断等内容。另外,也会涉及到时变变量(time-varyingcovariate)和时变效应(time-varyingeffect)、未观测到异质性、竞争风险模型等更复杂的话题。)
3.倾向值分析,2学分
(探索因果规律是科学研究的目的,自然科学通常使用随机化实验方式进行探索。但对于社会科学而言,由于研究对象的特殊性和社会伦理道德的限制,随机实验很难开展,所以通常使用观察研究所采集到的数据进行分析,而观察研究数据几乎总是隐含着选择偏差的问题,本课程主要介绍对这类问题的处理。本课程将在学习Neman-Rubin反事实研究框架和Heckman的因果分析科学模型这两个理论框架的指导下,应用Stata和R软件,系统介绍样本选择模型、干预效益模型、倾向值贪婪匹配法、倾向值优化匹配法、倾向值分层法、倾向值权重分析、匹配估算法、以内核为基础的匹配法、剂量分析法和敏感度分析法等一系列倾向值分析方法,并以社会科学研究为实例,展示这些模型在研究中的应用和操作。)
4.分层模型及软件实现,2学分
(人们总是在特定的自然或社会环境下生活,这使得经济、社会、人口、健康、教育乃至管理研究领域中的数据资料天然具有嵌套属性,比如,学生嵌套于班级、居民嵌套于社区、患者嵌套于社区、职员嵌套于企业,所以,个人除具有自身的独特属性之外,还带有生活环境所赋予的共同属性,两方面都会对人们的观念、态度和行为产生影响。因此,社会科学研究者日益强调要将微观与宏观层次数据结合起来探究人们经济、社会、人口乃至健康行为的机制。为此,分层模型应运而生,并日益为研究者所推崇。鉴于其实际应用价值,本课程将介绍与分层模型的设计与分析有关的基本知识,包括考虑两个或更多个层次的分层模型、分层模型在增长曲线建模中的应用,以及适用于因变量的取值表现为二分类、多分类、定序分类与计数取值的分层模型,其中会涉及到模型表述、数据结构、估计技术、模型设定、参数解释、假设检验及模型诊断等内容。此外,鉴于分层模型与多元线性回归模型之间密切的内在联系,作为基础,本课程将首先从回顾多元线性回归的基本原理讲起。)
5.面板数据统计分析,2学分
(本课程主要介绍面板数据的分析方法及软件实现。分析方法包括重复测量多元方差分析、多层线性模型、潜变量增长模型等,并讲授相应方法通过SPSS、STATA或Mplus的实现过程。)
6.空间分析方法,2学分
(空间分析方法旨在构建、采集、存储、管理和分析空间数据,是大数据挖掘的重要基础方法之一。结合ARCGIS软件,课程主要讲授:空间数据可视化、创建地图、编辑地理数据、空间查询与空间分析、空间数据库构建、矢量数据空间分析、栅格数据的空间分析、空间格局分析、空间影响因素分析等内容。通过典型案例分析练习,学生将学会使用常见的分析工具分析空间数据,并掌握对矢量数据和栅格数据的空间分析技术及基本的空间统计技术知识和技术等。)
III类:计算机语言与统计软件应用(不少于2学分)
1.数据分析及软件应用(SPSS),2学分
(本课程主要介绍SPSS统计分析软件的应用,内容主要包括SPSS的环境介绍、数据资料管理、统计描述与统计图表、不同类型变量的常用假设检验、相关分析与回归分析等内容。)
2.数据分析及软件应用(Stata),2学分
(本课程将侧重以案例的形式介绍、讲解Stata的数据整理、列表描述、绘图、不同类型的回归、编程语句等内容,帮助同学们掌握对定量数据进行实证分析的技能。)
3.卫生统计学(SAS软件应用),2学分
(本课程主要介绍SAS统计分析软件的应用,内容主要包括SAS系统和SAS语言、SAS实用过程及描述统计分析、多因素分析过程。)
4.结构方程建模与Mplus,2学分
(本课程主要介绍结构方程模型分析方法及软件实现,包括结构方程理论、Mplus软件操作、因素分析模型、路径分析、多层结构方程模型、结构方程模型的高级应用及论文撰写。)
5.机器学习与R语言应用,2学分
(本课程将主要介绍机器学习的基本原理和R语言在机器学习中的应用,课程的目的是帮助学生从整体上了解机器学习的特点,监督学习和非监督学习的主要方法,能够应用R软件进行人口和社会经济数据进行分析。课程的内容包括:R软件的使用方法,最优化原理,线性回归、逻辑回归、判别分析、朴素贝叶斯、惩罚回归、k近邻法、决策树、装袋法和随机森林、提升法、支持向量机、神经网络等方法内容。)
6.数据科学与社会研究(R和Python),2学分
(本课程将主要介绍大数据的特征以及初步分析技术,包括大数据的基本概念、发展过程和应用方法。课程内容将涵盖以下一些大数据分析技术:数据获取与爬虫技术,数据挖掘与机器学习,社会网络分析,统计语言模型与文本分析等。)
三、研究实践教学(10学分)
这部分课程由学生加入本中心研究人员的项目团队来完成,全过程参与,涵盖项目的选题、论证、实施到结项,以“做中学(learning–by-doing)”的方式,强调问题导向,综合运用所学知识,完成与所参加项目有关的问题。具体的课程设置为:
1.数据分析应用实践(一),5学分
2.数据分析应用实践(二),5学分
实践教学的目标是综合训练学生收集、整理和分析数据以解决人口、经济、社会领域中具体问题的能力,内容包含但不限于以下方向:
方向一:人口数据分析
本部分实践教学由将团队成员当前正进行的人口相关课题向本项目学生开放,感兴趣的学生申请参与,承担课题推进中的具体角色。参与人口统计数据及生育、死亡、迁移等相关的抽样调查数据的收集、整理与分析工作,团队老师予以指导。
方向二:经济数据分析
本部分实践教学将团队成员当前正进行的人口、资源与环境经济学相关课题向本项目学生开放,感兴趣的学生申请参与。参与经济统计数据、与家庭或个体经济行为有关的抽样调查数据的收集、整理与分析工作,承担具体的科研任务,团队老师予以指导。
方向三:卫生健康数据分析
本部分实践教学将团队成员当前正进行的与健康相关课题向本项目学生开放,感兴趣的学生申请参与。参与卫生统计数据、与健康与就医行为有关的抽样调查数据的收集、整理与分析工作,承担具体的科研任务,团队老师予以指导。
方向四:社会数据分析
本部分实践教学结合团队成员当前开展的课题研究,利用中国综合社会调查、中国家庭动态跟踪调查等社会调查数据,训练学生以社会调查数据开展相关研究的能力。
方向五:老龄数据分析
本部分实践教学将团队成员当前正进行的与老年相关的课题向本项目学生开放,感兴趣的学生申请参与。参与老龄化相关统计数据、Class与Charls等有关老年人群的抽样调查数据的收集、整理与分析工作,承担具体的科研任务,团队老师予以指导。
方向六:空间数据分析
本部分实践教学将团队成员当前正进行的有关课题向本项目学生开放,感兴趣的学生申请参与。参与完成空间数据的收集、整理与分析,承担课题研究中的具体任务,团队老师予以指导。
四、毕业论文(6学分)
四年级学年撰写一篇毕业论文,计6学分。结合研究实践教学课程,完成论文的设计与写作,培养学生发现问题、解决问题的能力。
★培养环节★
项目在暑期对一年级(秋季学期二年级)的学生进行选拔,本项目每期拟选拔不超过25名学生。采用申请-面试选拔方式,拟申请学生前一年的所有课程必须通过,且平均学分绩理工学科应达到3.2以上,其他学科应达到3.4以上,英语成绩良好。
学期安排方面,与主修专业一样,秋季学期和春季学期分别为19周,包括课堂教学17周,考试2周。学程规划方面:本项目要求学生必修6学分,选修8学分,研究实践教学10学分,具体学程安排见下表。四年级的春季学期撰写毕业论文。
学生的常规课程中,如果已完成与本荣誉辅修学位的必修课、选修课存在相同或非常相似的课程,可以向本项目申请相同课程的免修直考,通过这门课的考核后,学生直接获得学分。
★学程安排★
★团队成员简介★
项目负责人:
翟振武
人口学博士,教授,博士生导师。中国人民大学人口与发展研究中心主任(教育部人文社重点研究基地),兼任中国人口学会会长,国务院学位委员会社会学学科评议组成员,国家卫健委专家委员会委员。编著有《现代人口分析技术》、《城镇化发展中的经济与人口》、《从人口变迁看民生发展》等20余部著作和教材,发表多篇专业论文。讲授《抽样技术与社会调查方法》、《人口研究方法应用与误用》、《可持续发展》、《人口资源环境经济学主文献选读》等课程。
项目成员:
01
段成荣
人口学博士,教授,博士生导师,兼任中国人口学会副会长、北京市人口学会会长、国务院人口普查领导小组专家咨询组成员、国务院妇女儿童工作委员会办公室"国家儿童智库"专家。编著有《人口学教程》、《人口迁移研究原理与方法》、《常用人口统计公式手册》等教材,讲授《社会调查概论》、《社会调查研究方法》、《人口统计学》、《人口迁移研究原理与方法》、《人口学专业博士生研究指导课》等课程。多次担任世界银行、联合国人口基金、联合国儿童基金等机构的国际咨询专家,承担其有关社会性别、贫困、儿童发展、人口迁移流动、人口城市化等方面课题研究和咨询服务。目前重点