引言 概率统计漫谈
当今社会,是一个数据时代,人类与世界交流,数据是唯一的语言,小到工厂管理,大到科学研究,无不需要数据给我们指明前进的方向.数据能够帮助我们认识世界,做出决策和预测.概率统计作为数据分析的通用语言,成为数据时代预测未来的根基,也成为现代素养的一部分.
这样的结果应该是赌徒梅累当年没有预料到的.梅累当年向数学家帕斯卡求教,仅仅是为了解决赌局中赌资的分配问题,谁知道可怕的数学家们前仆后继把这个问题研究成了一种强大的工具,工程、经济、金融等各个领域随处可见它的身影.只要存在随机现象的地方就离不了概率统计.
历史上,早期的概率和统计几乎无太多关联,沿着各自的轨迹发展.赌徒之问引发了概率的研究,人口、兵力、文化水平等社会问题导致了统计的产生.回答赌徒之问的帕斯卡、费马、惠更斯被誉为概率论的创始人,开启用数学方法描述社会现象先河的政治经济学之父威廉·配第被马克思称为统计学创始人.帕斯卡、费马完整地解决了“分赌注问题”,并建立了概率论的一个基本概念——数学期望.拉普拉斯利用高等数学知识将古典概率向近代概率推进,他明确了概率的古典定义,引入了更有力的数学分析工具,并证明了“棣莫弗—拉普拉斯定理”,这是最早的中心极限定理.“如果我们能把一切事件永恒地观察下去,则我们终将发现:世间的一切事物都受到因果律的支配,而我们也注定会在种种极其纷纭杂乱的事象中认识到某种必然.”写下这段话的伯努利发现了“大数定律”的极限定理,从而推动了概率统计的融合,被誉为概率论的奠基人.在帕斯卡、费马、惠更斯、拉普拉斯、泊松、高斯、柯尔莫哥洛夫、麦克斯韦、玻尔兹曼、吉布斯等一代又一代数学家继续努力下,概率统计由解决一个个问题逐渐发展为一门学科,成为联系宏观与微观的桥梁、确定性与不确定性的中介.现在,概率统计已经成为动力学、系统论、协同学等众多学科的重要组成部分,成为心理学等社会科学研究中的重要方法.
概率统计作为研究随机现象规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法.实际上,概率和统计是这种工具的不同侧面,虽然它们之间有交融的部分.概率是概率论的简称,一般研究随机事件发生的可能性大小、统计独立性和更深层次上的规律性.统计,这里指的是数理统计,一般研究如何有效地收集、整理和分析受随机因素影响的数据,并对所考虑的问题做出推断或预测,为采取某种决策和行动提供依据或建议.统计推断以概率知识为基础,通过局部或部分推断整体.概率为统计学的发展提供了理论基础.
从方法论上讲,统计是推理,概率是归纳.通俗来讲,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率.而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少(参数估计)?能不能认为红球40%,白球60%(假设检验)?概率论中的许多定理与结论,如大数定律、中心极限定理等保证了统计推断的合理性.做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数.概率统计不仅是科学研究中具有重要意义的理论,也是一种具有普遍意义的思想方法.大家在学习的时候,要真正理解各个公式背后的现实生活意义,能够用概率统计的方法解决一些实际问题.