统计学原典读书笔记
All knowledge is, in final analysis, history.
All sciences are, in the abstract, mathematics.
All judgements are, in their rationale, statistics.
在终极的分析中,一切知识都是历史:我们现在拥有的知识都是对过去发现的事物的归纳总结以及衍生;
在抽象的意义下,一切科学都是数学:所有的知识都可以归纳为对数学的推理和运算;
在理性的基础上,所有的判断都源于统计学:所有的判断都是对过去的规律总结,也就是说,根据过往的数据简历概率模型,判断未来的趋势。
2. 统计正如我们的思维,客观至上,否则便是自欺欺人。反之我们的思维若是统计式的,便是极客观的。
3. 统计思维总有一天会像读写一样,成为一个有效率公民的必备能力。 ——H.G.Wells
4. 现代科学研究中统计学是最重要的工具之一,英国著名生物学家高尔顿曾说过:“统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,唯有统计学可以帮助他们打开一条通道。”运用科学研究结论辅助现实决策时,须具备良好的统计思维,才能对科学结论保持清晰认识,更准确地解读结论背后的科学真相。
5.从随机性中寻找规律性,是统计的基本思想,也是统计的魅力所在。
简单来说,统计学里所表达的两个核心理念就是:
允许误差下的概率保证;
允许误差下的统计推断。
6.大部分生活中最重要的疑问, 都只是概率的问题 ——Pierre-Simon Laplace
7.不明于数欲举大事,如舟之无楫而欲行于大海也。 ——管子
8.科学试验做完后再找统计学家分析数据,如同病人死了找医生进行尸体解剖,医生会告诉你病人死的原因。同样,统计学家会告诉你试验失败的原因。 ——Ronald Fisher
9.陈希孺先生在其《数理统计学简史》的序中说道:“统计学不止是一种方法或技术,还含有世界观的成分——它是看待世界上万事万物的一种方法。我们常讲某事从统计观点看如何如何,指的就是这个意思。但统计思想也有一个发展过程。因此统计思想(或观点)的养成,不单需要学习一些具体的知识,还有能够从发展的眼光,把这些知识连缀成一个有机的、清晰的途径,获得一种历史的厚重感。”
10.There are three kinds of lies: lies, damned lies, and statistics.
——Benjamin Disraeli
11.
12. The best thing about being a statistician is that you can play in everybody else's backyards. ——John Tukey
13. 英国统计学家George E. P. Box说:
“All models are wrong, but some are useful.”
所有模型都是错的,但其中有些是有用的
"Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful."
“记住,所有模型都是错误的;关键的问题是模型错到什么程度就没有用处了。”
所有模型都是错的这句话是对事实的陈述,而不是有争议的观点。
分析模型也是如此。它们都是真实事物的表示,或多或少经过简化。他们都或多或少地“错”了。那么,你怎么知道他们有多错呢?
大多数模型都具有不一样类型的拟合或误差的度量。根据所使用的建模的类型,可以有不同的拟合方式和误差。例如,在简单线性回归中,R平方或相关系数是衡量模型拟合质量的基本度量。它大致解释了模型可以解释多少数据的变化。但这只是衡量模型好坏的一种方法,我们将很多方法进行对比,以达到其预期目的的最佳模型。这是建模科学的艺术。
但其中有些是有用的。我们可以从度量标准和统计数据中构建一些“错误”的概念,但是如何开发“有用”的概念呢?“在这种情况下,错误本质上是一个分析概念,而有用的概念实际上是一个商业概念。如果它能帮助我做出更好的决策并降低风险,那么它就很有用。但最好的模型不一定是最有用的。
始终将George Box放在心上并向自己(或建模者)提出几个问题:
“它有多糟糕?”(即它足够强大吗?)
“我能用它做什么?”(即它有用吗?)
事实上,考虑到这一点,这可能适用于任何分析。