世界上存在许多依靠人的直觉无法判断真伪的问题,这是“统计学”应运而生的基础,统计学也是现代科学的基本工具。进行数据统计分析时,许多科学家看到 P 值为0.01,就会马上意识到这个含义为“结果出现错误的几率为 1%”。这种我们习以为常的认识到底从什么时候开始的?这种判断是否真的可靠?今天的《自然》发表一篇新闻观察,同时杂志配发一篇社论,主要就是讨论许多人对科学统计方法的误解问题。 把 P 值作为正确与否的判断标准可能是错误的,这是因为大部分学者并不真正理解这种日常使用的概念,或者说许多人滥用了这个概念。借助这样一个错误的方法,试图挽救一些貌似合理的虚假科学假说。
根据今日《自然》新闻观察文章的解释, P 值并不仅仅是描述显著性程度的符号,它的真正含义是一种判断作为处理产生结果的证据属于错误的可能性,或者说某一结果属于假证据的可能性大小。注意这里效果本身并不是考察的主要对象。你或者已经知道这些知识。
就好像道路上充满不守规矩的司机,但没有人承认自己不守规矩,低劣的统计学在科学领域也是一个众所周知的事实,但大家都觉得是别人的问题。
解决问题的第一步是熟悉这个问题。《自然》建议每个学者都要认真阅读这个新闻观察,文章对关于 P 值的一些普遍问题进行了总结。
如何克服这些统计学问题是相对必将困难的,因为需要找到解决问题的方法。太多的学者具备的统计学知识不完整甚至是过时的,这是比 P 值滥用更大的问题。例如投稿给《自然》的手稿最常见的基本错误就是不理解统计学差异、技术性重复和独立实验的区别。对那些没有掌握好按照统计学要求进行实验设计等统计学基础知识的人来说,统计学实在是一门苦涩难懂的科目。
使用统计学需要有认真的态度,许多人在错误的时间使用统计学,把统计学作为一种研究总结的工具。实际上,统计学应该贯穿于整个研究过程,尤其是早期课题设计阶段具有更重要的意义。实验室负责人和课题组长都必须具备良好的统计学素养,必须把统计学作为科研能力培养的基本功。大学和基金会也需要认识到统计学的重要性,并给大家提供相应的支持和服务。理想的统计学是保证科学研究可重复性、可靠性的核心,因此也是论文可发表的基本保障。
作为同行评议的重要补充,《自然》拥有自己的统计学家专门对论文的统计学方法进行评估。《自然方法》曾经发表了一系列针对统计学方法的论文。
一些学者已经开始重视统计学方法。在大数据时代,无论是基因组学,还是宇宙学,统计学家已经从评估科学变成直接参与科学研究,巨量数据下一些重要的发现必须依靠统计学方法的直接参与。天文学和统计学的结合产生了天文统计学新学科。这种联合产生了重要价值,甚至可比拟19世纪最小二乘回归在天体力学的价值。
评价统计学家在科学研究中的贡献,可以借用化学巨头 BASF 公司的广告词:“We don't make the products. We make them better.”我们不制造产品,我们制造更好的产品。优秀的统计学家不只是协助科学家更好地开展研究,而是把统计学思维灌输到每个学者的学术规范执行者。
大多数科学家都使用统计学,大多数科学家都觉得自己的统计学能力很好,是否大多数科学家一直重复错误的观点和作法?最新的自然新闻观察告诉我们,答案是大多数科学家都是统计盲。
|