许多学科中都通过P值判断研究结果的意义。
P值代表当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
如果P值很小,说明原假设情况的发生概率很小;P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。
但是近年来,越来越多的研究人员担心,0.05阈值已经导致文献中出现了太多的假阳性结果。
更有甚者,很多研究人员并不首先创建假设,而是直接收集数据进行试验,然后在具有统计学意义的结果中寻找规律。
因此,2017年7月22日在Nature Human Behavior发表的一篇文献中,研究人员提出,在社会和生物医学科学领域,P值阈值应该降低到0.005。
为什么选择0.005?
科学家们提出0.005,有两个原因。
首先,0.005的双侧P值对应的贝叶斯因子大约在14~26之间,代表“充分”或“强”的证据。
第二,在许多领域,P<0.005这一标准可将假阳性率降低至合理的水平。
P值阈值、影响力和假阳性之间的相关性
这篇文章的共同作者之一,南加利福尼亚大学洛杉矶分校的经济学家Daniel Benjamin表示:“研究人员根本没有意识到,P值为0.05时证据的薄弱性。”他认为,P值介于0.05~0.005之间的结果应被视为“暗示性证据”,而不是确认结果。
增大研究的样本量,以降低假阴性率
降低P值阈值的一个问题是会增加假阴性的可能性——即在结果真实存在的情况下,认为其不存在。
那么到底该如何解决这个问题,下面来听听专家怎么说:
荷兰格罗宁根大学,心理学和统计学研究员
Casper Albers:
芝加哥伊利诺伊理工学院,计算机科学家
Shlomo Argamon:
英国雷丁大学,认知神经科学家
Tom Johnstone:
Valen Johnson:
信息来源
1.http://www.nature.com/news/big-names-in-statistics-want-to-shake-up-much-maligned-p-value-1.22375
2.https://osf.io/preprints/psyarxiv/mky9j