• 熱線電話:010-56107385

聯系方式

地 址:北京市昌平區北清路生命科學園博雅CC -9號樓2層
電 話:010-56107385
傳 真:
郵 箱:support@ori-gene.cn

新聞資訊

您現在的位置:首頁 > 公司動態 > 新聞資訊
美國統計學會權威發布:P值用法
作者: 來源: 發布于:2016-5-12 17:59:05 點擊量:

   Q:為什么這么多學校都在教“P=0.05”?

  A:因為科學界和期刊編輯現在還用這個。

  Q:為什么這么多人還在用“P=0.05”?

  A:因為學校就是這么教的。

 

  這是美國曼荷蓮學院(Mount Holyoke College)數學與統計學教授George Cobb20142月在美國統計學會(American Statistical Association, ASA)的論壇上提出來的兩個問題。

  在閱讀了太多不可重復或者包含統計錯誤的論文后,ASA決定行動起來:201637日,ASA正式發表了使用和解釋P值的“六原則”Wasserstein, R. L., & Lazar, N. A. (2016). The ASA's statement on p-values: context, process, and purpose. The American Statistician

  我們使用P值來檢測組間或方法間的差別、評估目標變量間的關系等但ASA指出P值被廣泛誤用了。

ASA對這六個原則進行了具體的闡釋:

  1. P值可以指示數據與一個給定模型的不相容程度。P-values can indicate how incompatible the data are with a specified statistical model.

  我們基于一系列的假設建立的模型稱為原假設;建立零假設(null hypothsis),即指某種我們想要檢測的效應不存在,例如兩組無差,或者某個因子與結果無關。P值越小,說明數據與零假設之間越不相容。這里的不相容,可以解釋為對零假設的存疑程度。

  2. P值不能衡量某假設為真的概率,也不能衡量數據僅由隨機因素造成的概率。P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.

  盡管研究者常常希望計算出零假設是否為真,或是算出觀測結果僅由隨機事件造成的概率,但P值的作用并不是這個,P值只解釋數據與假設之間的關系,它并不解釋假設本身。

  3.科學結論、商業決策或政策制定,不應只取決于P值是否達到了一個給定標準。Scientific conclusions and business or policy decisions should not be based only on whether a p-value passes a specific threshold.

  為了給某種科學主張或論斷提供佐證而把數據分析或科學評估簡化成一種機械性的規則(例如p<0.05),這會導致錯誤的結論和糟糕的決定。一個結論的正確與否并不會因為研究者算出的P值大于還是小于0.05而改變。研究者需要將很多因子納入考慮來作出科學推斷,包括研究設計、測量的質量、與研究對象有關的外部證據,以及分析數據時使用的假設的合理性等。決策者常常需要根據研究結果作出“做”或“不做”的決定,但p值本身不能決定決策的正確與否。科研界將顯著性標準(例如p<0.05)作為發表科學發現(暗示了其真實性)的“許可證”廣泛使用,然而這卻扭曲了科研的過程。

4. 研究者需對研究進行完整的報告、保證透明度,才能做出合理的推論。Proper inference requires full reporting and transparency.

研究者不應選擇地報道P值和相關的統計分析。某項研究可能使用了好幾種分析方法,而研究者只報告其中的一部分(特別是那些符合標準的),這就使得P值難以解釋。一旦研究者根據統計結果選擇性地展示相應的方法,而讀者對此并不知情,結果的有效性就打了折扣。研究者應該展示研究過程中檢驗過的假設的數量、數據收集的方法、所有使用過的統計方法和相應的P值。

5. P值或統計顯著性并不能衡量效應的大小和結果的重要性。A p-value, or statistical significance, does not measure the size of an effect or the importance of a result.

某項個結果的統計顯著性并不代表其在科學、人文的或者經濟上的重要性。P值小并不意味著效應更重要,P值大也不代表不重要或沒有效應。無論某個效應的影響有多小,當樣本量足夠大或測量精度足夠高時,總能得到小的P值。對于相同的效應,當測量精度不同時,得到不同的P值也會不同。

6. P值本身并不能衡量模型或假設的可信度。By itself, a p-value does not provide a good measure of evidence regarding a model or hypothesis.

  研究者應該意識到,在沒有一定的背景時,P值能提供的信息非常有限。接近0.05P值只能為反駁零假設提供非常弱的證據。同樣的,相對大的P值也不一定意味著證據就偏向支持零假設,還是有很多其他的假設可能導致現有的結果。因此,當其他方法適用時,研究者對數據的分析不應止于P值分析。



大香蕉网站_大伊人香蕉在线_伊人久久大香蕉网_伊人成综合人网_大香焦