Diskuse
O význame p-hodnôt: reflexia na silnejúcu kritiku
testov významnosti |
Vo svetle aktuálnej krízy reprodukovateľnosti
vedeckého poznania silnie kritika na adresu p-
-hodnôt ako výstupu procedúry testovania významnosti
nulovej hypotézy (tzv. NHST). Totiž
intuitívne interpretácie významu p-hodnôt sú
spravidla zavádzajúce, keďže p-hodnoty neposkytujú
odpovede na otázky, ktoré sa výskumníci
zvyknú pýtať, a ich úloha v kontexte štatistickej
inferencie je preto výrazne preceňovaná.
Príspevok poukazuje na najviac pervazívne
nesprávne interpretácie p-hodnôt, ako aj na štatistické
dôvody slabej reprodukovateľnosti zistení
postavených na prekročení konsenzuálnej
hladiny p < 0,05. Zároveň však ponúka kritickú
reflexiu na argumenty proti používaniu p-hodnôt
a prezentuje pragmatický, no stále rigorózny
pohľad na logiku a užitočnosť p-hodnôt. |
Klíčová slova: p-hodnoty,
testovanie významnosti nulovej hypotézy,
štatistická inferencia,
testovanie hypotéz,
kríza reprodukovateľnosti |
Ivan Ropovik (2017). O význame p-hodnôt: reflexia na silnejúcu kritiku
testov významnosti. Československá psychologie, 61(5), 502-516.
| |
On the meaning of p-values: criticism
of significance tests revisited |
In the light of the reproducibility crisis, there
is a growing criticism of null hypothesis significance
testing (NHST) and its output, the
p-values. In fact, the intuitive interpretations
of p-values are usually misleading because
the p-values do not answer the questions that
researchers tend to ask and their role in the context
of statistical inference is typically grossly
overestimated. The aim of this article is to discuss
the most pervasive misinterpretations of
p-values as well as the statistical reasons for the
weak reproducibility of findings based on crossing
the p < .05 threshold. On the other hand,
the article provides a reconsideration of the arguments
against the p-values, while offering a
pragmatic, but still rigorous perspective on their
logic and usefulness. |
Keywords: p-values,
null hypothesis significance testing,
statistical inference,
hypothesis testing,
reproducibility crisis
|
|