Interval spolehlivosti
Intervaly spolehlivosti pro rozdíl
Nápověda
Tato kalkulačka vypočítá interval spolehlivosti jednoho skóre při jednom měření, pokud znáte reliabilitu testu.
Zvolte jednotky, ve kterých je test vyhodnocen, a zvolte rovněž reliabilitu testu, který používáte. V pokročilém nastavení následně můžete zvolit šířku intervalu spolehlivosti. Můžete si rovněž zvolit, zda chcete aplikovat regresi k průměru (tedy sestrojit interval spolehlivosti kolem odhadu pravého skóre), nebo nikoli (a interval sestrojit okolo skóre pozorovaného). Ačkoli regrese k průměru je doporučovaným postupem (Dudek, 1979; Cígler a Šmíra, 2015), jeho předpokladem je, že klient byl „náhodně“ vybrán z populace o daném průměru. Naneštěstí, tento předpoklad zpravidla neplatí v běžném klinickém prostředí, v pedagogicko-psychologických poradnách apod. V takovém případě máte na výběr v zásadě tři možnosti:
- I přes to použít regresi k průměru. Takový závěr je „konzervativnější“. V takové situaci předpokádáte, že klient pochází z běžné populace.
- Regresi k průměru nepoužít. Tento postup a-priori neklade žádné předpoklady o skóre klienta, může však vést k extrémnějším závěrům, interval spolehlivosti bude posunutý směrem k extrémům.
- Zvolit si apriorní rozložení sám/sama. V takovém případě jako typ skóre vyberte jiné. Jako směrodatnou odchylku uveďte směrodatnou odchylku používaných skórů (tedy např. 15 pro IQ či 10 pro T-skóre), jako střední hodnotu uveďte vámi očekávaný skór, kterého respondent dosáhne. Jinými slovy: tipněte si výkon klienta a tento svůj tip dosaďte na místo průměru. Tento poslední postup by měl vést k nejadekvátnějšímu odhadu intervalu spolehlivosti.
Pokud jste zadali skóre v percentilech, jsou tyto percentily prvně převedeny na z-skóre, následně jsou provedeny veškeré výpočty a jejich výsledky (kromě standardní chyby měření) jsou převedeny zpět na percentil.
Kromě toho kalkulačka spočítá i dva další intervaly spolehlivosti, které naleznete v tabulce.
Chyba rozdílu udává, jak široký je interval spolehlivosti pro výsledek jiného měření tím stejným
testem za předpokladu, že se pravé skóry obou testů neliší. Pokud nový skór (např. výsledek jiné osoby)
leží mimo tento interval, jsou oba skóry statisticky významně odlišné.
Chyba predikce odhaduje, v jakém rozmezí by měl ležet retestový výsledek respondenta
za předpokladu, že se jeho pravý skóry mezi měřeními nezměnil. Pokud leží nový výsledek mimo
uvedený interval, výkon respondenta se změnil.
Upozornění: Použitý výpočet je založen na postupu klasické testové teorie. Výpočet není vhodný pro testy, které byly konstruované s využití teorie odpovědi na položku nebo Raschova modelu (u nás např. Woodcock-Johnson či Krátký inteligenční test.
Postup odhadu
Standardní chybu měření označovanou jako \(SE\) („Standard Error of measurement“) lze odhadnout pomocí vzorce $$SE = SD\sqrt{1-r_{xx'}}$$ kde \(SD\) je směrodatná odchylka („Standard Deviation“) a \(r_{xx'}\) je reliabilita testu.
Podle doporučení řady autorů (např. Dudek, 1979; Cígler a Šmíra, 2015) je vhodnějším postupem konstruovat interval spolehlivosti nikoli kolem pozorovaného skóre, ale kolem odhadu skóre pravého, které se nachází trochu blíže k průměrnému skóru. Tato funkce je v našem výpočtu implementována (lze ji však vypnout v pokročilém nastavení). Odhad pravého skóre \(E(T)\) (očekávaná hodnota pravého skóre při určitém pozorovaném skóre) lze vypočítat jako $$E(T) = r_{xx'}X + (1-r_{xx'})M$$ kde \(r_{xx'}\) je reliabilita, \(M\) průměrné skóre a \(X\) skóre pozorované. Všimněte si, že pokud je reliabilita rovna jedné, člen \(1-r_{xx'}\) je roven nule, a průměrné skóre nemá na výpočet vliv; naopak pokud by reliabilita byla nulová, pak by na výpočet nemělo vliv pozorované skóre a odhad pravého skóre by byl shodný s populačním průměrem.
Posledním krokem je odhad vlastního intervalu spolehlivosti \(CI\) („Confidence Interval“). Ten je odhadnut okolo odhadu pravého skóre \(E(T)\) (je-li tato funkce vypnutá, pak přímo okolo skóre pozorovaného \(X\)) jako $$CI_w = E(T) \pm z_{w}SE$$ kde \(w\) označuje šířku intervalu (např. v procentech) a \(z_{w}\) je příslušný kvantil normální rozdělení. Pro běžné hodnoty je tento kvantil roven \(z_{90\%}=1,64\), \(z_{95\%}=1,96\) a \(z_{99\%}=2,58\).
Interval pro rozdíl \(CI_{\Delta}\) je spočítán okolo pozorovaného skóre podle vzorce, tedy $$ CI_{\Delta}=X \pm z_{w} SE_{\Delta} $$ kde \(SE_\Delta\) se je standardní chyba rozdílu odhadnutá s pomocí standardní chyby měření (viz dřívější vzorce) jako $$SE_\Delta=\sqrt{2}SE$$ Interval spolehlivosti predikce \(CI_{pred}\) je spočítán okolo odhadu pravého skóre \(E(T))\) jako $$CI_{pred} = E(T) \pm z_{w}SE_{pred}$$ kde \(SE_{pred}\) je standardní chyba predikce: $$SE_{pred}=SD\sqrt{1-r_{xx'}^2}$$
Autorem kalkulačky je Hynek Cígler (©2026) s mírným přispěním Martina Šmíry.
Zdroje
- Cígler, H., & Šmíra, M. (2015). Chyba měření a odhad pravého skóru: Připomenutí některých postupů Klasické testové teorie. Testfórum, 4(6), 67-84. doi:10.5817/TF2015-6-104
- Dudek, F.J. (1979). The Continuing Misinterpretation of the Standard Error of Measurement. Psychological Bulletin 86(2), 335-337. doi:10.1037/0033-2909.86.2.335