Diagnostická kalkulačka zjednodušuje život všem psychologům, kteří se v praxi zabývají psychologickým testováním. Nechte se provést intervaly spolehlivosti, kritickými skóry a dalšími otázkami z psychometrické problematiky.
Pro používání diagnostické kalkulačky jsou potřeba jen minimální statistické znalosti. Podrobný návod vždy popíše, co, jak a kam zadat, a rovněž jak výsledky interpretovat.
Diagnostickou kalkulačku vyvíjí psychometrický tým Katedry psychologie Fakulty sociálních studií. K veškerým výpočtům je k dispozici podrobný postup, kód této kalkulačk je veřejně dostupný.
Ve stručnosti jsou jednotlivé postupy popsány i v zápatí každé kalkulačky tak, aby měl uživatel přehled nad způsobem výpočtu.
Po zvolení jednotky, zadání naměřeného skóre a reliability testu máte k dispozici interval spolehlivosti pro vašeho respondenta. Kromě běžného intervalu spolehlivosti měření získáte navíc i interval predikce (v jakém rozmezí bude ležet skór retestu, pokud se výkon klienta nezmění?) a rozdílu (v jakém rozmezí by ležel skór jiného probanda se stejnou úrovní schopnosti?).
Pokud potřebujete převést např. percentily na IQ skóry či T-skóry, nebo naopak např. steny či staniny na percentily či vážené skóry používané v inteligenčních testech, využijete právě tuto kalkulačku.
Kromě kalkulaček dostupných na této stránce můžete využít i další jednoduché nástroje z naší dílny:
Administrovali jste více testů, měřicích ten samý rys, a chcete se dozvědět „souhrnný“ výsledek – tedy výsledek agregovaný napříč všemi měřeními? Prostý průměr není nejlepší nápad, zvlášť, pokud každý test má jinou reliabilitu. Využijte raději kalkulačku složeného skóre – navíc se dozvíte i to, zda se jednotlivá měření liší (a měří tedy zřejmě něco jiného), nebo zda jsou jednotlivé naměřené skóry pravděpodobně stejné.
Máte více skórů a nevíte, zda se skutečně liší? Kalkulačka rozdílových skórů vám to jednoduše řekne. Na výběr máte mezi rozdílem dvou osob nebo dvou výsledků u jediného člověka, tedy test-retest, nebo tzv. statisticky a klinicky významné rozdíly.
Kalkulačku citujte jako: Cígler, H., & Šmíra, M. (2024) Diagnostická kalkulačka (Verze 0.1.1). Masarykova univerzita. http://kalkulacka.testforum.cz
Bugs and reports: Případné chyby hlaste prostřednictvím rozhraní GitHub
Tato kalkulačka vypočítá interval spolehlivosti jednoho skóre při jednom měření, pokud znáte reliabilitu testu.
Zvolte jednotky, ve kterých je test vyhodnocen, a zvolte rovněž reliabilitu testu, který používáte. V pokročilém nastavení následně můžete zvolit šířku intervalu spolehlivosti. Můžete si rovněž zvolit, zda chcete aplikovat regresi k průměru (tedy sestrojit interval spolehlivosti kolem odhadu pravého skóre), nebo nikoli (a interval sestrojit okolo skóre pozorovaného). Ačkoli regrese k průměru je doporučovaným postupem (Dudek, 1979; Cígler a Šmíra, 2015), jeho předpokladem je, že klient byl „náhodně“ vybrán z populace o daném průměru. Naneštěstí, tento předpoklad zpravidla neplatí v běžném klinickém prostředí, v pedagogicko-psychologických poradnách apod. V takovém případě máte na výběr v zásadě tři možnosti:
Pokud jste zadali skóre v percentilech, jsou tyto percentily prvně převedeny na z-skóre, následně jsou provedeny veškeré výpočty a jejich výsledky (kromě standardní chyby měření) jsou převedeny zpět na percentil.
Kromě toho kalkulačka spočítá i dva další intervaly spolehlivosti, které naleznete v tabulce.
Chyba rozdílu udává, jak široký je interval spolehlivosti pro výsledek jiného měření tím stejným
testem za předpokladu, že se pravé skóry obou testů neliší. Pokud nový skór (např. výsledek jiné osoby)
leží mimo tento interval, jsou oba skóry statisticky významně odlišné.
Chyba predikce odhaduje, v jakém rozmezí by měl ležet retestový výsledek respondenta
za předpokladu, že se jeho pravý skóry mezi měřeními nezměnil. Pokud leží nový výsledek mimo
uvedený interval, výkon respondenta se změnil.
Upozornění: Použitý výpočet je založen na postupu klasické testové teorie. Výpočet není vhodný pro testy, které byly konstruované s využití teorie odpovědi na položku nebo Raschova modelu (u nás např. Woodcock-Johnson či Krátký inteligenční test.
Standardní chybu měření označovanou jako SE („Standard Error of measurement“) lze odhadnout pomocí vzorce SE=SD√1−rxx′ kde SD je směrodatná odchylka („Standard Deviation“) a rxx′ je reliabilita testu.
Podle doporučení řady autorů (např. Dudek, 1979; Cígler a Šmíra, 2015) je vhodnějším postupem konstruovat interval spolehlivosti nikoli kolem pozorovaného skóre, ale kolem odhadu skóre pravého, které se nachází trochu blíže k průměrnému skóru. Tato funkce je v našem výpočtu implementována (lze ji však vypnout v pokročilém nastavení). Odhad pravého skóre E(T) (očekávaná hodnota pravého skóre při určitém pozorovaném skóre) lze vypočítat jako E(T)=rxx′X+(1−rxx′)M kde rxx′ je reliabilita, M průměrné skóre a X skóre pozorované. Všimněte si, že pokud je reliabilita rovna jedné, člen 1−rxx′ je roven nule, a průměrné skóre nemá na výpočet vliv; naopak pokud by reliabilita byla nulová, pak by na výpočet nemělo vliv pozorované skóre a odhad pravého skóre by byl shodný s populačním průměrem.
Posledním krokem je odhad vlastního intervalu spolehlivosti CI („Confidence Interval“). Ten je odhadnut okolo odhadu pravého skóre E(T) (je-li tato funkce vypnutá, pak přímo okolo skóre pozorovaného X) jako CIw=E(T)±zwSE kde w označuje šířku intervalu (např. v procentech) a zw je příslušný kvantil normální rozdělení. Pro běžné hodnoty je tento kvantil roven z90%=1,64, z95%=1,96 a z99%=2,58.
Interval pro rozdíl CIΔ je spočítán okolo pozorovaného skóre podle vzorce, tedy CIΔ=X±zwSEΔ kde SEΔ se je standardní chyba rozdílu odhadnutá s pomocí standardní chyby měření (viz dřívější vzorce) jako SEΔ=√2SE Interval spolehlivosti predikce CIpred je spočítán okolo odhadu pravého skóre E(T)) jako CIpred=E(T)±zwSEpred kde SEpred je standardní chyba predikce: SEpred=SD√1−r2xx′
Autorem kalkulačky je Hynek Cígler (©2024) s mírným přispěním Martina Šmíry.
Tato kalkulačka převádí běžná skóre používaná v psychologické diagnostice. Do vstupního pole zadejte skóre a vyberte jeho typ. Pamatujte, že některé skóry mají možný rozsah! Dále si můžete vybrat zaokrouhlení. Protože steny a staniny nejsou bodovým odhadem, ale z definice reprezentují určitý rozsah možných hodnot, lze při jejich výběru zobrazit i podíl respondentů, kteří mají určité stenové či staninové skóre.
skóre | průměr | směrodatná odchylka | minimum | maximum | typ |
---|---|---|---|---|---|
a zpravidla. Poznámky: typ standardní – převod pomocí lineární transformace; typ plošný – převod zpravidla pomocí plošné transformace za předpokladu normálního rozložení. NA – není definováno. Kromě z-skóre jsou všechny jednotky zaokrouhlovány zpravidla na celá čísla (včetně stenů a staninů, což vede k zaokrouhlení průměrného z-skóre 0 na „nadprůměrnou“ stenovou hodnotu 6); z-skóre bývají zaokrouhlována na dvě desetinná místa. | |||||
z-skóre | 0 | 1 | NA | NA | standardní |
IQ skóre | 100 | 15 | NA | NA | standardní |
percentil | NA | NA | 0 | 100 | plošný |
T-skóre | 50 | 10 | NA | NA | standardní |
Wechslerovo (vážené) skóre | 10 | 3 | 0a | 20a | standardní |
steny | 5,5 | 2 | 1 | 10 | plošný |
staniny | 5 | 2 | 1 | 9 | standardní |
Autorem této kalkulačky je Martin Šmíra (2024) s mírným přispěním Hynka Cíglera.
odhad – odhad výsledného skóre na základě všech testů.
CI – výsledný interval spolehlivosti;
x2, df, p – test dobré shody (s testovou statistikou x2 a počtem stupňů volnosti df),
zda se jednotlivé testové výsledky neliší. Pokud je test signifikantní
(p je menší než zvolená hodnota
), pak nelze výsledné kombinované skóre interpretovat.
X – pozorované skóre
r – reliabilita testu;
SE – standardní chyba měření;
CI – interval spolehlivosti.
Žádný z údajů nezohledňuje ostatní testy, týká se vždy jen daného testu.
Při výpočtu není zohledněna regrese k průměru.
X – odhad skóre u n-tého testu; SE = chyba měření daného testu; SE_true – chyba odhadu s využitím všech dosavadních testů; CI – interval měření, které využívá všechny dosavadní testy.
Tato kalkulačka nabízí možnost zkombinovat více testů tak, aby uživatel získal jediný skór s jediným intervalem spolehlivosti. Vyberte si požadovanou jednotku, kterou používáte (všechny testy musí být zadané ve shodných jednotkách) a zadejte skóre a reliabilitu prvního testu. Poté se zobrazí pole pro zadání pozorovaného skóre a reliability druhého testu, a tak dál; celkem lze zadat až 10 separátních testových výsledků.
V nabídce pokročilé možnosti máte zároveň možnost změnit hladinu spolehlivosti použitou pro všechny výpočty, a rovněž apriorní informaci. Nedoporučujeme měnit apriorní informaci, pokud si nejste zcela jisti, že víte, co děláte! Apriorní informace určuje průměr populace, ze které je proband vybrán. Je-li vybrán z běžné populace, je nejvhodnějším řešením ponechat původní nastavení (populační apriorní informace). V tomto případě je použita regrese k průměrnému skóru. Tuto funkci lze vypnout nastavením žádné apriorní informace; skóre prvního testu v takovémto případě není přibližováno k průměrnému skóre. Třetí možnost je nastavit vlastní apriorní informaci. V takovém případě můžete „zpřesnit“ výsledky vyšetření vaším odhadem. Zadejte do apriorní informace váš expertní odhad, jakého výsledku by měl proband dosáhnout. Výsledný odhad bude o něco blíže k této hodnotě, než by odpovídalo naměřenému skóre.
V tabulce 1 naleznete zkombinované výsledky jednotlivých testů. Ve sloupci odhad je výsledný bodový odhad
respondentova skóre, ve sloupci CI naleznete příslušný interval spolehlivosti.
ve sloupcích x2, df a p jsou výsledky testu dobré shody ověřujícího, zda se jednotlivé testové výsledky
statisticky významně neliší. Pokud ano, nelze kombinované skóre bezpečně interpretovat.
V tabulce 2 jsou k dispozici výsledky pro jednotlivé pozorované skóry: X jsou právě tyto skóry, r zadané reliability, SE chyby měření a CI intervaly spolehlivosti. Upozorňujeme, že tyto intervaly spolehlivosti byly odhadnuty bez využití regrese k průměru; nedoporučujeme je individuálně interpretovat. V grafické podobě jsou tyto výsledky pak na gafu níže-
Tabulka 3 potom předkládá vývoj, jak se postupně chyby měření zužovaly. N prvním řádku jsou výsledky po vyhodnocení prvního testu; na druhém po vyhodnocení druhého testu a tak dále. X, SE, a r jsou pozorované skóre, chyba měření a reliabilita daného testu (bez zohlednění ostatních měření). Naopak ve sloupcích X, SE_true a CI je výsledná odhadovaná hodnota pravého skóre, jeho chyba odhadu a příslušný interval spolehlivosti, pokud bereme v úvahu výsledek daného testu i všechna předchozí měření.
Upozornění: Použitý výpočet je založen na postupu klasické testové teorie. Výpočet není vhodný pro testy, které byly konstruované s využití teorie odpovědi na položku nebo Raschova modelu (u nás např. Woodcock-Johnson či Krátký inteligenční test.
Autorem této kalkulačky je Hynek Cígler (©2024).
Pozor, u klinické významnosti záleží na pořadí testů!
E(T2) – očekávané skóre druhého testu podle testu prvního;
CI – interval spolehlivosti pro druhý test;
rozdíl – pozorovaný rozdíl mezi testy;
SE – standardní chyba rozdílu;
z – testová statistika rozdílu;
p – statistická významnost.
Pokud není vypnut regresní odhad pro statisticky významný rozdíl,
nedává smysl interval spolehlivosti tohoto rozdílu.
X – pozorované skóre v daném testu; T – odhad pravého skóre daného testu; SE – standardní chyba měření; CI – interval spolehlivosti měření (bez zohlednění regrese k průměru); CI_reg – interval spolehlivosti měření (po zohlednění regrese k průměru)
Tato kalkulačka poskytuje informace o rozdílnosti dvou skórů. Uživatel může použít celkem tři různé rozdílové skóry:
Uživatel má k dispozici dvě tabulky. Zatímco však druhá tabulka obsahuje obyčejné intervaly spolehlivosti pro jedno měření (s pozorovaným skóre, odhadem skóru pravého, standardní chybou měření a intervaly spolehlivosti při zvážení a při nezvážení regrese k průměru), první tabulka poskytuje přímo výsledky rozdílových skórů.
V prvním sloupci, E(T), je k dispozici očekávaná (resp. nejpravděpodobnější) hodnota druhého testu při zadaných reliabilitách a skóre prvního testu. Okolo této hodnoty se pohybují naměřené skóry, přičemž odlišnost je způsobena chybou měření. Ve druhém sloupci je k dispozici interval spolehlivosti pro druhý test. Pokud skóre druhého testu leží vně tohoto intervalu, je rozdíl statisticky významný na zadané hladině spolehlivosti. Ve sloupci rozdíl je čistě jen rozdíl očekávané a pozorované hodnoty se standardní chybou zobrazenou ve sloupci SE. Ve sloupci z je testová statistika a ve sloupci označeném jako p je statistická významnost tohoto rozdílu. Poslední sloupec pak poskytuje slovní interpretaci případného rozdílu.
Pro výpočet statisticky významného rozdílu je nutné zadat skór prvního a druhého měření a reliabilitu testů. Pokud mají obě měření stejnou reliabilitu (např. porovnáváme výkon dvou osob v jednom testu), stačí zadat reliabilitu pouze prvního testu, ta se použije i pro druhé měření.
Pro Výpočet klinicky významného rozdílu je nutné zadat korelaci obou testů, reliability však nejsou nutné
Pro výpočet rozdílu test-retest je potřeba zadat skóre obou testů a reliabilitu prvního testu. V tomto případě je reliabilita druhého testu ignorovaná, protože předpokládáme, že jde o dvě měřením tím stejným testem se shodnou reliabilitou. Pokud jste při retestu měřili jiným testem, použijte statisticky významný rozdíl.
V pokročilých možnostech můžete změnit požadovanou hladinu statistické významnosti. Je možné rovněž ovlivnit výpočet statisticky významného rozdílu. V původním nastavení je použit regresní postup navržený Cíglerem a Šmírou (2015, vzorec 15). V tomto případě je srovnáván rozdíl pravých skórů. Tuto možnost lze vypnout, pak jsou srovnávány přímo skóry pozorované. Nejste-li si jistí, kterou z variant použít, zvolte přednastavenou možnost (a nechte políčko zatrhnuté). V takovém případě však není k dispozici interval spolehlivosti pro druhý test.
Uživatel aplikace má k dispozici rovněž i graf zobrazující obě měření včetně jejich intervalu spolehlivosti (bez zvážení regrese k průměru, která by mohla být v tomto případě matoucí).
Ve všech případech je spočítán rozdíl očekávaného E(B|A) a pozorovaného skóre B ve druhém testu XΔ (s výjimkou statisticky významného rozdílu při použití regresní metody, viz níže). Protože tento očekávaný rozdíl je vždy nula (H0:XΔ=0), testová statistika z je spočítána za předpokladu normálního rozložení jako podíl tohoto rozdílu a standardní chyby příslušného rozdílu: z=XΔSE Pro tuto testovou statistiku je pak dohledána příslušná pravděpodovnost (ve všech případech je použit oboustranný test). Standardní chyba je využita i pro výpočet intervalu spolehlivosti s příslušným kvantilem normálního rozložení zw podle vzorce CIw=zwSE
V případě použití regresní metody (Cígler a Šmíra, 2015, vzorec 15) je pozorovaný rozdíl spočítán jako XΔ=√raa′(A−M)−√rbb′(B−M) kde raa′) a\(rbb′ jsou reliability obou testů A a B a M je průměr použitých jednotek.
Pokud není použita regresní metoda, je rozdíl spočítán jako prostý rozdíl pozorovaných skórů XΔ=A−B
Standardní chyba statisticky významného rozdílu je pak v obou případech odhadnuta jako SEstat.=SD√(2−raa′−rbb′) SD je směrodatná odchylka použitých jednotek.
Očekávané skóre E(B|A) ve druhém testu je spočítáno s využitím skóre prvního testu A a jejich korelace rab jako E(B|A)=rabA+(1−rab)M Standardní chyba klinického rozdílu je potom SE=SD√1−r2ab
Postup je analogický předchozímu příkladu s tím rozdílem, že namísto korelace obou testů je použita
reliabilita testu (společná pro oba testy).
Očekávané skóre E(B|A) ve druhém testu je spočítáno s využitím skóre prvního testu A
a jejich společné reliability raa′=rbb′ jako
E(B|A)=raa′A+(1−raa′)M
Standardní chyba klinického rozdílu je potom
SE=SD√1−r2aa′
Cígler, H., & Šmíra, M. (2015). Chyba měření a odhad pravého skóru: Připomenutí některých postupů Klasické testové teorie. Testfórum, 4(6), 67-84. doi:10.5817/TF2015-6-104
Autorem kalkulačky je Hynek Cígler (©2024).