Informācija

Kritērijs pret konverģentu derīgumu

Kritērijs pret konverģentu derīgumu

Man ir dažas grūtības atšķirt kritēriju un saplūstošo derīgumu. Saskaņā ar Wikipedia, atšķirība ir tāda, ka kritērija derīgums patiešām koncentrējas prognozējot rezultātus citā testā, bet derīguma derīgums ir saistīts ar korelāciju atrašanu starp testiem vai mainīgajiem, kas ir teorētiski pieņemts būt saistītiem (https://en.wikipedia.org/wiki/Concurrent_validity; Lai izvairītos no neskaidrībām: es zinu, ka vienlaicīga derīgums ir kritērija derīguma apakštips). Tomēr tiešsaistē es atradu jautājumu ar atbilžu variantiem, kas mani mulsināja:

Gala eksāmena rezultāti ir saistīti ar studentu vidējo atzīmi, eksāmenam pavadīto laiku un stundu apmeklējumu. Kāda veida derīgums tiek pierādīts šajā gadījumā? A) konverģents derīgums B) diskriminējošs derīgums C) kritērija derīgums

Acīmredzot pareizā atbilde ir A), bet, manuprāt, jūs joprojām varētu strīdēties par C) šādā veidā: Galīgā eksāmena rādītāji ir rezultātu rādītājs un GPA, mācībās pavadītais laiks un stundu apmeklējums.


Konverģējošs, pakāpenisks un ar kritērijiem saistīts derīgums vairāku informatoru novērtējumos par pusaudžu bailēm no negatīva un pozitīva novērtējuma

Andres De Los Reyes, Merilendas Universitātes Psiholoģijas katedra College Park, College Park, MD, ASV.

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Nebraskas Universitātes Medicīnas centra Medicīnas koledža, Omaha, Nebraska, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Merilendas Universitātes Psiholoģijas nodaļa Koledžas parkā, Koledžas parks, Merilenda, ASV

Andres De Los Reyes, Merilendas Universitātes Psiholoģijas katedra College Park, College Park, MD, ASV.

Institucionālā pieteikšanās
Piesakieties Wiley tiešsaistes bibliotēkā

Ja iepriekš esat ieguvis piekļuvi, izmantojot savu personīgo kontu, lūdzu, piesakieties.


Amerikas Izglītības pētījumu asociācija, Amerikas Psiholoģijas asociācija un Nacionālā izglītības mērījumu padome. (1999). Izglītības un psiholoģiskās pārbaudes standarti. Vašingtona, ASV: Amerikas Izglītības pētījumu asociācija.

Bredshaw, C. P., Buckley, J., & amp; Lalongo, N. (2008). Skolas pakalpojumu izmantošana pilsētas bērniem ar agrīnām izglītības un garīgās veselības problēmām: čīkstošā riteņa parādība. Skolas psiholoģija reizi ceturksnī, 23, 169–186.

Brauns, T. A. (2006). Apstiprinoša faktoru analīze lietišķajiem pētījumiem. Ņujorka: Guilford Press.

Koens, J. (1988). Uzvedības zinātņu statistiskā jaudas analīze. Ņūdžersija: Lawrence Erlbaum Associates.

Compton, D. L., Fuchs, D., Fuchs, L. S., & amp; Bryant, J. D. (2006). Riska lasītāju atlase pirmajā klasē agrīnai iejaukšanai: divu gadu garenvirziena lēmuma noteikumu un procedūru pētījums. Izglītības psiholoģijas žurnāls, 98, 394–409.

Conroy, M. A., Hendrickson, J. M., & amp; Hester, P. P. (2004). Emocionālo un uzvedības traucējumu agrīna identificēšana un novēršana. R. B. Rutherford Jr, M. M. Quinn un amp. Mather (red.), Uzvedības traucējumu pētījumu rokasgrāmata (199. – 215. lpp.). Ņujorka, NY: Guilford Press.

Costello, E. J., Mustillo, S., Erkanli, A., Keeler, G., & amp; Angold, A. (2003). Psihisko traucējumu izplatība un attīstība bērnībā un pusaudža gados. Vispārējās psihiatrijas arhīvs, 60, 837–844.

Kriks, N. R., Grotpeters, J. K., & amp.Bigbijs, M. A. (2002). Relatīvi un fiziski agresīvi bērnu nodomu attiecinājumi un jūtas par attiecību un instrumentālām vienaudžu provokācijām. Bērna attīstība, 73, 1134–1142.

Cullinan, D., & amp; Epstein, M. H. (2013a). Emocionālās un uzvedības skrīninga attīstība, uzticamība un konstrukcijas pamatotība. Skolas neveiksmes novēršana, 57, 223–230.

Cullinan, D., & amp; Epstein, M. H. (2013b). Emocionālās un uzvedības skrīnings (EBS). Ostina, Teksasa: PRO-ED.

Eisenberg, N., Valiente, C., Spinrad, T. L., Cumbers-land, A., Liew, J., Reiser, M., et al. (2009). Gareniskās attiecības ar bērnu centīgo kontroli, impulsivitāti un negatīvo emocionalitāti ar viņu ārējām, internalizējošajām un līdzās sastopamajām uzvedības problēmām. Attīstības psiholoģija, 45, 988–1008.

Epšteins, M. H., & amp; Cullinan, D. (2010). Svari emocionālo traucējumu novērtēšanai (2. izdevums). Ostina, Teksasa: PRO-ED.

Essex, M., Kraemer, H. C., Slattery, M. J., Burk, L. R., Boyce, W. T., Woodward, H. R., & amp Kupfer, D. J. (2009). Bērnu garīgās veselības problēmu skrīnings: rezultāti un agrīna identificēšana. Bērnu psiholoģijas un psihiatrijas žurnāls, 50, 562–570.

Federālais reģistrs. (2006). Palīdzība valstīm bērnu ar invaliditāti izglītošanā un pirmsskolas dotācijas bērniem ar invaliditāti Noslēguma 34. noteikums (CFR 300. un 301. daļa, 71. Fed. Reg. 46540). Vašingtona, ASV: ASV Izglītības departaments.

Felds, L. S. (1969). Pārbaude hipotēzei, ka Kronbaha alfa vai Kudera-Ričardsona koeficients divdesmit ir vienāds diviem testiem. Psihometrija, 34, 363–373.

Grīns, S. B., un Hershberger, S. L. (2000). Saistītās kļūdas patieso rezultātu modeļos un to ietekme uz alfa koeficientu. Strukturālo vienādojumu modelēšana, 7, 251–270.

Gresham, F. M., & amp; Elliott, S. N. (2008). Sociālo prasmju vērtēšanas sistēma - vērtēšanas skalas. Mineapole: NCS Pearson Inc.

Gresham, F. M., Elliott, S. N., & amp; Kettler, R. J. (2010). Sociālo prasmju apguves/veiktspējas deficīta bāzes likmes, stiprās puses un problēmu uzvedība: sociālo prasmju uzlabošanas sistēmas analīze - vērtēšanas skalas. Psiholoģiskais novērtējums, 22, 809–815.

Gresham, F. M., Elliott, S. N., Vance, M. J., & amp Cook, C. R. (2011). Sociālo prasmju vērtēšanas sistēmas salīdzināmība ar sociālo prasmju uzlabošanas sistēmu: satura un psihometriskie salīdzinājumi starp pamatskolas un vidusskolas vecuma līmeņiem. Skolas psiholoģija reizi ceturksnī, 26, 27. – 44. doi: 10.1037/a0022662.

Hammill, D. D., Brown, L., Bryant, B. R., & amp; Cullinan, D. (1989). Patērētāja rokasgrāmata testiem drukātā veidā (2. izdevums). Ostina, Teksasa: PRO-ED.

Hawken, L. S., Vincent, C. G., & amp. Schumann, J. (2008). Atbilde uz iejaukšanos sociālajā uzvedībā: izaicinājumi un iespējas. Emocionālo un uzvedības traucējumu žurnāls, 16, 213–225.

Hopkinss, V. G. (2002). Jauns statistikas skatījums: ietekmes statistikas lieluma skala. Iegūts no http://www.sportsci.org/resource/stats/.

Horner, R. H., Sugai, G., Smolkowski, K., Eber, L., Nakasato, J., Todd, A. W., et al. (2009). Nejaušināts, gaidīšanas saraksta kontrolēts efektivitātes pētījums, kurā novērtēts pozitīvs uzvedības atbalsts visā skolā pamatskolās. Pozitīvas uzvedības iejaukšanās žurnāls, 11, 133–144.

Johnson, E. S., Jenkins, J. R., Petscher, Y., & amp; Catts, H. W. (2009). Kā mēs varam uzlabot skrīninga instrumentu precizitāti? Mācīšanās traucējumu izpēte un prakse, 24, 174–185.

Izglītības un psiholoģiskās pārbaudes standartu apvienotā komiteja. (1999). Izglītības un psiholoģiskās pārbaudes standarti. Vašingtona, ASV: Amerikas Izglītības pētījumu asociācija.

Kamphaus, R. W., & amp; Reinoldss, C. R. (2007). BASC-2: Uzvedības un emocionālās skrīninga sistēma. Mineapolis, MN: Pīrsons.

Kamphaus, R. W., Thorpe, J. S., Winsor, A. P., Kroncke, A. P., Dowdy, E. T., & amp; VanDeventer, M. (2007). Skolotāja skrīninga attīstība un paredzamais derīgums bērnu uzvedības un emocionālajām problēmām skolā. Izglītības un psiholoģiskie mērījumi, 6, 1–15.

Kaufmens, J. M., & amp; Landrum, T. J. (2009). Bērnu un jauniešu emocionālo un uzvedības traucējumu raksturojums (9. izdevums). Upper Saddle River, NJ: Pearson Education Inc.

Lambert, M. C., Epšteins, M. H., & amp; Cullinan, D. (2014a). Emocionālās un uzvedības skrīninga diagnostikas kvalitāte. Psihoizglītības novērtējuma žurnāls, 32, 51. – 61. doi: 10.1177/0734282913485541.

Lambert, M. C., Epstein, M., Ingram, S., Simpson, A., & amp; Bernstein, S. (2014b). Emocionālās un uzvedības skrīninga psihometrija un mērījumu nemainība. Uzvedības traucējumi, 39, 89–101.

Lane, K. L., Menzies, H. M., Oakes, W. P., Lambert, W., Cox, M., & amp; Hankins, K. (2012). Studentu riska pārbaudes skalas validācija uzvedības internalizēšanai un ārējai lietošanai: paraugi lauku un pilsētu pamatskolās. Uzvedības traucējumi, 37(4), 244–270.

Lane, K. L., Oakes, W., & amp; Menzies, H. (2010). Sistemātiskas pārbaudes, lai novērstu mācīšanās un uzvedības problēmu attīstību: apsvērumi praktiķiem, pētniekiem un politikas veidotājiem. Invaliditātes politikas pētījumu žurnāls, 21, 160–172.

Makdonalds, R. P. (1978). Vispārināmība faktiskās jomās: domēna derīgums un vispārināmība. Izglītības un psiholoģiskais mērījums, 38, 75–79.

Morris, R. J., Shah, K., & amp; Morris, Y. P. (2002). Uzvedības traucējumu internalizācija. K. Lane, F. Gresham un amp. O’Shaughnessy (red.), Intervences bērniem ar emocionāliem un uzvedības traucējumiem vai to risku (223. – 241. lpp.). Bostona: Allyn & amp; Bekons.

Mrazek, D., & amp; Mrazek, P. J. (2005). Psihisko traucējumu profilakse bērniem un pusaudžiem. B. J. Sadock un amp. A. A. Sadock (red.), Kaplan & amp Sadock visaptverošā psihiatrijas mācību grāmata (II sēj., 3513. – 3518. Lpp.). Filadelfija, PA: Lippincott Williams & amp Wilkins.

Nacionālā pētniecības padome un Medicīnas institūts. (2009). Garīgo, emocionālo un uzvedības traucējumu novēršana jauniešu vidū: progress un iespējas. Bērnu, jauniešu un jaunu pieaugušo garīgo traucējumu un vielu lietošanas novēršanas komiteja: pētniecības sasniegumi un daudzsološas iejaukšanās. Sadaļā M. E. O’Konnels, T. Boats un K. E. Vorners (red.). Bērnu, jauniešu un ģimeņu padome, Uzvedības un sociālo zinātņu un izglītības nodaļa. Vašingtona, DC: Nacionālo akadēmiju prese.

Nordness, P. D., Epstein, M. H., Cullinan, D., & amp Pierce, C. D. (2014). Emocionālās un uzvedības pārbaudes: pārbaudiet atkārtotu uzticamību, vērtētāju uzticamību un konverģentu derīgumu. Ārstnieciskā un speciālā izglītība. 35, 211–217.

Nunnally, J. C. (1978). Psihometriskā teorija (2. izdevums). Ņujorka: McGraw-Hill.

Mācītājs P. N., Rūbens, C. A., & amp; Duran, C. R. (2012). Emocionālo un uzvedības problēmu noteikšana bērniem vecumā no 4 līdz 17 gadiem: Amerikas Savienotās Valstis, 2001. – 2007. Nacionālie veselības statistikas ziņojumi. 48. numurs. Nacionālais veselības statistikas centrs.

Salvia, J., Yesseldyke, J., & amp; Bolt, S. (2013). Novērtējums speciālajā un iekļaujošajā izglītībā (12. izdevums). Belmont, CA: Wadsworth.

Severson, H. H., Walker, H. M., Hope-Doolittle, J., Kratochwill, T. R., & amp; Gresham, F. M. (2007). Proaktīva, agrīna skrīnings, lai atklātu uzvedības riskam pakļautus studentus: jautājumi, pieejas, jauninājumi un profesionālā prakse. Skolas psiholoģijas žurnāls, 45, 193–223.

Spīrmena, C. C. (1910). Korelācija aprēķināta pēc kļūdainiem datiem. Britu psiholoģijas žurnāls, 3, 271–295.

Šteigers, J. H. (1980). Testi korelācijas matricas elementu salīdzināšanai. Psiholoģijas biļetens, 87, 245–251.

Sugai, G., & amp; Horner, R. (2006). Daudzsološa pieeja, lai paplašinātu un uzturētu pozitīvas uzvedības atbalsta ieviešanu visā skolā. Skolas psiholoģijas apskats, 35, 245–259.

Sugai, G., & amp; Horner, R. H. (2009). Pozitīvas uzvedības atbalsta definēšana un apraksts visā skolā. Darbos W. Sailor, G. Dunlap, G. Sugai un R. H. Horner (red.), Pozitīvas uzvedības atbalsta rokasgrāmata (307. – 326. lpp.). Ņujorka, NY: Springer. doi: 10.1007/978-0-387-09632-2_13.

Walker, H. M., & amp; Severson, H. (1992). Sistemātiska uzvedības traucējumu pārbaude: lietotāja rokasgrāmata un tehniskā rokasgrāmata. Longmont, CO: Sopris West.

Wood, F., Flowers, L., Meyer, M., & amp Hill, D. (2002). Skrīninga testu novērtēšana un salīdzināšana: zinātnes un saprāta principi. Raksts, kas prezentēts Starptautiskās disleksijas asociācijas sanāksmē, Atlanta, GA.


Vienlaicīgs derīgums pret konverģentu derīgumu

Es šobrīd mācos psiholoģisko pētījumu finālam, un es esmu mēģinājis saprast un atšķirt vienlaicīgo derīgumu un saplūstošo derīgumu! Vai ir kāds, kas varētu to izskaidrot un sniegt dažus piemērus ?? Atvainojiet, ja šī nav īstā vieta, kur to ievietot, bet es nevaru iedomāties nevienu citu apakšreditu

Vai jūs, iespējams, varētu šeit paskaidrot, kas jums apgrūtina to atšķiršanu?

Tāpat kā es tiešsaistē lasu definīcijas, un viņi to saka par vienlaicīgu derīgumu: & quot; Vienlaicīgais derīgums ir pakāpe, kādā mērījuma veiktspēja ir saistīta ar pašreizējo veiktspēju līdzīgā, iepriekš noteiktā mērījumā. Piemēram, pieņemsim, ka darba devēji ir izveidojuši savu skalu, lai novērtētu savu darbinieku vadības prasmes. Tie darbiniekiem dod skalu, kas jāaizpilda tajā pašā dienā kā līdzīgs, bet ilgāks un gadu desmitiem ilgs vadības tests. Ja katra darbinieka rezultāti abos testos ir cieši saistīti, tad jaunajai skalai ir augsts vienlaicīgs derīgums. "

Un tas attiecas uz vienotu derīgumu:

& quot; Konverģences derīgums attiecas uz pakāpi, kādā testa rezultāti korelē ar citu testu rezultātiem (vai ir saistīti ar tiem), kas paredzēti, lai novērtētu to pašu konstrukciju. Piemēram, ja noteiktas formas agresivitātes testa rezultāti ir līdzīgi cilvēku vērtējumiem citos agresivitātes testos, tad konverģences derīgums ir augsts (pastāv pozitīva korelācija starp līdzīgu agresivitātes testu rezultātiem). & Quot

Tāpat kā man sniegtie piemēri šķiet tik līdzīgi, man nav ne jausmas, kā tos atšķirt, jo abos piemēros viņi salīdzina divu testu rezultātus.


Kritērijs un konverģents derīgums 4 sāpju mērījumiem bērnu sirpjveida šūnu slimību populācijā

Mērķis: Novērtēt 4 akūtu sāpju mērījumu psihometriskās īpašības jauniešiem ar sirpjveida šūnu slimību (SCD) medicīniskās procedūras laikā.

Metodes: Sirdsdarbības ātrums, bērna pašziņojums, vecāku starpniekserveris un novērojama sāpju uzvedība tika pārbaudīta 48 jauniešiem ar SCD vecumā no 2 līdz 17 gadiem. Kritēriju derīgums akūtām sāpēm tika novērtēts, reaģējot uz standartizētu sāpīgu stimulu (venipunktūru), plānojot to pirms projekta. Konverģenta derīgums tika novērtēts, izmantojot korelāciju starp pasākumiem, reaģējot uz stimulu.

Rezultāti: Bērna paša ziņotās sāpes, vecāku starpniekserveris un uzvedības distresa rādītāji palielinājās, reaģējot uz vēnu punkciju (vienlaicīga un vienota derīgums). Turpretī sirdsdarbības ātrums ticami nemainījās, reaģējot uz vēnu punkciju. Izmaiņu apjoms, reaģējot uz vēnu punkciju, parādīja mērenu savstarpēju korelāciju starp bērnu un vecāku sāpju vērtējumiem un uzvedības traucējumiem. Sāpju novērtējums pirms procedūras korelē ar sāpēm, kas rodas procedūras laikā. Novērojamo sāpju uzvedības elementu analīze liecināja par atšķirībām sāpju attēlojumā SCD, salīdzinot ar iepriekšējiem pediatrijas pētījumiem.

Secinājumi: Bērna ziņojuma, vecāku ziņojuma un novērojamās sāpju uzvedības kritēriji un saplūstošais derīgums tika pierādīti. Šķiet, ka šie pasākumi ietver atšķirīgus, tomēr pārklājošus sāpju pieredzes aspektus. Lai novērtētu akūtas procedūras sāpju reakcijas SCD, ir jānovērtē pirmsprocedurālās sāpes, jo bieži ir zemas, sākotnējās sāpes.


Standartizēts novērtējums

Derīguma veidi

Vienlaicīgs derīgums. Vienlaicīgs derīgums norāda, cik liela ir vienošanās starp diviem dažādiem novērtējumiem. Parasti viens novērtējums ir jauns, bet otrs ir labi izveidots un jau ir pierādīts kā derīgs. Jauna novērtējuma autore vēlētos, lai viņas vērtējumam būtu augsts derīgums ar labi ievērotiem un labi izveidotiem novērtējumiem.

Veidojiet derīgumu. Konstrukcijas derīgums ir novērtējuma spēja attēlot vai novērtēt attiecīgo konstrukciju. Šī statistika atbild uz jautājumu “Vai šis novērtēšanas rīks patiešām mēra to, ko tā saka?”

Satura derīgums. Satura derīgums attiecas uz instrumenta spēju izmērīt vai novērtēt visus konstrukcijas aspektus, kurus tā plāno novērtēt. Piemēram, novērtējumam, kurā tiek pārbaudīta tikai socializācija vai komunikācija, būtu zems satura derīgums autisma novērtēšanai, jo pasākums ignorē atkārtotu uzvedību, kas ir viena no galvenajām autisma traucējumu jomām.

Prognozējošais derīgums. Prognozētais derīgums norāda uz pasākuma spēju paredzēt kāda iznākuma mainīgā veiktspēju. Piemēram, autisma skrīninga pasākums, ko izmanto zīdaiņiem un maziem bērniem (piemēram, BISKUITS - 1.daļa Matson, Boisjoli, & amp; Wilkins, 2007), pamatojoties uz pilnīgiem novērtējumiem, vajadzētu būt labam paredzamajam derīgumam turpmākajām autisma diagnozēm. Tas nozīmē, ka zīdaiņiem un maziem bērniem, kuri tiek uzskatīti par “riskam pakļautiem”, ir lielāka iespēja saņemt autisma diagnozi vēlāk, kad viņi saņem pilnu diagnostikas novērtējumu.


Testa derīgums [rediģēt | rediģēt avotu]

Uzticamība un derīgums [rediģēt | rediģēt avotu]

Agrīna testa derīguma definīcija to identificēja ar korelācijas pakāpi starp testu un kritēriju. Saskaņā ar šo definīciju var pierādīt, ka testa un kritērija ticamība nosaka augšējo robežu iespējamai korelācijai starp tiem (tā sauktais derīguma koeficients). Intuitīvi tas atspoguļo faktu, ka uzticamība ietver brīvību no nejaušām kļūdām un nejaušas kļūdas nav savstarpēji saistītas. Tādējādi, jo mazāk nejaušu kļūdu mainīgajos, jo lielāka iespējamā korelācija starp tiem. Saskaņā ar šīm definīcijām testam nevar būt augsts derīgums, ja vien tam nav arī augsta uzticamība. Tomēr derīguma jēdziens ir ievērojami paplašinājies, pārsniedzot šo agrīno definīciju, un klasiskajai uzticamības un derīguma saiknei nav jābūt alternatīvām uzticamības un derīguma koncepcijām. Klasiskajā testu teorijā paredzamā vai vienlaicīgā derīgums (korelācija starp prognozētāju un paredzamo) nevar pārsniegt korelācijas kvadrātsakni starp viena un tā paša pasākuma divām versijām - tas ir, ticamība ierobežo derīgumu.

Veidi [rediģēt | rediģēt avotu]

Testa derīgumu var novērtēt vairākos veidos, un rūpīga testa validācija parasti ietver vairāk nekā vienu pierādījumu rindu, kas pamato novērtēšanas metodes derīgumu (piemēram, strukturēta intervija, personības aptauja utt.). Pašreizējie Izglītības un psiholoģiskās pārbaudes standarti seko Semjuelam Mesikam, apspriežot dažāda veida derīguma pierādījumus vienam kopsavilkuma derīguma spriedumam. Tie ietver ar konstrukciju saistītus pierādījumus, ar saturu saistītus pierādījumus un ar kritērijiem saistītus pierādījumus, kas tiek sadalīti divos apakštipos (vienlaicīgi un paredzami) atbilstoši datu vākšanas laikam.

Veidojiet derīgumu pierādījumi ietver empīrisku un teorētisku atbalstu konstrukcijas interpretācijai. Šādi pierādījumi ietver testa iekšējās struktūras statistisko analīzi, ieskaitot attiecības starp atbildēm uz dažādiem testa priekšmetiem. Tie ietver arī attiecības starp testu un citu konstrukciju mērījumiem. Kā pašlaik saprotams, konstrukcijas derīgums neatšķiras no atbalsta konstrukcijas materiālajai teorijai, kuras pārbaude ir paredzēta mērīšanai. Eksperimenti, kas paredzēti, lai atklātu konstrukta cēloņsakarības aspektus, arī palīdz veidot pamatotības pierādījumus.

Satura derīgums pierādījumi ietver pakāpi, kādā testa saturs atbilst ar konstrukciju saistītam satura domēnam. Piemēram, testam par spēju pievienot divciparu skaitļus jāaptver viss ciparu kombināciju diapazons. Pārbaudei, kurā ir tikai viencipara skaitļi vai tikai pāra skaitļi, nebūtu pietiekami laba satura domēna pārklājuma. Ar saturu saistītie pierādījumi parasti ietver priekšmetu ekspertus (MVU), kas novērtē testa priekšmetus atbilstoši testa specifikācijām.

Kritēriju derīguma pierādījumi ietver korelāciju starp testu un kritērija mainīgo (vai mainīgajiem), ko uzskata par konstrukcijas reprezentatīvu. Piemēram, darbinieku atlases testi bieži tiek apstiprināti, ņemot vērā darba izpildes rādītājus. Par noziegumu notiesāto personu recidīva riska pasākumus var apstiprināt pret recidīva pasākumiem. Ja testa dati un kritēriju dati tiek savākti vienlaikus, tos sauc par vienlaicīgiem derīguma pierādījumiem. Ja testa dati tiek savākti vispirms, lai prognozētu kritēriju datus, kas savākti vēlāk, tad tos sauc par prognozējošiem derīguma pierādījumiem.

Konstruēt derīgumu [rediģēt | rediģēt avotu]

Konstrukcijas derīgums attiecas uz pierādījumu kopumu par to, vai konkrēta konstrukcijas operacionalizācija adekvāti atspoguļo to, kas ir paredzēts teorētiski, ņemot vērā izmērāmo konstrukciju. (Pierādiet, ka elements ir derīgs, saistot to ar citu it kā derīgu elementu.)

Ir divas pieejas, lai izveidotu derīgumu- dažreiz sauktas par “saplūstošu derīgumu” un “atšķirīgu derīgumu” (vai diskriminējošu derīgumu).

Konverģents derīgums [rediģēt | rediģēt avotu]

Konverģents derīgums attiecas uz pakāpi, kādā pasākums ir korelēts ar citiem rādītājiem, ar kuriem teorētiski tiek prognozēts, ka tie ir saistīti.

Diskriminanta derīgums [rediģēt | rediģēt avotu]

Diskriminējošais derīgums apraksta pakāpi, kādā operacionalizācija nav saistīta ar citām operācijām, ar kurām teorētiski nevajadzētu korelēt.

Satura derīgums [rediģēt | rediģēt avotu]

Satura derīgums ir nestatistisks derīguma veids, kas ietver “sistemātisku pārbaudes satura pārbaudi, lai noteiktu, vai tas aptver reprezentatīvu izmērāmās uzvedības jomas paraugu” (Anastasi & amp; Urbina, 1997, 114. lpp.).

Tests ir satura derīgums iebūvēts, rūpīgi izvēloties iekļaujamos vienumus (Anastasi & amp; Urbina, 1997). Vienumi tiek izvēlēti tā, lai tie atbilstu testa specifikācijai, kas sastādīta, rūpīgi pārbaudot tēmas jomu. Foxcraft u.c. (2004, 49. lpp.), Ņemiet vērā, ka, izmantojot ekspertu grupu, lai pārskatītu testa specifikācijas un priekšmetu izvēli, var uzlabot testa satura derīgumu. Eksperti varēs pārskatīt vienumus un komentēt, vai tie aptver reprezentatīvu uzvedības domēna paraugu.

Pārstāvības derīgums [rediģēt | rediģēt avotu]

Pārstāvības derīgums ir pazīstams arī kā tulkojuma derīgums.

Sejas derīgums [rediģēt | rediģēt avotu]

Sejas derīgums ir novērtējums, vai tests, šķiet, mēra noteiktu kritēriju, tas negarantē, ka tests faktiski mēra parādības šajā jomā. Patiešām, ja pārbaude tiek viltota (ļaunprātīga), zems sejas derīgums var padarīt testu derīgāku.

Sejas derīgums ir ļoti cieši saistīts ar satura derīgumu. Lai gan satura derīgums ir atkarīgs no teorētiskā pamata, lai pieņemtu, vai testā tiek vērtētas visas noteiktā kritērija jomas (piemēram, vai papildināšanas prasmju novērtēšana dod labus rezultātus matemātiskajām prasmēm? - Lai uz to atbildētu, jums jāzina, kādi dažādi aritmētikas veidi matemātiskās prasmes ietver) sejas derīgums attiecas uz to, vai tests šķiet labs rādītājs vai nē. Šis spriedums tiek pieņemts pēc testa “sejas”, tāpēc to var vērtēt arī amatieris.

Kritērija derīgums [rediģēt | rediģēt avotu]

Kritēriju derīgums atspoguļo prognozēšanai vai novērtēšanai izmantoto pasākumu panākumus. Pastāv divu veidu ar kritērijiem saistīta derīgums: vienlaicīga un paredzamā derīgums. Labs ar kritērijiem saistītas derīguma piemērs ir darbinieku atlases testu apstiprināšana, šajā gadījumā testa rezultāti vai testu kopums ir saistīti ar darbinieku darbības rādītājiem.

Vienlaicīgs derīgums [rediģēt | rediģēt avotu]

Vienlaicīgais derīgums attiecas uz pakāpi, kādā operacionalizācija korelē ar citiem tās pašas konstrukcijas mērījumiem, kas tiek mērīti vienlaikus. Atgriežoties pie atlases testa piemēra, tas nozīmētu, ka testi tiek administrēti pašreizējiem darbiniekiem un pēc tam korelē ar viņu rezultātiem sniegtajos pārskatos.

Jutīgais derīgums [rediģēt | rediģēt avotu]

Prognozētais derīgums attiecas uz pakāpi, kādā operativizācija var paredzēt (vai korelēt) ar citiem tās pašas konstrukcijas mērījumiem, kas tiek mērīti kādā brīdī nākotnē. Atkal, izmantojot atlases testa piemēru, tas nozīmētu, ka pārbaudes tiek veiktas pretendentiem, visi pretendenti tiek pieņemti darbā, viņu sniegums tiek pārskatīts vēlāk un pēc tam abu rezultātu rezultāti tiek korelēti.


Uzticamība

Uzticamība attiecas uz pasākuma konsekvenci. Psihologi apsver trīs konsekvences veidus: laika gaitā (testa atkārtotas pārbaudes ticamība), starp posteņiem (iekšējā konsekvence) un dažādiem pētniekiem (savstarpēja uzticamība).

Pārbaudes atkārtota uzticamība

Kad pētnieki mēra konstrukciju, kas, viņuprāt, ir konsekventa laika gaitā, tad iegūtajiem rādītājiem arī jābūt konsekventiem laika gaitā. Pārbaudiet atkārtotu uzticamību cik lielā mērā tas tā ir. Piemēram, parasti tiek uzskatīts, ka izlūkošana laika gaitā ir konsekventa. Cilvēks, kurš šodien ir ļoti saprātīgs, nākamajā nedēļā būs ļoti inteliģents. Tas nozīmē, ka jebkuram labam intelekta rādītājam nākamnedēļ šim indivīdam vajadzētu iegūt aptuveni tādus pašus rādītājus kā šodien. Skaidrs, ka pasākums, kas laika gaitā rada ļoti nekonsekventus rādītājus, nevar būt ļoti labs konstrukcijas mērs, kam vajadzētu būt konsekventam.

Lai novērtētu testa atkārtotas pārbaudes ticamību, mērījums jāizmanto cilvēku grupai vienlaikus, izmantojot to vēlreiz vietnē tas pats cilvēku grupu vēlāk, un pēc tam aplūkojot testa atkārtotas pārbaudes korelācija starp abiem punktu kopumiem. Tas parasti tiek darīts, apkopojot datus izkliedes diagrammā un aprēķinot Pīrsona datus r. 5.2. Attēlā parādīta korelācija starp vairāku universitāšu studentu punktu skaitu Rozenbergas pašnovērtējuma skalā, ko ievada divas reizes ar nedēļas intervālu. Pīrsona r šiem datiem ir +,95. Parasti tiek uzskatīts, ka testa atkārtotas pārbaudes korelācija +.80 vai lielāka norāda uz labu uzticamību.

5.2. Attēls. Pārbaudes atkārtota korelācija starp divu koledžas studentu rezultātu kopām Rozenbergas pašnovērtējuma skalā, ņemot vērā divas reizes nedēļā

Atkal augstām testa atkārtotas pārbaudes korelācijām ir jēga, ja tiek uzskatīts, ka izmērītā konstrukcija laika gaitā ir konsekventa, kas attiecas uz intelektu, pašcieņu un lielo piecu personības dimensijām. Bet netiek uzskatīts, ka citas konstrukcijas laika gaitā ir stabilas. Piemēram, garastāvokļa būtība ir tā, ka tā mainās. Tātad garastāvokļa rādītājs, kas mēneša laikā radīja zemu testa atkārtotas pārbaudes korelāciju, neradītu bažas.

Iekšējā konsekvence

Otrs uzticamības veids ir iekšējā konsekvence, kas ir cilvēku atbilžu konsekvence uz vienumiem, kas iekļauti vairāku vienumu pasākumā. Parasti visiem šādu pasākumu posteņiem ir jāatspoguļo viena un tā pati pamatā esošā konstrukcija, tāpēc cilvēku rādītājiem par šiem posteņiem jābūt savstarpēji saistītiem. Rozenbergas pašcieņas skalā cilvēkiem, kuri piekrīt, ka viņi ir cienīgi cilvēki, ir tendence piekrist, ka viņiem piemīt vairākas labas īpašības. Ja cilvēku atbildes uz dažādiem posteņiem nav savstarpēji saistītas, tad vairs nebūtu jēgas apgalvot, ka viņi visi mēra vienu un to pašu pamatā esošo konstrukciju. Tas attiecas uz uzvedības un fizioloģiskiem pasākumiem kā uz pašziņošanas pasākumiem. Piemēram, cilvēki var veikt likmju sēriju simulētā ruletes spēlē, lai novērtētu riska pakāpi. Šis pasākums būtu iekšēji konsekvents tiktāl, ciktāl atsevišķu dalībnieku likmes izmēģinājumos bija nemainīgi augstas vai zemas.

Tāpat kā testa atkārtotas pārbaudes uzticamību, arī iekšējo konsekvenci var novērtēt tikai, apkopojot un analizējot datus. Viena pieeja ir apskatīt a korelācija ar pusi. Tas ietver priekšmetu sadalīšanu divās kopās, piemēram, vienību pirmo un otro pusi vai vienādos un nepāra numurus. Pēc tam katrai vienību kopai tiek aprēķināts rezultāts un tiek pārbaudīta saistība starp abām punktu kopām. Piemēram, 5.3. Attēlā ir parādīta daļēja korelācija starp vairāku universitāšu studentu rezultātiem par pāra skaitļiem un to rādītājiem uz nepāra numuriem Rozenbergas pašcieņas skalā. Pīrsons r šiem datiem ir +.88. Pusei korelācija +.80 vai lielāka parasti tiek uzskatīta par labu iekšējo konsekvenci.

5.3. Attēls. Sadalīta puse korelācija starp vairākiem koledžas studentu rezultātiem par pāra numuriem un to rādītājiem par Rozenbergas pašcieņas skalas nepāra numuriem

Varbūt visizplatītākais psiholoģijas pētnieku izmantotais iekšējās konsekvences rādītājs ir statistika Kronbaha α (grieķu burts alfa). Konceptuāli α ir visu iespējamo vienību kopuma puskorelāciju vidējais lielums. Piemēram, ir 252 veidi, kā sadalīt 10 priekšmetu kopu divās piecās kopās. Kronbaha α būtu vidējais no 252 dalītās puses korelācijām. Ņemiet vērā, ka α faktiski netiek aprēķināts, bet tas ir pareizs veids, kā interpretēt šīs statistikas nozīmi. Atkal parasti tiek ņemta vērtība +.80 vai lielāka, lai norādītu uz labu iekšējo konsekvenci.

Interrater uzticamība

Daudzi uzvedības pasākumi ietver ievērojamu novērotāja vai vērtētāja spriedumu. Starpvērtētāju uzticamība ir tas, cik lielā mērā dažādi novērotāji savos spriedumos ir konsekventi. Piemēram, ja jūs interesētu mērīt universitātes studentu sociālās prasmes, jūs varētu uzņemt videoierakstus, kad viņi mijiedarbojas ar citu studentu, ar kuru viņi tiekas pirmo reizi. Tad jūs varētu likt diviem vai vairākiem novērotājiem skatīties videoklipus un novērtēt katra studenta sociālo prasmju līmeni. Ciktāl katram dalībniekam patiesībā ir zināms sociālo prasmju līmenis, ko var konstatēt uzmanīgs novērotājs, dažādu novērotāju vērtējumiem jābūt savstarpēji cieši saistītiem. Starpvērtētāju uzticamība būtu mērīta arī Bandura Bobo lelles pētījumā. Šajā gadījumā novērotāju vērtējumiem par to, cik agresijas darbību konkrēts bērns izdarīja, spēlējoties ar Bobo lelli, vajadzēja būt ļoti pozitīvi korelētai. Interrater uzticamību bieži novērtē, izmantojot Kronbaha α, ja spriedumi ir kvantitatīvi vai līdzīga statistika, ko sauc par Koena κ (grieķu burts kappa), ja tie ir kategoriski.


Kas ir vienlaicīgais derīgums? (Definīcija un#038 piemēri)

Statistikā mūs bieži interesē saprast, vai kāda paskaidrojošā mainīgā vērtība var paredzēt kāda atbildes mainīgā vērtību. Šo atbildes mainīgo dažreiz sauc par kritērija mainīgo.

Piemēram, mēs varētu vēlēties uzzināt, cik labi kāds iestājeksāmens koledžā spēj paredzēt studentu vidējo atzīmes punktu skaitu.

Iestājpārbaudījums būtu skaidrojošais mainīgais, un kritērija mainīgais būtu pirmā pusgada GPA.

Mēs vēlamies zināt, vai tā ir derīgs izmantot šo skaidrojošo mainīgo kā veidu, kā prognozēt kritērija mainīgo. Ja tas ir derīgs, tad mēs sakām, ka kritērija derīgums pastāv.

Pastāv divu veidu kritēriju derīgums:

1. Prognozējošais derīgums – This tells us if it’s valid to use the value of one variable to predict the value of some other variable in the future.

2. Concurrent Validity – This tells us if it’s valid to use the value of one variable to predict the value of some other variable measured concurrently (i.e. at the same time).

For example, a company might administer some type of test to see if the scores on the test are correlated with current employee productivity levels.

The benefit of this approach is that we don’t have to wait until some point in the future to take a measurement on the criterion variable we’re interested in.

Note that we usually measure both types of validity using the Pearson Correlation Coefficient, which takes on value between -1 and 1 where:

  • -1 indicates a perfectly negative linear correlation between two variables
  • 0 indicates no linear correlation between two variables
  • 1 indicates a perfectly positive linear correlation between two variables

The further away the correlation coefficient is from zero, the stronger the association between the two variables.

Examples of Concurrent Validity

The following examples illustrate more scenarios in which we can use concurrent validity to determine whether or not some explanatory variable can be used to predict the value of some criterion variable.

Example 1: A Test of Knowledge

A researcher creates a new test that is designed to assess the knowledge of college students in the subject of biology.

The researcher gives out the test to all biology majors at a certain university and compares the scores of his test with their current GPA.

If there is a high correlation between th e grades on his test and the current GPA of the students, we can say that concurrent validity exists.

Example 2: A Test of Endurance

A track coach creates a new endurance challenge that is designed to assess the endurance levels of his athletes. He lets each of his athletes perform the challenge and compares their scores to their current performance levels.

If there is a high correlation between the endurance challenge and the current performance levels, then he can say that concurrent validity exists.

In other words, it would be valid to use the endurance challenge to assess the performance levels of the athletes.

Example 3: A Test of Leadership

A business executive creates a new test to assess the leadership ability of employees at a company. She gives out the test to each employee at a company and compares their scores to current peer-assessed levels of leadership.

If there is a high correlation between the test and current peer-assessed levels of leadership, then she can say that concurrent validity exists.

In other words, it would be valid to use the test to assess leadership levels of the various employees at the company.


Further evaluation of the construct, convergent and criterion validity of the Gambling Urge Scale with university-student gamblers

Fons: Research has documented the prevalence of problem gambling among university students, and craving is one factor that may provoke and maintain episodes of gambling.

Mērķi: We designed this study to assess elements of construct, convergent and criterion validity of the Gambling Urge Scale (GUS) when administered to regularly gambling university students.

Methods: Students (n = 250) recruited from three universities during the spring semester, 2012, were randomly assigned to one of four conditions to test the impact of cue exposure to one of two types of stimuli (gambling versus non-gambling activity), and two types of presentation format (photographic versus imagery scripts), on current craving to gamble.

Rezultāti: Self-reported craving increased significantly following exposure to gambling cues, but not following exposure to engaging non-gambling cues, regardless of the format by which cues were presented. Among those exposed to gambling cues, GUS craving scores were significantly correlated with all three subscales of another measure of craving to gamble, gambling-related problems, passionate attachment to gambling, distorted gambling beliefs and gambling refusal self-efficacy.

Secinājumi: These findings provide further support for the construct, convergent and criterion validity of the GUS as a measure of subjective craving in university student gamblers.