信度

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

信度系指測(cè)驗(yàn)結(jié)果的一致性、穩(wěn)定性及可靠性,一般多以內(nèi)部一致性來(lái)加以表示該測(cè)驗(yàn)信度的高低。信度系數(shù)愈高即表示該測(cè)驗(yàn)的結(jié)果愈一致、穩(wěn)定與可靠。系統(tǒng)誤差對(duì)信度沒(méi)什么影響,因?yàn)橄到y(tǒng)誤差總是以相同的方式影響測(cè)量值的,因此不會(huì)造成不一致性。反之,隨機(jī)誤差可能導(dǎo)致不致性,從而降低信度。信度可以定義為隨機(jī)誤差R影響測(cè)量值的程度。如果R=0,就認(rèn)為測(cè)量是完全可信的,信度最高。

目錄

信度的定義

信度主要是指測(cè)量結(jié)果的可靠性、一致性和穩(wěn)定性,即測(cè)驗(yàn)結(jié)果是否反映了被測(cè)者的穩(wěn)定的、一貫性的真實(shí)特征。和信度相關(guān)的一個(gè)概念是效度,信度是效度的前提條件。

信度只受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。因此,信度可以視為測(cè)試結(jié)果受隨機(jī)誤差影響的程度。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。

每一個(gè)測(cè)試的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E)兩部分構(gòu)成的,用公式表示如下:

X=T+E

如果我們討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差代表具體分?jǐn)?shù),得到公式:

S^2(x)=S^2(t)+S^2(e)

公式中,S^2(x)是實(shí)得分?jǐn)?shù)的方差,S^2(t)是真分?jǐn)?shù)的方差,S^2(e)是誤差的方差

在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與中方差(實(shí)得方差)的比率。即:

r(xx)=S^2(t)/S^2(x)

由于真實(shí)分?jǐn)?shù)的方差是無(wú)法統(tǒng)計(jì)的,因此轉(zhuǎn)化為:

r(xx)=S^2(x)-S^2(e)/S^2(x)

=1-S^2(e)/S^2(x)

因此,信度也可以看做是總方差中非測(cè)量誤差的方差所占的比例  

信度的指標(biāo)

一、信度系數(shù)與信度指數(shù)

大部分情況下,信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所得到的兩組資料的相關(guān),理論上說(shuō)就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)方差的比值,公式為:

r(xx)=r^2(xt)=S^2(t)/S^2(x)

公式中r^2(xt)是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比值,稱作信度系數(shù),公式為:

r(xt)=S(t)/S(x)

可見信度指數(shù)的平方就是信度系數(shù)。

二、測(cè)量標(biāo)準(zhǔn)誤

信度系數(shù)僅表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒(méi)有直接指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。我們可以用一組被試兩次測(cè)量結(jié)果來(lái)代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了信度的另一個(gè)指標(biāo),公式為:

SE=S(x)√1-r(xx)

公式中SE為測(cè)量的標(biāo)準(zhǔn)誤,S(x)是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,r(xx)為測(cè)驗(yàn)的信度系數(shù),從公式我們可以看出測(cè)量的標(biāo)準(zhǔn)誤與信度之間有互為消長(zhǎng)的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越小,信度越低,標(biāo)準(zhǔn)誤越大?! ?/p>

影響信度的因素

一、樣本特征

1、樣本團(tuán)體異質(zhì)性的影響

2、樣本團(tuán)體的平均能力水平的影響

二、測(cè)量長(zhǎng)度

一般來(lái)說(shuō),在一個(gè)測(cè)試中增加同質(zhì)的題目,可以使信度提高。

需注意的是,增加測(cè)驗(yàn)長(zhǎng)度的效果應(yīng)當(dāng)遵循報(bào)酬遞減原則。通過(guò)斯皮爾曼-布朗公式的導(dǎo)出公式可以計(jì)算出最少應(yīng)增加的題目:

K=r(kk)*(1-r(xx))/r(xx)*(r(kk)-1)

K為改變后的長(zhǎng)度與原長(zhǎng)度之比,r(xx)為原測(cè)試的信度,r(kk)為測(cè)驗(yàn)長(zhǎng)度是原來(lái)的K倍時(shí)的信度估計(jì)。

三、測(cè)驗(yàn)難度

理論上說(shuō),只有測(cè)驗(yàn)難度為50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。事實(shí)上,難度為0.50只適合于簡(jiǎn)答型題目,對(duì)于選擇題目由于猜測(cè)因素,難度值應(yīng)當(dāng)提高,洛德提出在學(xué)習(xí)成績(jī)中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測(cè),0.70;四擇一測(cè),0.74;三擇一測(cè),0.77;是非題。0.85

在實(shí)際情況下,如果某個(gè)測(cè)驗(yàn)適用范圍廣,其難度水平通常適用于中等能力水平的被試,而對(duì)較高水平的被試和較低水平的被試可能較易或較難,使得分?jǐn)?shù)分布范圍縮小,信度水平降低,因此一個(gè)標(biāo)準(zhǔn)化的測(cè)驗(yàn),應(yīng)根據(jù)不同能力水平的報(bào)告測(cè)驗(yàn)的難度,以作為選擇測(cè)驗(yàn)的參考

四、時(shí)間間隔

時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量時(shí)的復(fù)本信度有影響,對(duì)其余的信度來(lái)說(shuō),不存在時(shí)間間隔問(wèn)題。

注:我們對(duì)一套問(wèn)卷的信度檢驗(yàn)值(一般是指克隆巴赫阿爾法信度系數(shù))有時(shí)會(huì)出現(xiàn)過(guò)低的情況,可能的原因有:

1、試卷本身設(shè)計(jì)不合理,不是圍繞一個(gè)主題或是有矛盾的題目。如果試卷中有題目讓完全相同的人選擇不同的答案,試卷的信度會(huì)降低。

2、題目區(qū)分度過(guò)低,特別指有對(duì)錯(cuò)之分的題目。如果一道題正確率或錯(cuò)誤率達(dá)到90%,可以從新審視題目設(shè)計(jì)是否合理。區(qū)分度過(guò)低的題目中真實(shí)偏差的成分較少,隨機(jī)偏差的成分相對(duì)較多,試卷的信度會(huì)降低。

3、無(wú)關(guān)變量進(jìn)入信度檢驗(yàn)。除了重測(cè)信度,其他信度檢驗(yàn)方法都只考慮有序變量,無(wú)序變量,如出身城市,喜好顏色等,如果我們沒(méi)有對(duì)城市或顏色排序的話,帶入信度檢驗(yàn)意義難明,可能會(huì)導(dǎo)致試卷的信度降低。

4、題目選項(xiàng)反序。對(duì)有序變量,如果變量值之間序的意義相反,會(huì)降低甚至得出負(fù)的信度。比如檢驗(yàn)老師對(duì)學(xué)生評(píng)分的信度,如果一個(gè)老師的評(píng)分以10分為最高分,1分最低,另一個(gè)以1分最高,10分最低。如果不經(jīng)處理帶入信度計(jì)算,信度會(huì)降低。  

信度評(píng)估的方法

一、重測(cè)信度,又稱為穩(wěn)定性系數(shù),它的計(jì)量方法是采用重測(cè)法:用同一測(cè)驗(yàn),在不同時(shí)間對(duì)同一群體施測(cè)兩次,這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。

重測(cè)信度所考察的誤差來(lái)源是時(shí)間的變化所帶來(lái)的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí),必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn),重測(cè)間隔在兩周到6個(gè)月間比較合適。

在進(jìn)行重測(cè)信度的評(píng)估時(shí),還應(yīng)注意以下兩個(gè)重要問(wèn)題:⑴重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化,而不反映被試行為的長(zhǎng)久變化。⑵不同的行為受隨機(jī)誤差影響不同。

二、復(fù)本信度,是以兩個(gè)測(cè)驗(yàn)復(fù)本來(lái)測(cè)量同一群體,然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。

計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。

復(fù)本信度的主要優(yōu)點(diǎn)在于:⑴能夠避免重測(cè)信度的一些問(wèn)題,如記憶效果、練習(xí)效應(yīng)等;⑵適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響;⑶減少了輔導(dǎo)或作弊的可能性?!顝?fù)本信度的局限性在于:⑴如果測(cè)量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能消除這種影響;⑵有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變;⑶有些測(cè)驗(yàn)很難找到合適的復(fù)本。

三、內(nèi)部一致性信度,主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系,考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度同質(zhì)性信度。

分半信度系數(shù)是通過(guò)將測(cè)驗(yàn)分成兩半,計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng),信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí),即使各個(gè)測(cè)試題看起來(lái)似乎是測(cè)量同一特質(zhì),但測(cè)驗(yàn)實(shí)際上是異質(zhì)的,即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似。

四、評(píng)分者信度,是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷,由兩個(gè)獨(dú)立的評(píng)分者打分,再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級(jí)相關(guān)方法。

=  

信度 評(píng)介方法

信度

一般通過(guò)使用同一量表進(jìn)行不同測(cè)量,分析各測(cè)量結(jié)果之間聯(lián)系的方法來(lái)評(píng)價(jià)信度。如果聯(lián)系密切,各測(cè)量結(jié)果具有一致性,則認(rèn)為量表是可信的。評(píng)介信度的方法主要有:再預(yù)測(cè)量、替換形式、內(nèi)部一致性方法。

再測(cè)信度

用同樣的量表,對(duì)同一組訪問(wèn)對(duì)象在盡可量相同的情況下,在不同的時(shí)間進(jìn)行兩次測(cè)量。兩次測(cè)量相距一般在兩到四周之間。用兩次測(cè)量結(jié)果間的相關(guān)分析或差異的顯著性檢驗(yàn)方法,可以評(píng)價(jià)量表信度的高低。結(jié)果越是相關(guān),差異越不顯著則信度越高。 用再次測(cè)量法評(píng)價(jià)信度存在一些問(wèn)題。結(jié)果與時(shí)間間隔關(guān)系密切。在其他方面都相同的情況下,時(shí)間間隔越長(zhǎng),信度越低。其次,最初的測(cè)量可能會(huì)改變被測(cè)特征。例如,測(cè)量人們對(duì)低脂肪食品的態(tài)度可能會(huì)使他們更為關(guān)心健康問(wèn)題,從而對(duì)低脂食品持更為肯定的態(tài)度。第一,實(shí)施重復(fù)測(cè)量有時(shí)是不可能的,例如測(cè)量消費(fèi)者對(duì)某種新產(chǎn)品的反應(yīng)。第二,第一次測(cè)量的答案可能會(huì)對(duì)以后測(cè)量有影響。受訪者可能會(huì)圖回憶第一次受測(cè)時(shí)給出的答案。第三,在兩次測(cè)量之間一個(gè)有利的信息可能會(huì)使受訪者的態(tài)度更為有利。最后,再測(cè)信度的相關(guān)系數(shù)可能會(huì)由于被測(cè)項(xiàng)目自身之間的相關(guān)而偏高。兩次測(cè)量中,同一項(xiàng)目自身之間的相關(guān)性要比不同項(xiàng)目間的相關(guān)性高。因此,即使不同項(xiàng)目之間的相關(guān)性很差,也可能得以很高的再測(cè)相關(guān)系數(shù)。

替換形式信度

用兩個(gè)形式不同的等價(jià)量表,對(duì)同一組受訪者在不同的時(shí)間(通常間隔兩到四周)進(jìn)行測(cè)量。兩次測(cè)量結(jié)果間的相關(guān)性被用來(lái)評(píng)價(jià)量表的信度。

這個(gè)方法存在兩個(gè)主要問(wèn)題。首先,構(gòu)造等價(jià)的量表不但費(fèi)時(shí),而且花錢。其次,很難構(gòu)造出完全等價(jià)的量表。兩個(gè)量表在內(nèi)容上應(yīng)該等價(jià)。從嚴(yán)格的意義上說(shuō),兩個(gè)量表的測(cè)量項(xiàng)目應(yīng)具有相同的均值、方差和相關(guān)性,但即使這些條件都滿足了,還是有可能出現(xiàn)內(nèi)容不等價(jià)的情況。低相關(guān)可能是量表的信度不夠造成的,也可能是由于量表形式不等價(jià)而造成的。

內(nèi)部一致信度

內(nèi)部一致信度用于評(píng)價(jià)累加量表的信度。在這種量表中,各個(gè)測(cè)量項(xiàng)目的得分被累加以得到一個(gè)總分,每個(gè)項(xiàng)目都測(cè)量整個(gè)量表所要測(cè)量對(duì)象的某個(gè)方面,項(xiàng)目之間就它們各自的特征而言應(yīng)該是一致的。內(nèi)部一致信度強(qiáng)調(diào)的是組成量表的一組測(cè)量項(xiàng)目?jī)?nèi)部的一致性。

折半信度是測(cè)量?jī)?nèi)部一致性是簡(jiǎn)單的方法。量表中的項(xiàng)目被分成兩半并計(jì)算測(cè)量結(jié)果的相關(guān)系數(shù)。這兩半相關(guān)系數(shù)高,則說(shuō)明量表內(nèi)部一致性高。量表的項(xiàng)目可按序號(hào)的奇、性分為兩半,也可以隨機(jī)地合。問(wèn)題在于劃分兩部分的方法可能會(huì)影響到評(píng)價(jià)結(jié)果??朔@一問(wèn)題的常用方法是采用X系數(shù)。

X系數(shù),也稱為克朗巴哈X系數(shù),是量表所有可能的項(xiàng)目劃分方法的得到的折半信度系數(shù)的平均值。X系數(shù)的值在0和1之間。如果X系數(shù)不超過(guò)0.6,一般認(rèn)為內(nèi)部一致信度不足。X系數(shù)的一個(gè)重要特性是它們值會(huì)隨著量表項(xiàng)目的增加而增加。因此,X系數(shù)可能由于量表中包含多余的測(cè)量項(xiàng)目而被人為地、不適當(dāng)?shù)靥岣?。還有一種可以和X系數(shù)同時(shí)使用的系數(shù)。系數(shù)能夠幫助評(píng)價(jià),在計(jì)算X系數(shù)的過(guò)程中,平均數(shù)的計(jì)算是否掩蓋了某些不相關(guān)的測(cè)量項(xiàng)目。

有些具有多個(gè)項(xiàng)目的量表可能在結(jié)構(gòu)上是多維的,那含有幾組,每一組項(xiàng)目測(cè)量一個(gè)方面的特征。例如,商店的形象就是一種多維的結(jié)構(gòu),包括商品的、商品的花色種類、貨與保修政策、人員服務(wù)、價(jià)格、商店位置、店面局等等。用于測(cè)量商店形象的量表就要包括測(cè)量以上每個(gè)維度(方面)的測(cè)量項(xiàng)目。這些維度之間是比較獨(dú)立的,因此,在包含各個(gè)準(zhǔn)度的整個(gè)表內(nèi)部考察一致性是不適宜的。不過(guò),如果每個(gè)準(zhǔn)度是由幾個(gè)測(cè)量項(xiàng)目組成,可以計(jì)算每個(gè)度的內(nèi)部一致性?! ?/p>

信度 效度和信度

信度

效度和信度的關(guān)系可以用測(cè)量值的構(gòu)成公式O=T S R來(lái)理解。如果測(cè)量是完全有效的,即0=T,S=0,R=0,此時(shí)測(cè)量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因?yàn)橛蠴=T R。如果量表是完全可信的,可以達(dá)到完全有效,也可能達(dá)不到,因?yàn)橛锌赡艽嬖趯?dǎo)致誤差,雖然缺管信度必然缺乏效度,但信度的大小并不能體現(xiàn)效度的大小。信度是效度的必要條件,但不是充分條件。從理論的角度來(lái)看,量應(yīng)具有足夠的效度和信度;從實(shí)踐的觀點(diǎn)來(lái)看,一個(gè)好的量表還應(yīng)該具有實(shí)用性。實(shí)用性指量表的經(jīng)濟(jì)性、便利性和可解釋性?! ?/p>

信度 分析

信度

信度是指一個(gè)衡量的正確性或精確性,信度包括穩(wěn)定性以及一致性;學(xué)者 Kerlinger認(rèn)為信度可以衡量出工具(問(wèn)卷)的可靠度、一致性與穩(wěn)定性。

測(cè)驗(yàn)信度越高,表示測(cè)驗(yàn)結(jié)果越可信,但也無(wú)法期望兩次測(cè)驗(yàn)結(jié)果完全一致,信度除受測(cè)驗(yàn)質(zhì)量影響外,亦受很多其它受測(cè)者因素的影響,故沒(méi)有一份測(cè)驗(yàn)是完全可靠的。信度只是一種程度上大小的差別而已。一致性高的問(wèn)卷便是只同一群人接受性質(zhì)相同題型相同目的相同的各種問(wèn)卷測(cè)量后,在各衡量結(jié)果間顯示出強(qiáng)烈的正相關(guān)。穩(wěn)定性高的測(cè)量工具則是指一群人在不同時(shí)空下接受同樣的衡量工具時(shí),結(jié)果的差異很小。一般信度的測(cè)量時(shí)容易產(chǎn)生誤差的原因,是來(lái)自研究者的因素包括:測(cè)量?jī)?nèi)容(遣詞用句、問(wèn)題形式等)不當(dāng)、情境(時(shí)間長(zhǎng)短、氣氛、前言說(shuō)明等)以及研究者本身的疏忽(聽錯(cuò)、記錯(cuò)等);而來(lái)自受訪者的因素則可能是由于其個(gè)性、年齡、教育程度、社會(huì)階層及其它心理因素等,而影響其答題的正確性。

檢視信度的方法有很多種,其中,最常用的是第四種 Cronbach α系數(shù),簡(jiǎn)介以下四種:

1、再測(cè)法:使用同一份問(wèn)卷,對(duì)同一群受測(cè)者,在不同的時(shí)間,前后測(cè)試兩次,求出者兩次分?jǐn)?shù)的相關(guān)系數(shù),此系數(shù)又稱為穩(wěn)定系數(shù)。

需注意:相關(guān)系數(shù)高,表示此測(cè)驗(yàn)的信度高,前后兩次測(cè)驗(yàn)間隔的時(shí)間要適當(dāng)。若兩次測(cè)驗(yàn)間隔太短,受測(cè)者記憶猶新通常分?jǐn)?shù)會(huì)提高,不過(guò)如果題數(shù)夠多則可避免這種影響;但若兩次測(cè)驗(yàn)間隔太長(zhǎng),受測(cè)者心智成長(zhǎng)影響,穩(wěn)定系數(shù)也可能會(huì)降低。

2、復(fù)本相關(guān)法:復(fù)本是內(nèi)容相似,難易度相當(dāng)?shù)膬煞轀y(cè)驗(yàn),對(duì)同一群受測(cè)者,第一次用甲份測(cè)試,第二次使用乙份,兩份分?jǐn)?shù)的相關(guān)系數(shù)為復(fù)本系數(shù)或等值系數(shù)。若兩份測(cè)驗(yàn)不是同時(shí)實(shí)施,亦可相距一段時(shí)間再施測(cè),這樣算出的相關(guān)系數(shù)為穩(wěn)定和等值系數(shù)。復(fù)本相關(guān)法是測(cè)驗(yàn)信度量測(cè)的一種最好方法,但是要編制復(fù)本測(cè)驗(yàn)相當(dāng)困難。而且復(fù)本相關(guān)法并不受記憶效用的影響,對(duì)測(cè)量誤差的相關(guān)性也比再測(cè)法低。

3、折半法:與復(fù)本相關(guān)法很類似,折半法是在同一時(shí)間施測(cè),最好能對(duì)兩半問(wèn)題的內(nèi)容性質(zhì)、難易度加以考慮,使兩半的問(wèn)題盡可能有一致性。

折半信度系數(shù):將同一量表中測(cè)驗(yàn)題目(項(xiàng)目?jī)?nèi)容相似),折成兩半(單數(shù)題、偶數(shù)題),求這兩個(gè)各半測(cè)驗(yàn)總分之相關(guān)系數(shù)。

4、柯能畢曲α系數(shù):1951年Cronbach提出α系數(shù),克服部分折半法的缺點(diǎn),為目前社會(huì)科學(xué)研究最常使用的信度。量測(cè)一組同義或平行測(cè)驗(yàn)總和的信度,如果尺度中的所有項(xiàng)目都在反映相同的特質(zhì),則各項(xiàng)目之間應(yīng)具有真實(shí)的相關(guān)存在。若某一項(xiàng)目和尺度中其它項(xiàng)目之間并無(wú)相關(guān)存在,就表示該項(xiàng)目不屬于該尺度,而應(yīng)將之剔除。只要有做問(wèn)卷就可以做信度分析,提供各項(xiàng)客觀的指標(biāo),作為測(cè)驗(yàn)與量表良窳程度的具體證據(jù)?! ?/p>

信度 測(cè)試信度

信度

測(cè)試信度也叫測(cè)試的可靠性,指的是測(cè)試結(jié)果是否穩(wěn)定可靠。也就是說(shuō),測(cè)試的成績(jī)是不是反映了受試者的實(shí)際語(yǔ)言水平。例如,如果同一套測(cè)試在對(duì)同一測(cè)試對(duì)象(即受試者本身沒(méi)有變化)進(jìn)行的數(shù)次測(cè)試中,受試者的分?jǐn)?shù)忽高忽低的話,則說(shuō)明該測(cè)試缺乏信度。測(cè)試的信度與測(cè)試的效度有著密切的關(guān)系。一般說(shuō)來(lái),只有信度較高的測(cè)試才能有較高的效度,但效度較高不能保證信度也一定較高。測(cè)試的信度主要涉及到試題本身的可靠性和評(píng)分的可靠性這兩個(gè)方面。試題本身是否可靠主要取決于試題的范圍、數(shù)量、試題的區(qū)分度等因素;評(píng)分是否可靠則要看評(píng)分標(biāo)準(zhǔn)是否客觀和準(zhǔn)確。

測(cè)試的信度通常用一種相關(guān)系數(shù)(即兩個(gè)數(shù)之間的比例關(guān)系)來(lái)表示,相關(guān)系數(shù)越大,信度則越高。當(dāng)系數(shù)為1.00時(shí),說(shuō)明測(cè)試的可靠性達(dá)到最高程度;而系數(shù)是0.00時(shí),則測(cè)試的可靠性降到最低程度。在一般情況下,系數(shù)不會(huì)高到1.00,也不會(huì)降到0.00,而是在兩者之間。對(duì)信度指數(shù)的要求因測(cè)試類別的不同而不同,人們通常對(duì)標(biāo)準(zhǔn)化測(cè)試的信度系數(shù)要求在0.90以上,例如“托?!钡男哦却笾聻?.95,而課堂測(cè)試的信度系數(shù)則以0.70-0.80之間為可接受性系數(shù)。測(cè)試信度的計(jì)算方法有很多種,以下僅介紹三種易于操作的方法:

1)重測(cè)法。用同一套試卷在兩個(gè)不同時(shí)間內(nèi)來(lái)測(cè)試同一批受試者,這樣便獲得兩組分?jǐn)?shù),然后計(jì)算出兩組分?jǐn)?shù)的相關(guān)系數(shù)。當(dāng)然,在兩次測(cè)試中,學(xué)生第二次的測(cè)試成績(jī)理應(yīng)比第一次的要高,因?yàn)樵诘诙螠y(cè)試時(shí)學(xué)生已經(jīng)有了進(jìn)步而且臨場(chǎng)經(jīng)驗(yàn)也更豐富了。但是若該試題是比較可靠的,每個(gè)學(xué)生在兩次測(cè)試中的排名次序應(yīng)該是基本不變的。

2)交替形式法。對(duì)同一批受試者使用試題類型完全相同,難易程度相當(dāng),但具體題目不同的兩套對(duì)等試卷先后進(jìn)行兩次測(cè)試,然后計(jì)算出兩次得分的相關(guān)系數(shù)。

3)對(duì)半法。測(cè)試只進(jìn)行一次,但將整份試卷的題目按單、雙數(shù)分成兩組來(lái)分別計(jì)分,算出兩組分?jǐn)?shù)的相關(guān)系數(shù),然后再用Spearman-Brown的公式計(jì)算整份試卷的信度系數(shù)。具體計(jì)算步驟是:將兩組分?jǐn)?shù)的相關(guān)系數(shù)乘以2,再除以1加兩組分?jǐn)?shù)的相關(guān)系數(shù)。

關(guān)于“信度”的留言: Feed-icon.png 訂閱討論RSS

目前暫無(wú)留言

添加留言

更多醫(yī)學(xué)百科條目

個(gè)人工具
名字空間
動(dòng)作
導(dǎo)航
推薦工具
功能菜單
工具箱