歡迎各位來到多質多法模型(multitrait-multimethod), 傳統上multitrait-multimethod是心理學中敍述validity效度時使用 例如我們有五種方法 我們用五種方法:家長、教師、學生、紙筆測驗、專題報告 測試學生五種能力:創造力、美術技巧、數學能力、語文能力和科學知識 每個學生有25個得分 例如測量學生的創造力時, 我們從五個途徑得到相關分數 即是從家長、教師、學生、紙筆測驗、專題報告中取得相關分數 五種能力有五個評分, 所以每個學生有25個得分。 我們應如何做分析? 有兩個普及方法。 第一個就是相關特質相關方法 (correlated-trait correlated-method) 圖中顯示學生的25個分數和因子之間的關係 每個學生有25個分數, 1-5量度學生的創造力, 所以屬於同類的分數 亦可以說它們被同一個因子影響 如果學生創造力高 他可能在這五個分數都有較高得分。 同樣6-10量度學生的美術能力 如果學生美術能力高, 他這五個分數都可能較高 如果學生美術能力低, 他這五個分數都可能較低 其他的分數都一樣。 所以這研究可以分為五大類分數, 但1,6,11,16,21都是由家長評分 家長評分時有可能出現偏袒 例如一個分數評得高時,其他都評高; 另一個分數評得低時,其他都評低 那位家長對那位學生的分數可能有一個影響/偏見/效果存在 同樣教師亦有一個效果, 即是因為1,6,11,16,21的分數都由家長評分 如果家長有效應(偏見)存在, 這五個分都可能跟現實有差距 即是家長對這五個分數有同一個效應, 這五個分數屬於同一個因子 這五個分數受同一個因子影響, 正如學生的創造力的分數都受同一個因子影響 我們再看看這25個分數的結構: 1-5屬於第一類分數、6-10另一類 11-15第三類、16-20第四類、21-25第五類; 所以我們有五個因子,這是較容易明白的 因為它們正在測量五種能力, 但第1,6,11,16,21都是由家長評分 所以從另一角度考慮, 都是同一類分數,受同一個因子影響 同樣道理教師對五個分數亦有影響, 學生亦對五個分數有影響 紙筆測驗,只要是同類測驗都會有類似的影響, 專題研習都一樣 所以25個分數內的每一個分, 都有兩個來源影響它 第一個就是能力因子的影響, 第二個就是方法因子的影響 螢幕顯示的就是另一種表達數據關係的方法。 我們有25個分數 第一個創造力受兩個因子影響: 一個是學生的創造力 第二個是家長的評分, 所以被家長這個因子影響 因此25個分數內, 每一個分都有兩個影響來源來影響它 而這五個能力因子如創造力、美術能力、數學等因子是互相有關連 這是我們的假設,我們畫出來的模型 另外我們亦假設那些評分方法是有相關的 我們可以在模型中畫一些雙向箭咀來描述這兩組之間的相關 這就是其中一個處理multi-trait multi-method多質多法矩陣的傳統方法 有些時候,這五個方法之間的相關會被刪去 換句說話,圖中左邊五個能力存在五個相關路徑 五個因子之間有弧形的相關路徑 但右邊的弧形相關全被刪去, 這種方式亦是常見的 我們可以比較這兩種方法, 哪一個的吻合指數較高 我們可以怎樣分析這個數據, 怎樣把剛才的寫成指令讓LISREL分析? 以下就是分析方法 第一句DA NI=25即是每個受試者有25個分數 NO是受試者數目, 範例的研究招募了500位學生作受試者 我們希望LISREL用correlation來分析 MA等於KM表示用相關矩陣作分析 然後把相關矩陣(25 x 25)的一半輸入電腦, 所以指令是KM SY 如果我們輸入整個矩陣,指令就是KM FU, 那就需要輸入一個正方形的完整矩陣 為方便示範,我們沒有輸入整個相關矩陣; 假設我們已經輸入整個相關矩陣 接下來就是模型指令MO statement (model statement) NX = 25 因為每個受試者有25個答案(觀察變量); NK = 10 代表研究用10式個因子 PH = SY, FI 接下來我們還是會用式樣PA statement重新定義整個PH 所以這兒PH的預設值可以隨意一點 而LX可以不被預設, 這樣電腦就有個缺省定義(完整、固定full fix) 這可參考螢幕中的數值,就是對矩陣的重新定義 TD=DI,FR 傳統上TD被設為對角、自由diagonal free PA LX 代表重新定義LX, 在此用式樣指令PA statement 切記1代表自由估計,0代表固定, 內裡並沒有任何數值 1代表自由就是自由估計, 0代表固定就是無需估計以及預設數值爲零 這兒的1只代表自由估計,而非一個數值 參考第一題,它從屬兩個因子; 既屬於第一個因子,又屬於第六個因子 為甚麽是第六個因子? 每個因子都預設的一個編碼, 編碼設定後就不要改任何改變 在整個程式內都不會改動任何編碼 例如左邊有五個編碼為1,2,3,4,5, 代表五個能力因子, 右邊的方法因子就是6,7,8,9,10 這樣第一題就從屬於第一個和第六個因子, 第二題就從屬於第一個和第七個因子 如此類推, 第六題屬於第二個能力因子 因此編程就是0 1 0 0 0...; 另外它亦屬於第一個方法因子 (第6號因子) 因此編程就是0 1 0 0 0 1 0 0 0 0, 如此類推 最後就是固定LX; 剛才做的是方便我們理解 如果我們用固定負荷的方法, 每個因子要選擇一個題目固定為1 例如第1號因子(能力因子), 先找出第一個指標LX 1 1作固定 切記固定後我們要給予一個數值 鑒於前面只想集中於一個系統化的pattern, 前面並沒有提及這預設數值和固定位置 所以所有相關的負荷都被設為自由, 到現在才固定下來 我們亦可以在前面PA LX的矩陣內, 把位置固定並設為0 就可以省卻如今的FI 固定指令fix statement 在初學時為方便清晰, 還是先有系統規律地寫下從屬關係 並把所有位置設為自由估計, 事後才用fix statement逐個固定下來 FI LX 1 1 LX 7 2, LX 7 2 是選擇第二個因子內的第七題來固定 LX 13 3 就是固定第三個因子內的第13題, 就是這樣固定每個因子內的其中一題 第六個因子就是方法因子, 同樣要選擇一題來固定, 範例選擇了第六題 因為第六題從屬第一個方法因子(編號第6個因子) 即是在第一個方法因子內選擇了第六題來固定 第二個方法因子即編號第七個因子 LX 12 7則固定第12題(為第第七個因子定測量單位), 其它的都一樣 固定後要設定數值為1 因為不設定數值,電腦就會預設他們為0, 所以固定後要設定數值為1 接著是PA PH; PA是pattern,PH是因子之間的相關, 因子之間的協方差 剛才提及PH的內容, 其實可以隨便一點 因為這步驟需要重新定義PH, 所以MO內的PH可以隨意編寫 範例中首五個是能力因子, 假設它們都可以互有相關, 對角線以外就全都是1 另外因為我們正使用固定負荷的方法, 所以PH的方差variance可以自由估計 除非使用的是固定方差法, 否則PH的對角線全都可以被自由估計 但如果使用的是固定方差法, PH的對角線就要被固定為數值1 因此在現在的範例中我們先寫下0(固定)再預設數值1(自由) 同樣道理第6-10號因子是方法因子, 通常我們會容許它們有相關 但亦有人會認為不同的測量方法沒有關連而不容許相關 如果我們認為6-10號因子全無相關 右下角的小三角內的數值將由1改變為0 這視乎我們對模型的定義, 不論哪種模型都可以嘗試分析 然後選擇吻合度高簡化度高的模型來代表數據間的關係 每個程式的結尾都有一句OU statement, 這就是輸出指令output statement; AD=off代表甚麽? 原來每次分析到某次數時因為電腦用迭代方法 它就會覆核一次答案 例如預設為20, 電腦迭代20次後,就會覆核答案是否合理(應否繼續迭代下出) 如果電腦發現答案距離合理範圍很遠 例如數據間的相關遠大於1, TD是負值等等, 電腦就會停下來 對於複雜的模型, 分析二十次左右時 或許仍在探索階段, 所有參數都未被整理優化 所以要關掉AD (admissibility test)讓電腦不檢查答案下繼續分析 平常AD預設值是開啟,迭代達二十次分析後便作檢查 如果答案太不合理就會停下來 如果模型太複雜, 電腦分析20次時參數或許仍很混亂仍未合理 這時參數估計還未成熟, 所以我們對很複雜模型就關掉AD, 免卻檢查 另外不論迭代出理想參數與否, 只要達到某個迭代數目, 電腦就會自動停止迭代 如果那時還找不到理想參數, 電腦就回報結果不收斂(converge) 迭代次數上限是3 x t,t就是自由估計的參數數目 由於範例的程式複雜, 我們希望電腦多迭代幾次, 才去決定結果是否無法收斂 所以我們設定一個較大的IT值 一般程式只需經過400-500次迭代,就能得知結果是否真的無法收斂 但既然由電腦計算我們就可以設定一個大一點的IT值 一般電腦能在幾分鐘內找到收斂的答案 如果幾分鐘內不收斂, 大部份時候就表示模型或其他方面出了問題 於是我們設定一個迭代上限, 如果在上限內答案仍未收斂converge, 電腦都會終止分析 SS SC就是標準解standardized solution及完全標凖解completely standardized solution 剛才介紹的是相關特質相關方法correlated-trait correlated method的方法 我們容許特質trait和方法method互有相關, 當然方法因子之間可以沒有相關 想再簡化點可以使模型只保有5個因子, 連方法因子都刪去 只把25題題目分為五大類, 做一個只有五個因子的CFA 假設方法並不存在, 只把25題題目分為五個能力因子去做 這都是可以互相比較的模型 上述CTCM方法, 表面上很簡潔, 但大部份時候的結果都不收斂 即是不論迭代1000次或更多, 怎樣也找不到合理的答案, 答案永遠不收斂converge 例如起初找到一個看似合理的答案 迭代修正後却發現答案變差, 於是又再迭代修正 但這時又發現比之前更差, 最終不停修正都不能收窄估計範圍(不能收斂converge) 以找出距離S最小的Sigma, 這個情況就是不能收斂non-converged solution 這大多是模型的設計出問題, 又或是數據和模型之間有一些特別關係導致 這情況大多是CTCM的問題 因為不論甚麽數據, CTCM的描述亦很多時候都得不到收斂converge的答案 如果想深究這課題可以參考書內的文獻 在範例中,用固定方差法固定為1,答案亦不收斂 但把數值固定為2則可得到收斂的答案 但這改動並不能永遠得出收斂的答案, 只是在這範例可行 把數值固定為2可得到收斂的答案有其背後理由 但這比較複雜,所以在這課先不探討 換句說話,這種模型在大部份情况下都不容易收斂 沒有一些普遍法則general guideline讓它收斂; 即是,這很有機會是模型本身的問題 正因這個原因,CTCM雖然表面上挺好, 實際上功用不大 因為它無法找到一個收斂converge的答案 亦無法如範例一樣,只要作簡單調整就可以得到收斂的答案 即增大迭代次數和調整數值都不可能得出收斂的答案 因此有其他處理方法被發展出來 剛才提及AD作用於初步檢查, 但因爲範例的模型太複雜 所以我們關掉AD (AD=OFF) , 讓電腦不用太早檢查答案的適用性 IT=2000就是被加大的迭代次數 對於于一般複雜的模型, 電腦預設的缺省次數大部份時候都不足 所以我會要把它增加以盡量得出收斂的答案, 這對複雜的模型是有效的 因爲複雜的模型需要很多次迭代才能得出收斂、適合、正確的答案 如果模型簡單就不用增加迭代次數, 又或增加迭代次數亦不會幫助答案收歛 現在我們探討如何處理MTMM的數據; 有些數據內每一題題目會多量度一些數據 例如剛才的範例,每題題目都量度兩個因子 一就是特質因子(能力因子),另一個就是方法因子 大部份時候如心理學或社會科學的研究都會有類似數據 每題變量都量度兩個因子 這些複雜的組合如5 x 5的組合就形成一個數據; 要如何處理這些數據呢? 剛才的是相關特質相關方法correlated trait correlated method的處理方法 但那方法很少機會可以得出一個收斂的答案, 大部份結果都不會收斂 於是研究人員就設計出新的方法來處理; 同時我們亦有一個發現 如若在MTMM模型上使用CTCM, 矩陣越大(7 x 7)收斂機會越大 而5 x 5或3 x 5的矩陣收斂機會就很小; 矩陣越大效果越好,越小則越差 但這牽涉數學問題,我們不在此解釋; 總括來說在MTMM模型上使用CTCM 並不容易得出收斂的結果 而增加迭代次數或調整數值並不能幫助得出收斂的結果 有時候這種做法很難得到一個適合的答案; 要處理這些複雜的問題 研究人員就提出一個新方法名爲, 相關特質相關獨特性correlated-trait correlated uniqueness (CTCU) 剛才的模型左邊是五個能力因子, 右邊則是題目評分方法的五個方法因子 但那個模型很難得出收斂的答案 於是我們有另一個解決方法, 只保留五個能力(特質)因子 因為第1,6題的評分方法相同, 所以它倆的誤差部份 (即uniqueness部份) 有共通性 如前提及,每一題的共同部份都抽到因子去 如1, 2, 3, 4, 5共同的部份抽到第一號因子(創造力) 因為這五題是測量創造力,所以它們共同的部份自然抽到創造力的因子 第一題剩餘的θ 1(TD 1 1)是甚麽呢? 它就是沒有被抽出的部份 即是因子的獨特部份(uniqueness), 即是它跟2, 3, 4, 5題沒有共通的部份就留在theta裡 theta的另一部份是誤差 所以theta有兩部份: 一部份是獨特性uniqueness, 獨立於其他因子、只屬於自己的部份 範例的模型中,第1, 2, 3, 4, 5題共同被抽走的是創造力 第1題內,所以凡與創造力無關的部份, 會保留在theta-delta內, 即theta 1內 theta的獨特部份有二: 第一是因子自己的獨特性, 第二是因子自己的測量誤差 明白這道理就知道, CTCU (correlated trait correlated uniqueness)的作用 第一題的theta-delta (θ 1)有兩部份 第一是與創造力無關的獨特性部份, 第二是測量誤差 θ 6同樣第一部份跟美術能力無關, 因為相關的都抽到美術能力因子 餘下部份就是獨特性uniqueness及測量誤差 θ 1及θ 6有共通之處, θ 1跟創造力無關, 只受方法因子影響,
屬家長評分 同時θ 6亦屬家長評分因子的影響, 這兩部份都沒有抽到能力因子內 θ 1沒有抽進創造力內, θ 6沒有抽進美術能力內 這兩剩餘的部份都有共通之處, 就是家長評分 因此在第1及第6題內, 沒有被抽到能力因子的剩餘部份(θ1 & θ6) 都包括家長評分影響的部份在內 因此θ 1與 θ6兩個誤差之間可能有個相關存在 總括來說,theta-delta(題目方差的剩餘部份)包含了兩個部份 第一是題目的獨特性,跟任何因子無關(第二是測量誤差) 但第1及第6題的獨特部份都有個共通性, 因為兩題都是家長評分 同樣道理,θ 11亦包含家長評分和測量誤差 切記測量誤差是個random error,因此沒有共同性 但θ1, θ6, θ11, θ16, θ21都有共通性 就是同屬家長影響,幷沒有抽到共同的能力因子內 因為這些theta-delta有共通性, 所以我們容許它們之間有相關; 再重溫一遍 原本我們有10個因子,如今只剩下5個能力因子, 5個方法因子被刪去 要表達剩餘的獨特性部份(theta-delta)存在相關, 就必須容許theta-delta的誤差有相關 例如θ1, θ6, θ11, θ16, θ21用共同測量方法, 所以它們的θ存在共通性 同樣道理,θ2, θ7, θ12, θ17, θ22都是用同一個測量方法 所以它們的θ存在共通性 因此每五題theta-delta就有其共通性。 究竟這個關係的指令如何編寫? FR TD 1 6; 之前探討的theta-delta是對角線variance的部份 而對角線以外是誤差和誤差之間的相關; 現在探討的就是對角線以外的相關 TD 1 6 就是θ1 & θ6相關的位置; 從前我們不會考慮,只固定爲0 如今卻使之自由估計, TD 1 11, TD 1 16等5個組合全都要容許自由 切記不可只寫TD 1 6, 1 11; 還有TD 6 11, TD 6 16, TD 6 21 這5個一對對的組合全都要容許自由 TD就是描述對角線的誤差, 以及方法之間的關係 即是如果題目有共同測量方法 就使用對角線以外off diagonal的元素, 來表達它們用共同的測量方法 NK = 10則改為NK = 5 從前TD = DI, FR (diagonal free), 並不會容許估計對角線以外off diagonal的元素 因此在MO內的TD = DI, FR diagonal free, 要改為TD = SY, FI 即是對稱的 (相關必然是對稱); 先把所有固定下來 雖然可以把所有位置自由化 在MO statement內寫TD = SY, FR; 在後面必須把要固定的位置逐個提出 一般要固定的位置比較多 所以習慣上在MO 指令statement內固定所有位置 然後在後面的編程中把有需要的逐個自由化 再重溫一遍: 如果研究有25題變量, TD就是個25 x 25的矩陣 習慣上其對角線被預設為自由估計, 其對角線就是測量誤差theta-delta 即是沒有被抽出的部份就在對角綫(theta-delta)上 但這次研究內第1及第6題的theta-delta有相關 因此要使TD 1 6可自由估計; TD 1 11, TD 1 16同樣需要自由估計 這部份的TD在對角線外, 它們應該被容許相關, 來表達方法之間的相關 指令的編寫方法是TD = SY, FI, 這使整個矩陣(25 x 25)固定下來 接著把要自由估計的位置逐一自由化 螢幕顯示指令編程: NI=25 MO=500 即500個受試者, MA=KM 相關矩陣,
然後輸入相關矩陣 如果只輸入一半矩陣就寫KM SY; 如果輸入整個矩陣就寫KM FU 如果輸入的指令和矩陣不符, 會混淆讀入的數據, 電腦亦會顯示警告 因為KM FU讓電腦期望讀取25 x 25個數值, 但KM SY會讓電腦讀取一半數值 接著是MO statement, NX = 25 NK = 5 剛才NK = 10但現在改為5, 因爲只包含5個因子 (那5個能力因子) PH = ST 因為我們用固定方差法, 即因子的對角線被固定為1 (PH = ST的意思) 這裡的"1"已包含"固定"及"預設值1"的意思 因為PH = ST代表固定之餘還把預設值設定爲1 對角線以外的元素(能力因子)被容許相關 若有些不被容許相關, 可以在下面編程改動, 用指令使之自由化 另外就是TD, 之前我們沒有探討過 之前的語法是TD = DI, FR, 只容許對角線是自由估計 今次則是TD = SY, FI, 先固定所有位置, 然後如常用式樣指令PA LX 使首5題從屬第一個因子, 次5題從屬第二個因子 今次TD的pattern很特別, 對角線是1,在PA的語法內, 1代表該位置是自由估計 如果要賦值該元素為1, 就得另外提供指令 PA statement並不提供賦值, 只容許提供該位置屬固定還是自由 PA TD開始時假設對角線全部自由估計 0的位置是因定為0 fixed as zero,其預設置為0 除非另外設定,否則固定後的數值被預設為0 第6題的第一個位置即TD 6 1 補充: 因為如今矩陣對稱, 所以TD 6 1 相等於TD 1 6 TD 6 1的位置如今是紅色的, 並且寫上"1", 以代表這位置是自由估計 同樣TD 7 2的位置的"1"亦是代表自由估計, 所以式樣指令pattern很清晰及容易解讀 如果用式樣指令pattern statement就可以方便檢查漏寫的位置 如果逐句寫FR TD 6 1 等,則很易有錯漏 用式樣指令pattern就可避免這情況 但如果矩陣太大,式樣指令PA statement的內容太大時亦容易有錯漏 就是如此輸入矩陣; 式樣指令PA statement是十分整齊的,逐一對應 接著就是輸出OU,每個編程的最後一句output 因爲此模型太複雜,所以我們關掉AD, 但亦可以先嘗試把AD開啟 直到電腦提出答案不收斂不適用時, 才把它關掉,再看看電腦會否繼續進行分析 對於複雜的模型,是可以把AD關掉; 同樣我們希望電腦多做幾次迭代 以得出收斂的答案, 因此IT值可以定高(大)一點