第六課內會探討完整模型full model。 Full model即完整的一個模型 假設我們研究學生興趣、智力、自信會否影響他們的學業、課外活動及服務熱誠 如果研究有500位學生 之前探討的是LX: 觀察變量與因子的關係, 如今加上LY: 跟LX類似 之前探討的是TD: 是誤差, 如今加上TE: 跟TD類似 GA是一個新矩陣; 之前探討的是PH,是因子和因子之間的相關 用圖形表示就是弧形的雙向箭咀, 把兩個因子相連 如今GA是個單向的箭咀關係 由一邊指向第二邊 由KSI (X的因子)指向 ETA (Y的因子) 是因子對因子的關係 就像因果關係一樣, 其大小是NE (ETA) x NK (KSI),
跟傳統的回歸系數相似 即是在回歸分析中, 由一個因子預測另一個 (一個因子影響另一個因子) 由X因子(KSI)對Y因子(ETA)的影響 另一個矩陣就是BE(BETA) BE 是 NE x NE,即是Y因子x Y因子的大小, 就是由Y因子影響Y因子 BE跟GA是類似的, BE就是由Y因子對Y因子的影響 (ETA對ETA的影響) 而GA則是KSI對ETA的影響 第三個矩陣是PS, PS是因子跟因子的殘差 就是ETA的因子剩下部份互相之間的關係 PS跟PH有類似, PH就是因子之間的相關 而PS則是剩下的殘留下的相關, 一會我們再會探討 PH的大小是NK x NK, PS的大小是NE x NE PH就是NK (x的因子數目) x NK, 因為它是互相之間的關係 PS就是NE x NE的大小, 跟PH相似,
但PS是殘差的,是被解釋的部份的方差 圖中顯示6個因子 先要區分x的因子和y的因子 左上角是x第一個因子 KSI 1, 2, 3都是x的因子 右邊三個就是y的因子 (ETA 1,2,3) 此外,亦可以把全部都稱為Y的因子, 即是ETA 1, 2, 3, 4, 5, 6 這樣或許更能簡化程序, 這亦是可行的,
但卻不能全都稱為X的因子 例如這幾個被箭咀指著的就不可以 因為在LISREL當中, 被箭咀指著的不可做X的因子,
必須用Y來表示 所以我們有兩個設定方法: 第一個是如圖所示,
左邊X的因子指向右邊Y的因子 另一個做法是, 把整個模型都稱爲Y的因子,
這兩個做法都是一樣的 既然它們是X因子, 這就是X的題目與X的因子的關係(LAMBDA) 這個是由第1題到第一個因子, 所以叫LX 1 1而不是LY 1 1 另外這是第2題,即是LX 2 1; 對應這邊的是Y因子和Y題目的關係 這個是由Y的第1題由Y的第一個因子, 所以這個叫LY 1 1 這個是LY 2 1,即LY去2由1 這就是LY 3 1,這是LX 4 2 (去第4題,由第二個因子) 這就是LX 5 2,去第5題,由第二個因子 這就是LX 6 2,去第6題,由第二個因子 LX 7 3,LX 8 3, LX 9 3 同樣這邊是LY 4 2,LY 5 2,LY 6 2,LY 7 3,LY 8 3,LY 9 3 爲這些因子和題目編號碼時只需要統一的次序就可以 編了1以後,在程式內只會稱呼它爲1, 編了2以後,在程式內只會稱呼它爲2 只要有一個一致性的編碼就可以, 哪一個是1號2號並沒有關係 至於X因子的相關 例如由X第1個因子去X第2個因子的相關, 即KSI 1去KSI 2的相關就是PH PH就是X因子和X因子的相關, 所以滑鼠指著的就是PH 2 3 因此它們是PH 1 2,PH 2 3,PH 1 3, 即是我們總共有三個相關 至於由X因子去Y因子, 剛才亦曾介紹稱為GA,
同樣是去Y由X 這是去Y的第1個因子 (ETA 1), 於是這就是GA 1 1,
因為這是去1由1 至於這個就是由X第1個因子去Y第3個因子, 即是去3由1,所以稱為GA 3 1 而由下面上去的那個則是由X第3個因子去Y第1個因子 去1由3,所以是GA 1 3 旁邊這路徑是由第2個因子去第1個因子 因為這是由X因子去Y因子, 所以是GA 1 2 (去1由2) 這就是由X的第2個因子(KSI 2)去Y的第1個因子(ETA 1), 所以是去1由2 從Y因子去Y因子則有另一個名稱, 這是從Y的第1個因子去Y的第2個因子 Y因子去Y因子不是GA,而是BE, 因為現在是去2由1,所以就是BE 2 1 如今圖中再沒有其他由ETA到ETA的直線關係; 假如有這種關係,它們就是BE 至於由Y因子去X因子是不可能存在 因為所有X因子都不能成為受影響的因子, 只有Y因子才可以是受影響的因子 因此這類只有兩種直綫: 第一類是X因子去Y因子 (GA),
Y因子去Y因子就是BE 我們要搞清楚去甚麽由甚麽 例如這路徑是由第1個因子去第2個因子, 即是去2由1,BE 2 1 至於X因子和X因子之間的相關就是PH, Y因子和Y因子的相關則是PS PH和PS有少許不同 嚴格來說PS就是Y因子內的剩餘部份, 該部份就是被箭咀指著的圓圈 甚麽是剩餘部份? 衆所周知,這圓圈是能够被解釋的部份 剩餘部份0.93就放到這兒, 即是服務熱誠被學習興趣解釋 而解釋後的剩餘部份就是0.93 至於課外活動和表現已被學業表現和自信解釋, 其剩餘部份是0.90 如果剩餘部份即從前提及的residual(殘留下的), 如果這部份之間存在相關 就在此畫個雙向的箭咀, 估計後就是圖中的0.15,屬餘下部份 而PH卻不是餘下部份, 而是整個因子和因子的相關 有一點關於PH的要留意, 如果因子之間的相關很強 (箭咀之間的值很大) 餘下部份就很少, 但這很視乎怎樣去解釋因子 例如我們把這些視為學業成績, 這是物理科,這是化學科 如果我們用語文去解釋 例如用語文能力解釋物理科的表現或化學科的表現, 能解釋和預測的都很少 餘下部份就會很大, 即是餘下部份可能十分相關 換句話說,沒有被解釋的剩餘部份可能有很高相關 例如包括數學能力、理化能力等 沒有被語文能力解釋的就放到0.90或0.93那兒, 擁有十分高相關的地方 假如預測部份放了個數學科在這兒, 用數學解釋化學或用數學解釋服務熱誠 假設我們把右邊中間的因子改為物理, 例如一科化學、一科物理 如果前面用數學預測它們, 數學能解釋的有很多 跟之前用語文解釋的很不同, 因爲剩餘部份的相關會變得很少 之前用語文解釋, 殘差內大部份是數學 所以當時殘差內的相關很高, 因為那都是未被解釋的數學部份 但假如我們改用數學來預測這兩科, 剩餘部份跟數學再沒有關係 那麽兩科的剩餘殘差就可能很少, 而它們的相關亦可能很少 因此殘差和PH的兩個因子相關是不同的 重溫一遍: PH是兩個因子的相關,
沒有被解釋的 只是兩個因子之間的相關; 不是殘差,是兩個因子的相關 而PS就是被解釋了之後的剩餘部份, 例如用自信和數學來解釋這科的能力 解釋後剩下不能被解釋的部份, 就放在PS的對角線上 如PS 2 2和PS 3 3, 它們沒有被解釋的部份就放在0.90和0.93 如果這兒其中一個預測方法改為數學, 科目內的數學部份就會被解釋 0.90和0.93的數值就會明顯下降, 餘下部份就是0.90和0.93的相關 如果我們用數學預測它, 數學部份就被解釋並寫在路徑上,
不會在殘差內 換句說話,因為能夠預測,所以路徑變強, 因為已經能夠被預測 這是程式的編寫方式: 第一句DA NI=18 NO=500,
代表18個變量和500個受試者 MA=KM 相關矩陣,然後輸入該矩陣 18個變量如何分開使用? NY=9,9 個Y變量;
NE (ETA) = 3;
NX = 9 這三個的先後次序是隨意的 但輸入矩陣時, 必須先排出Y變量再排X變量,
這是必須留意的 18個變量先排出9個Y變量再排出9個X變量 再看看模型指令MO statement: NK=3 PH=SY,FR PS=SY,FI;
PH=SY,FR 因為X因子KSI 1, 2, 3是容許相關的;
PS=SY,FI PS是個3 x 3的矩陣,先固定下來之後再調整 TD和TE的處理跟平常一樣 只需集中於對角線、自由Diagonal Free BE=FU,FI; BE和GA都可以省略,
它們就會被預設為完整、固定為0 Full fixed at zero 範例中的BE是完整、固定為0 full fixed at zero LY的pattern就是3個(1 0 0); 從圖中指令我們就得知這是一個固定方差法 因為指令沒有選擇因子內任何題目固定為1 但再看後面有些固定fix和賦值value 即是我們可以在後面選擇題目來固定爲1, 並把方法改為固定負荷法 現在我們先定義首3題為Y的第1個因子 (ETA 1) 接著3題是第2個因子,最後3題是第3個因子 同樣道理,LX亦是每3題為1個因子; FI就是固定,固定LY 1 1, LY 4 2, LY 7 3 每個因子選擇一題固定並設定1為其預設置 另外就是GA。 GA是X因子去Y因子,
哪幾個因子之間有相關呢? 第一個GA 1 1就是X第1個因子(KSI)去ETA 1 橫向掃過去的就是GA 1 2,即去1由2 即是去Y的第1個因子由X的第2個因子 再橫向數過去就是GA 1 3,即去1由3, 即由KSI 3去ETA 1 所以矩陣第1行第1個是GA 1 1, GA 1 2, GA 1 3 分別代表去1由1,去1由2,去1由3 第二橫行首兩個是固定的, 第三個是GA 2 3,即去2由3,去ETA 2由KSI 3 第三橫就是GA 3 1,即去第3個因子由第1個因子, 即去ETA 3由KSI 1 接著就是Y因子和Y因子之間的關係 例如FR BE 2 1,即去第2個由第1個Y因子 因為BE是Y因子和Y因子之間的直線路, 去Y第2個因子由Y的第1個因子 接下來就是PSI, 就是Y因子殘差的關係,
即是FR PS 1 1 PS 2 2 PS 3 3 切記矩陣的對角線就是殘差, 大部份殘差都被容許自由估計 所以先容許殘差(如PS 2 2)自由 再容許殘差之間(如PS 2 3)自由, PS 2 3就是殘差與殘差之間的關係 Y第2個因子和Y第3個因子, 它們的殘差之間的關係就是PS 2 3 然後就是OU SS SC MI ND=3 SS就是標準答案; SC就是完全標準化答案 MI就是modification index (修正指數); ND就是答案的小數位 接下來是擬合優指數Goodness of fit index Chi-square是292.51; RMSEA = 0.050,算是理想;
NNFI和CFI都大於0.90,亦是可接受 BE和GA分別都有一些頗大的修正指數 BE 3, 2和GA 3, 3的修正指數都大於21,算是很大 首先BE 3, 2代表去第3個因子由第2個因子 這兩個都是Y的因子, 因為BE是Y和Y之間的關係 而GA則是X去Y的關係, 去Y第3個因子由X第3個因子 這兩個如今都是固定為零; 如果我們放寬它們為自由估計,
都會減低chi-square的值 但BE 3,2之間已有PS 3, 2, 即是它們殘差之間已經容許相關 再加多一條路徑就不太合理 所以第一個元素(BE 3, 2)不會被放寬 因此BE 3, 2不會被放寬, GA 3,3還是可以合理地放寬 在第二個模型M2裡 (修正後的M1), GA 3,3是被容許自由估計 它的chi-square就是270.14, GA 3,3就是0.353 這個路徑是被放寬及容許自由估計, 而chi-square因此而得到改善 路徑本身亦是統計上顯著的, 其內容亦是合理的 接下來我們又要考慮, 模型內有沒有需要被删去的路徑 一般做法的是先加需要添加的路徑,再刪去一些統計上不顯著的路徑 在修正過程中都是可加可减 但一般都是先加後減, 因爲加了路徑後,
有些本來要刪去的路徑未必再需要刪去 在大部份情況下 縱是有多餘的路徑其數值亦只會是0, 對模型的影響通常都較小 但如果本來就缺少了一點路, 再新增一些路徑,
這樣就會對模型影響比較大 所以模型再有多餘的路徑, 亦不需急著處理,
直到最後才刪去 要考慮有否需要删去的路徑 我們發現BE 2,1 = 0.011; standard error = 0.052, t = 0.215;
數值都比較少 換句說話,這路徑跟0的距離非常接近, 所以我們可以把它刪去 同時亦要考慮這樣做是否乎合現實中的邏輯 如果合理就可以把它固定爲0, 這改動會讓M2變成M3 重溫早前學習過的概念 加入自由參數free parameter後, 原本固定的位置,
參考MI和現實邏輯後 發現某個路徑可以容許自由 使它們自由後, 模型自由度就會减少,
模型就變得複雜 一般情況下,卡方就會減少, 因爲模型放寬了,chi-square就會減少 但自由度degree of freedom亦減少, 即是模型同時變得複雜 相反,減少自由參數, 把本來自由估計的位置固定為零 讓模型變得簡單,自由度degree of freedom增加 要估計的自由參數減少, 整個模型的自由度增加 這兒有兩個概念: 一個是模型要估計的參數 模型要估計的參數越多, 模型自由度越少,變得越複雜 相反,如果我們給模型多加一點限制, 把多一點位置固定,
使模型彈性降低 但如果彈性降低不多,chi-square亦不會太受影響 我們就在這兩個原則下選取哪個原則為我們帶來更多得益 增加自由度即不斷新增要固定的路徑, 自由度就會增大,模型就變得簡單 但因為太多路徑都被固定 chi-square亦會增大,即吻合度降低; 究竟這兩個數值哪個影響較大?
我們得比較一下 如果增加自由參數後, 卡方顯著地減少,
即模型吻合性大大增加 就代表這樣犧牲自由參數是值得的 假如我們減少自由參數後, 要估計的參數減少,
而卡方沒有顯著地增加 就代表這樣减少自由參數是可取的 換句說話,我們把一些路徑固定下來後, Chi-square沒有顯著地增加 就說明我們用這個方法簡化模型是合適的