歡迎來到第七課高階因子分析 (High-order Factor Analysis) 假設在第一階(first-order)有5個能力因子 即5個有相關的能力因子, 如果它們每個之間都有相關,
就共有10個因子相關 我們想知道的是, 能否使用高階因子來取代這10個相關 即是,如今每兩個因子之間都有相關, 這5個因子之間共有10個相關 這10個相關是否由一個高階因子影響這5個1階因子而成? 例如這5個是理科相關的科目, 例如物理、化學、生物、電腦等等 每兩個科目之間都有相關 究竟這些每兩個科目之間的相關會否同為亠個高階數理能力影響而成? 如果這些相關同為一個高階因子影響 就可以刪去這10個相關, 並改用一個高階因子替代 有一點還得留意, 這高階因子的模型的卡方(chi-square)必然較大;
回想一次 一階因子的模型容許每兩個因子之間的相關存在不同 例如第一個因子和第二個因子的相關可以是0.3 第二個因子和第三個因子之間的相關可以是0.4; 每個相關都可以不一樣 如今我們強逼這些因子都同為一個高階因子影響 即高階因子對它們的影響是一致性的, 由同一個來源影響 這個模型的要求就相對較高, 即是限制較大 但它用了較少的路徑來代表較複雜的關係, 亦因此而含有較大的自由度 即是它是個較簡單的模型 只要Chi-square的增加不太明顯, 換到的自由度便是值得 以模型的簡潔性爲準, 我們傾向使用高階模型 重溫一遍,一階模型因爲每兩個因子之間都有自由估計的相關 它是一個彈性較高的模型, 其Chi-square較小,吻合度較高 用上二階模型, 限制會增加,但却較簡化 所以它的自由度較大, 是個較簡單的模型 但其Chi-square必然較大, 因爲模型要求高,盡量簡化,
吻合度自然下降 只要Chi-square的增加不顯著, 我們還是傾向使用二階模型 相反,如果Chi-square明顯增大, 則代表這一階模型不能用二階模型替代 這兒是一個實際例子: 這是第四課所用的CFA模型 這模型的五個因子之間可以有10個相關存在, 它們各自可選取一個相關 所以A和B的因子可以是某個相關, B和C又可以是第二個相關 這些相關可以各自獨立估計, 所以它們限制較低 我們會考慮, 其實AB、BC、CD、DE或AD、AE、AC等之間的相關 是否同為一個外來的二階因子影響而構成? 於是我們建構一個二階模型, 並假設它同時影響5個一階因子,
把10個相關刪去 如果這模型的Chi-square不是明顯增多 當然這模型的Chi-square會因為簡化而增多 (吻合度降低) 但如果這模型的chi-square並沒有明顯增加很多, 我們就作結論說這二階模型是可取的 換句話說,這代表有一個因子, 同時影響5個一階因子 即能解釋這5個一階因子的相關 回顧剛才的例子, 如果A, B, C, D, E都是理科科目 我們希望知道 這5科是否同時被一個高階數理能力因子影響, 使它們5科之間存在一個共通性 我們就放置一個二階因子 這二階因子是個抽象的概念, 並不是一個數學成績,
並不擁有題目 這5個因子就是供獻給這個二階因子的「題目」(變量) 它們就像二階因子的題目一樣 這5個因子可以抽出一個共同因子, 成為二階因子 如果這二階因子的模型的Chi-square, 並不比一階因子的Chi-square明顯增大 而它換到的自由度又較多 這二階因子就成立, 即代表二階因子的真實存在 這五個學科之間有同共的能力因子來解釋它們之間的同共關係 現在探討編程方法: DA NI=17 NO=350 跟其他程式沒有分別, KM SY代表輸入矩陣;
SE 代表選擇變項 在第四課的範例中, 17題題目只選用16題;
MO NK = 1 範例中把二階因子當成X因子, 因此只有一個X因子,
它亦可以被當成Y因子 但此範例我們把它視為X因子 (KSI) 如今只有一個X因子,因此它是KSI 1 (NK = 1) 其它都是Y因子,共有16題,所以NY = 16 NE = 5,共有5個Y因子; PS是因子裏被解釋後的剩餘部份 Factor A的0.56就是此部份,即殘差; 在此所有對角線都要自由估計 但PS的非對角線即因子之間的殘差相關並不存在,可以全部刪去(固定為0) TE即每個題目餘下的uniqueness須自由估計 GA是X因子去Y因子的路徑, 即圖中五條路徑,
全部都須自由估計 PH = ST 只有一個因子; ST是將因子的方差固定且賦值為1 設計這類模型時有兩個方法 一個方法對是二階因子,用X因子, 一階則用Y因子,
但不可調轉使用 因為範例中的因子是一階因子指向二階因子 故一階因子不可以當成X,必須設定為Y 餘下的選擇,就是選擇把二階當成X因子或是Y因子 兩種方法都可以使用, 但一階因子必須用Y因子 也即是說,在此範例我們可全部使用Y因子 或一階因子用Y,二階因子用X, 即如圖中所示 如今範例使用固定方差法, 二階因子的方差要被固定為1,
其編程是PH = ST 至於二階因子的題目, 我們有NK = 1但沒有NX 因為在此範例中,NX用一階因子當成X因子 即如今的一階因子就像以往的例子中的題目一樣 即如今是一個因子(二階因子)有五個題目(一階因子,即是因子A,B,C,D,E) 這五條路徑就像因子負荷, 由二階指向一階,
它們全都是自由估計,全都是GA 即GA 1 1,GA 2 1 (去2由1),GA 3 1,GA 4 1以及GA 5 1 這些GA全都是自由估計, 而這些二階因子的variance需固定為1,因此PH = ST 因爲二階因子只有一個因子 所以因子和因子之間的相關並不存在, 只有一個方差 PA LY跟平常一樣, 首三題屬於第一個因子,
次三題屬於第二個因子 第七題如第四課提及,是被改動過的 本來是B的因子,如今搬到A因子去, 因此寫成1(1 0 0 0 0) 其他題目如常地歸屬於不同的因子 接著在每個因子選一個題目出來, 固定它並給予預設值1 這是典型的固定負荷法 (fixed loading method) 總括而言,一階因子的設定跟以往的題目一樣, 二階因子本身沒有題目存在 二階因子沒有NX存在, 二階因子的題目全是一階因子而來 它們之間的路徑是GA, 就是二階因子去一階因子的路徑 方向由二階因子指向一階因子, 這些路徑可以用固定方差或固定負荷法 換句說話,二階因子去一階因子的路徑 可以選取另一個固定負荷法, 在五條路徑中任意選取一條路徑 固定其中一個GA為1, 這個就是二階因子(KSI 1),
但PH不再是ST而是PH=SY,FR 因此處理二階因子有兩個方法, 範例所示的方法是固定方差法 另外亦可以用固定負荷法, 把五個GA裡其中一個固定為1 然後自由估計二階因子的方差variance, 即PA = SY,FR 結果這個二階因子模型, 刪去所有一階因子的相關後,
共節省了多少個自由度? 原本有10個相關, 如今只需5條路徑,
所以省下5個自由度 Chi-square大致相同, 其他的擬合優度指數亦差不多 而二階因子和一階因子的GA系數都很強 要留意的是,我們不可只看擬合優度指數, 亦要參考其路徑的强弱 路徑强則代表二階和一階的關係真實存在 如果一階因子之間的相關很弱, 即本來的5個因子內的10個相關很弱 要在其中抽出二階因子就很困難 那情況就沒有建立二階因子的必要 還有一項要留意, 如果模型只有三個一階因子,
即總共只有三個相關 在三個一階因子抽一個二階因子是沒有可能 數學上這情況被稱爲等同模型, 即三個一階因子有三個相關 如果省去那三個相關, 改為一個較高階因子 這個模型跟未删去三個相關之前是一樣的 意思是如果只有三個或兩個一階因子, 再抽一個二階因子出來是沒有意義 如果在三個一階因子中, 抽出一個二階因子 再跟模型以外的模型構成關係 (路徑), 就有兩個方法處理 一個方法只使用一階因子, 即三個一階因子跟外面一個因子構成三條路徑 但如果三個一階因子抽成一個二階因子 這二階因子再跟外面另一個因子出現關係, 只會構成一條路徑 由三個因子構成一個高階因子再跟外面一個因子出現關係, 這亦可能構成節省 意思是如果在三個一階因子中抽成一個二階因子, 在數學上是等同的 但如果抽出二階因子後再跟外面出現新路徑 這代表表簡化或許是有需要的, 使之成為二階因子 再跟模型外的變項發展出新的關係 (路徑) 擬合優指數Goodness of fit index可以比較一階模型和二階模型 但要留意如果是一些因子數目少的模型 例如只有4 - 5個因子, 其節省的自由度只有很少 所以它所產生的一階因子模型和二階因子模型的擬合優指數Goodness of fit index是差不多 那時就難以區分那一個因子的模型較好, 因為兩者的Goodness of fit index是相差不多 參考另一個例子: 假設有25題題目 測量學生的語文、數學、英語、歷史和地理能力, 如圖有五個因子 這五個因子有10個相關在內, 每兩個之間都有相關,
共有10個相關 同時亦可以把剛才的模型轉化爲二階因子模型 把這五科的共同性抽出成爲一個二階因子, 如今再見不到一階因子之間的相關 即是10個相關已刪去, 餘下只有一個二階因子替代它們 模型一的卡方是464; 自由度是265;
RMSEA是0.034;
TLI是0.91 五個因子之間的相關, 是0.41至0.50之間,
代表尚算頗大的相關 如果相關太小, 根本不可能再抽出一個二階因子 另外二階因子模型的擬合優指數Goodness of fit是465, 跟早前的464改變太小 自由度節省了5個,即是270; 爲甚麽節省了5個?
原本有10個相關 如今用5條路徑代表, 就節省了5個自由度 RMSEA跟之前差不多; TLI及其他都差不多 從簡約原則, 我們傾向選擇二階因子模型,
放棄一階因子模型 這代表這五個學科受一個共同能力影響 如果它們之間沒有一個共同能力,是沒有可能抽出的, 其卡方會明顯增加 另外一階因子和二階因子的關係很強, 是0.6 - 0.7之間 這證明二階因子的模型是可取的, 有一個共同能力主管著這五個學科 總結來說,在二階因子模型內, 一階因子不再被容許相關 這五個一階因子之間再沒有關係 但有些特殊模型, 雖然抽出二階因子,
但可能還有些一階因子有額外的相關 如果把這些都加入分析, 擬合優度指數或許會增加很多 如果學理上合乎邏輯 間中會見到有些模型, 除二階因子外,
其一階因子或許還有幾個額外的相關 另外留意二階因子和一階因子模型的方向, 是由二階指向一階 就像一階因子變成二階因子的題目一樣 而因子和題目的關係是由因子指向題目 因為是由因子影響題目, 而二階因子影響著一階因子,
所以由二階指向一階 有兩個方法處理這類模型: 一個是固定方差,一個是固定負荷 如果用固定負荷法, 就於這5路之間選擇1條路固定為1 即由二階到一階之間, 隨意選取一條路徑固定為1(二階因子方差設為自由) 即是固定負荷法 如果用固定方差法, 即KSI (二階因子) 方差variance 如果用X因子這就是PH, 而PH的對角線須被固定並賦值為1 這就是固定方差法的設定方法 對只有三個一階或以下的因子, 絕不會構想二階因子 因為從三個一階因子中抽一個二階因子, 只會構成等同模型 但有例外情況 假如抽出二階因子後, 把這二階因子跟模型外的另一因子連上關係 這做法或許是個較簡化的方法 因爲節省了每個一階因子跟模型外的另一些因子逐個連上關係 就節省了很多路徑, 因此這做法可能能够簡化模型 甚麽時候選擇一階或二階? 要考慮二階因子模型是否比一階因子模型有更大的自由度 即是二階因子是否比一階因子更簡化 但二階因子的卡方較一階因子的大 因為二階因子固定的位置較多; 它是由一個因子影響其他所有因子 因此它的擬合優指數goodness of fit index較差, 因此其卡方較大 但如果二階因子簡化很多而卡方沒有太明顯的增加, 我們會傾向選取二階因子 在LISREL中設定二階因子, 可把它定為KSI,即X因子 然後用ETAη代表一階因子, 如範例所示 但亦可用ETAη代表所有一階及二階因子, 即命名因子時有6個而非5個 至於第六個因子是二階還是一階,這是隨意的 只要命名方法是固定地統一而一致就可以