0:00
[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА] Мы начнем рассмотрение
многомерных методов традиционного анализа с факторного анализа.
Сразу же отмечу, что рассматриваемые многомерные методы являются весьма
сложными, и мы ограничиваемся лишь поверхностным рассмотрением их с тем,
чтобы вы получили представление об их назначении,
а также могли бы интерпретировать результаты применения этих методов.
Более подробную информацию о том, как применять эти методы, какие
ограничения существуют на их применение, вы можете подчерпнуть в книгах, например,
в моей книге «Математические методы психологического исследования»,
а также в книге «IBM SPSS 20 и AMOS».
На экране вы видите корреляционную матрицу как
исходный материал для факторного анализа.
По корреляционной матрице мы видим две группы переменных,
которые сильнее коррелируют друг с другом и слабее с другими переменными.
Например, переменные «Счёт в уме» и «Числовые ряды» сильнее коррелируют друг с
другом, но слабее с другими переменными, и остальные три переменные,
они тоже сильнее коррелируют друг с другом, но слабее с первыми двумя.
Сейчас на экране вы видите основной результат факторного анализа
— это факторная структура или факторные нагрузки после вращения.
Вот давайте разберёмся, что же это за результаты.
Каждая ячейка таблицы представляет собой факторную нагрузку.
По смыслу это корреляция фактора и соответствующей переменной.
Факторы идентифицируются по тем переменным,
по которым факторы имеют максимальную факторную нагрузку по абсолютной величине.
Например, первый фактор имеет максимальную факторную нагрузку по последним
трём переменным: «Осведомлённость», «Пропущенные слова» и «Вербальная память»,
а второй фактор имеет максимальные факторные нагрузки по переменным «Счёт в
уме» и «Числовые ряды».
Каждому фактору присваивается имя,
которое соответствует общему смыслу переменных, которые входят в него.
Ну и, соответственно, первый фактор мы могли бы назвать «Фактор вербального
интеллекта», а второй фактор «Фактор арифметических способностей».
Рассмотрим основные показатели факторного анализа.
Как было уже сказано,
основной результат факторного анализа — это таблица факторных нагрузок.
Факторная нагрузка — это корреляция, подобная корреляция Пирсона,
корреляция фактора и соответствующей переменной.
Соответственно, квадрат факторной нагрузки,
имеет смысл доля дисперсии, а именно доля дисперсии этой переменной,
которая обусловлена влиянием данного фактора.
Соответственно, суммируя по строке квадраты факторных нагрузок,
мы получаем величину, которая называется «общность».
Общность — это та доля дисперсии этой переменной,
которая обусловлена влиянием выделенных факторов.
Также можно посчитать квадраты факторных нагрузок по столбцу.
Вы видите, СКН обозначено — это сумма квадратов факторных нагрузок по столбцу.
Сумма квадратов факторных нагрузок,
делённая на количество переменных, показывает нам долю дисперсии,
долю совокупной дисперсии переменных, которую объясняет данный фактор.
В частности,
доля дисперсии первого фактора составляет 36,68.
Это означает, что информативность
этого фактора или мощность его составляет 36,68.
Суммируя проценты дисперсий по строке мы получаем полноту факторизации.
В данном случае полнота факторизации — 69,86.
Около 70 %.
Ту же самую величину полноты факторизации мы
могли бы получить суммируя общности и поделив их на количество переменных.
Ну и, соответственно, умножив на 100 %.
На экране представлены этапы факторного анализа.
Факторный анализ начинается с подбора переменных, к переменным предъявляются
те же самые требования, что и к переменным для вычисления корреляции Пирсона.
То есть приблизительная нормальность распределения переменных.
Далее.
Оценка пригодности корреляции для факторного анализа.
Далее.
Предварительная оценка числа факторов.
Далее.
Выбор и применение методов факторного анализа.
Затем этап вращения факторов.
Вот здесь отметим,
что вращение факторов производится с целью достижения принципа простой структуры.
Так называемый принцип простой структуры был введён основателем факторного
анализа Леоном Терстоуном и обозначает, что каждая переменная
имеет максимальную нагрузку только по одному фактору.
А по остальным факторам имеет минимальные факторные нагрузки.
Сам Леон Терстоун устанавливал следующие ограничения:
каждая переменная должна иметь максимальную факторную нагрузку,
то есть не меньше 0,7 только по одному фактору,
а по остальным факторам нагрузки должны быть малыми и не превышать 0,1.
Конечно, такой жёсткий принцип простой структуры на практике редко можно
достигнуть, но является некоторым идеалом, к которому мы должны стремиться.
Этот принцип простой структуры означает,
что матрица факторных нагрузок поддаётся интерпретации однозначно,
то есть однозначно интерпретируется фактор по своей группе переменных.
Ну, наконец, следующий этап — это оценка простоты факторной структуры и
содержательная интерпретация факторов,
которая не вызывает затруднений, если структура действительно простая.
Ну и, наконец, заключительный этап факторного анализа,
который не всегда выполняется, а в случае, если факторный анализ является лишь
одним из этапов анализа данных, это вычисление факторов как новых переменных.
То есть, закончив факторный
анализ интерпретации факторов, мы в дальнейшем можем
вычислить факторы как новые переменные и использовать для дальнейшего анализа.
И, таким образом, факторный анализ выполняет свою основную общенаучную
функцию, функцию снижения размерности данных.
То есть переход от большого количества исходных измерений к
небольшому числу факторов, которые могут быть использованы для дальнейшего анализа.
[БЕЗ_ЗВУКА]