[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Уважаемые слушатели, в данном уроке мы рассмотрим двухфакторный дисперсионный анализ в пакете Statistica. Рассматривать мы его будем все на том же примере выручки небольшого магазина, на которую предположительно влияют два фактора — это день недели и то, какая бригада работает. В данном случае мы учтем влияние обоих факторов. Для начала добавим нашу таблицу к рабочей книге. Создадим новую рабочую книгу и дадим ей название. Сохраним как, например, ANOVA, ANalysis Of VAriance. Сохраняем данный файл, и далее всё, что мы будем здесь делать, будет добавляться в соответствующей рабочей книге. Для того чтобы провести двухфакторный дисперсионный анализ в пакете Statistica, мы заходим в раздел Statistics, ANalysis Of VAriance, ANOVA, или дисперсионный анализ. В данном окне у нас предлагаются различные варианты анализа, в частности one-way ANOVA, это однофакторный дисперсионный анализ, то, что мы с вами уже делали в предыдущем уроке, заходя через раздел Basic Statistics. Также можно рассмотреть многофакторный дисперсионный анализ с учетом только главных эффектов, а можно рассмотреть и факторный дисперсионный анализ с учетом эффектов взаимодействия. Сейчас мы с вами рассмотрим только влияние главных факторов. Поскольку у нас их два, соответственно, нам нужен многофакторный дисперсионный анализ главных эффектов, это второй пункт. Выбираем его и нажимаем OK. Далее нам нужно задать переменные. Нажимаем кнопку Variable. Зависимая переменная у нас выручка, а категориальные факторы — это день недели и смена. Обратите внимание, что эти переменные являются качественными, или категориальными, переменными и могут выражаться как в текстовом, так и в числовом формате. Никакой количественной информации при этом данные значения не несут, а представляют собой просто текстовые метки, указывающие на уровень фактора, который влияет на соответствующее наблюдение. Выбрав переменные, нажимаем OK. Если посмотреть, какие коды факторов участвуют в анализе, можно нажать на эту кнопку, по умолчанию выбираются все, которые предложены в исходной таблице. То есть для дня недели — это все значения с понедельника по воскресенье, для смены продавцов или для бригады у нас два значения, они также указаны здесь полностью, их можно выбрать, также нажимая на клавишу All. Если вы хотите учесть влияние только части каких-то уровней фактора, соответственно, можно перечислить эти значения в заданном окне. Мы сейчас пока рассматриваем полный анализ, нажимаем OK. Далее, OK, и перед нами появляется окно быстрого анализа, в котором мы можем посмотреть влияние каждого фактора и вывести графики. Для начала проверим гипотезы о равенстве средних значений для каждого фактора, то есть о невлиянии соответствующих факторов на нашу исследуемую количественную величину. Для этого мы должны нажать на кнопку All effects, все эффекты. В модели у нас присутствует свободный член, влияние первого фактора, влияние второго фактора, также учитывается влияние шума. С помощью статистики Фишера проверяется гипотеза о том, что данный фактор не влияет на наблюдения. Мы видим, что в нашей модели значимо присутствует свободный член, также значимо влияние фактора «день недели», то есть гипотеза о равенстве средних значений по соответствующим уровням данного фактора была отклонена. А вот для смены гипотеза о равенстве средних у нас принимается. Выводы мы эти делаем стандартно, глядя на значение p-value, сравнивая его с уровнем значимости 0,05. Если значение у нас меньше, чем 0,05, гипотеза отклоняется, если больше, чем 0,05, соответствующая гипотеза принимается. Тем самым можно сделать вывод о том, что из этих двух факторов день недели влияет на выручку, а то, какая бригада работает, на выручку статистически значимого влияния не оказывает. Если мы вернемся в наш анализ, вот здесь у нас свернуто это окошко, и нажмем на кнопку «Все эффекты», «Графы», мы можем посмотреть влияние каждого фактора и вывести соответствующее значение на графике. Например, для смены график выглядит следующим образом. У нас было две бригады, которые работали, первая приносила вот такую среднюю выручку, вторая, соответственно, вот такое значение. Мы видим, что несмотря на то, что отличие имеется, это отличие является статистически незначимым. Краткая информация об этом, то есть значение статистики Фишера и значение p-value, выводится также на графике вверху. Если посмотреть аналогичный график для дня недели, выбираем в таблице день, нажимаем OK, и график в этом случае у нас выглядит уже вот таким вот образом. То есть по первым четырем дням недели у нас выручка практически одинаковая, а к концу недели наблюдается ее рост. И также информация о статистике Фишера и p-value вверху таблицы говорит нам об этом же. Если мы хотим, например, посмотреть теперь точные значения средних по каждому уровню фактора, который влияет на наши наблюдения, мы можем раскрыть окно анализа и зайти на вкладку «Средние». У нас была принята гипотеза о том, что день недели влияет на выручку, соответственно, мы выбираем здесь день, он и так у нас уже выбран здесь по умолчанию, и далее посмотрим оценки средних по методу наименьших квадратов. Для этого мы нажимаем на соответствующую кнопку, и у нас появляется таблица со средними значениями для каждого дня недели, стандартные ошибки и выручка. И границы 95-процентного доверительного интервала. Также мы можем провести анализ остатков. Для этого мы заходим на вкладку Residuals и, например, можем посмотреть гистограмму для остатков. Они должны у нас подчиняться нормальному распределению, и, как мы видим, гистограмма достаточно неплохо соответствует графику нормального распределения. [МУЗЫКА] [МУЗЫКА]