В этом видео мы введем несколько распределений, которые являются производными от нормального, и поговорим о том, как они возникают. А в следующих видео вы увидите, как эти распределения применяются. Давайте для начала быстренько вспомним про нормальное распределение. У нормально распределенной случайной величины два параметра: μ и σ, μ равна матожиданию, а сигма — квадрат дисперсии. Вот так выглядит ее плотность и функция распределения. Обратите внимание, что функция распределения не выражается аналитически, то есть вот этот интеграл не берется, а график плотности распределения похож на знакомую вам шляпу. Давайте теперь представим, что у нас есть k независимых одинаково распределенных нормальных случайных величин, то есть со средним 0 и дисперсией 1. Определим новую случайную величину X, равную сумме квадратов наших Xi. Распределение такой случайной величины называется распределением хи-квадрат с k степенями свобод. К сожалению, формулы для плотности и функции распределения хи-квадрат выглядят ужасно, поэтому мы даже не будем на них смотреть. Точно так же не будем смотреть на формулы для функции распределения и плотности следующих распределений. При k, равном 1 и 2, график для плотности хи-квадрат — это монотонно убывающая функция с максимумом в 0. При k, начиная с 3, у плотности появляется максимум, который с ростом k начинает постепенно уезжать вправо по числовой оси. Пусть теперь у нас есть случайная величина X1 из стандартного нормального распределения и X2 из распределения хи-квадрат с числом степеней свободы ν. Определим новую случайную величину X, равную отношению X1 к √X2 / ν. Такая случайная величина будет иметь распределение Стьюдента с числом степеней свободы ν. Перед вами графики плотности распределения Стьюдента при разных ν. На первый взгляд они кажутся похожими на плотности нормального распределения, а так у них более тяжелые хвосты, то есть для них более вероятны большие по модулю значения случайной величины. Кроме того, они всегда центрированы в 0, то есть они не могут никуда сдвигаться по числовой оси, в отличие от нормального распределения. Чем больше ν, тем меньше отличие распределения Стьюдента от нормального. При ν, начиная с 30, визуально практически невозможно отличить распределение Стьюдента и нормальное. Пусть теперь X1 имеет распределение хи-квадрат с числом степеней свободы d1, X2 — хи-квадрат с числом степеней свободы d2. X1, X2 — независимы. Отношение X1 и X2, нормированных на свои числа степеней свободы, имеет распределение, которое называется распределением Фишера с числом степеней свободы d1 и d2. Варьируя d1 и d2, можно получать очень разные виды для функции плотности распределения Фишера. Некоторые из них вы видите на рисунке. Зачем эти распределения нужны? Для того чтобы начать с этим разбираться, давайте возьмем выборку объема N из нормального распределения с математическим ожиданием μ и дисперсией σ². Про выборочное среднее такой выборки мы уже знаем, что оно распределено тоже нормально, с тем же самым математическим ожиданием μ и дисперсией в n раз меньше — σ² / n. Что мы можем сказать про выборочную дисперсию? Если мы внимательно посмотрим на выражение для выборочной диспресии, мы увидим, что оно представляет собой сумму квадратов чего-то. Вот это что-то — это независимые, одинаково распределенные нормальные случайные величины. Поэтому неудивительно, что распределение выборочной дисперсии имеет какое-то отношение к распределению хи-квадрат. Действительно, специальным образом нормировав выборочную дисперсию, поделив ее на истинную дисперсию σ² и умножив на n − 1, мы получим величину, которая имеет распределение хи-квадрат с числом степеней свободы n − 1. Рассмотрим теперь еще одну полезную статистику, которая называется T-статистикой. Она представляет собой отношение разности выборочного среднего и истинного математического ожидания μ к корню из выборочной дисперсии, деленной на n, то есть в знаменателе стоит S / √n. Такая статистика имеет распределение Стьюдента с числом степеней свободы n − 1. Наконец, пусть теперь у нас есть две выборки, объемов N1 и N2, каждая из своего нормального распределения. Параметры первого — μ1, σ1, параметры второго — μ2, σ2. Если мы возьмем отношение выборочных дисперсий этих двух выборок, поделим их каждая на свою истинную дисперсию — σ1², σ2², — то такая величина будет иметь распределение Фишера с числом степеней свободы, определяемых объемами наших выборок. Число степеней свободы распределения Фишера = (n1 − 1, n2 − 1). Итак, в этом видео мы поговорили о том, как выглядят распределения хи-квадрат Стьюдента и Фишера, как они связаны с нормальным расперделением, а также увидели, какие статистики могут иметь такие распределения. Начиная со следующих видео, мы начнем разбираться с тем, как эти распределения и эти полученные знания можно использовать для построения доверительных интервалов.