Как узнать доверительную вероятность

Доверительные вероятности и уровни значимости.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

По выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании выборочных показателей, называют доверительными.

Понятие о доверительных вероятностях вытекает из принципа, что маловероятные события считаются практически невозможными, а события, вероятность которых близка к единице, принимают за почти достоверные. Обычно в качестве доверительных используют вероятности Р1 = 0.95, Р2 = 0.99, Р3 = 0.999. Определенным значениям вероятностей соответствуют уровни значимости, под которыми понимают разность α = 1–Р. Вероятности 0.95 соответствует уровень значимости α1= 0.05 (5%), вероятности 0.99 – α2 = 0.01 (1%), вероятности 0.999 – α3 = 0.001 (0.1%).

Это означает, что при оценке генеральных параметров по выборочным показателям существует риск ошибиться в первом случае 1 раз на 20 испытаний, т.е. в 5% случаев; во втором – 1 раз на 100 испытаний, т.е. в 1% случаев; в третьем – 1 раз на 1000 испытаний, т.е. в 0.1% случаев. Таким образом, уровень значимости обозначает вероятность получения случайного отклонения от установленных с определенной вероятностью результатов. Вероятности, принятые как доверительные, определяют доверительный интервал между ними. На них можно основывать оценку той или иной величины и те границы, в которых она может находиться при разных вероятностях.

Для различных вероятностей доверительные интервалы будут следующими:

— Р1 = 0.95 интервал – 1.96σ до + 1.96σ (рис. 5)

— Р2 = 0.99 интервал – 2.58σ до + 2.58σ

— Р3 = 0.999 интервал – 3.03σ до + 3.03σ

Доверительным вероятностям соответствуют следующие величины нормированных отклонений:

— вероятности Р1 = 0.95 соответствует t1 = 1.96σ

— вероятности Р2 = 0.99 соответствует t2 = 2.58σ

— вероятности Р3 = 0.999 соответствует t3 = 3.03σ

Выбор того или иного порога доверительной вероятности осуществляют исходя из важности события. Уровень значимости в таком случае – эта та вероятность, которой решено пренебрегать в данной исследовании или явлении.

Средняя ошибка Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность(m), или ошибка репрезентативности.

Выборочные характеристика, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой, или ошибкой репрезентативности. Статистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности.

Средняя ошибка вычисляется по формуле:

(5) Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность,

где σ – среднее квадратическое отклонение,

n – количество измерений (объем выборки).

Выражается в тех же единицах измерения, что и Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

Величина средней ошибки обратно пропорциональна численности выборочной совокупности. Чем больше размеры выборки, тем меньше средняя ошибка, а следовательно, меньше расхождение между значениями признаков в выборочных и генеральной совокупностях.

Среднюю ошибку выборки можно использовать для оценки генеральной средней согласно закону нормального распределения. Так, в пределах ±1 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьнаходится 68.3% всех выборочных средних арифметических Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, в пределах ±2 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность– 95.5% всех выборочных средних Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, в пределах ±3 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность– 99.7% всех выборочных средних Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

Поэтому, зная среднюю арифметическую выборки Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьи среднюю ошибку выборки Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, можно с определенной степенью вероятности судить о пределах, в которых заключены возможные величины выборочных средних. Средняя арифметическая выборки с учетом средней ошибки записывают с виде Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность± Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, либо Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность±2 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, либо Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность±3 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьв зависимости от значений лимитов (Хmax и Хmin). Лимиты при нормальной распределении не должны отклоняться за пределы 3 Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

Источник

Доверительная вероятность и доверительный интервал.

Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности,а сам интервал доверительным интервалом.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

на так называемый коэффициент Стьюдента. Коэффициенты Стьюдента Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьдля ряда значений Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьи n приведены в таблице.

Число измерений nДоверительная вероятность y
0,670,900,950,99
2,06,312,763,7
1,32,43,25,8
1,22,12,84,6
1,22,02,64,0
1,11,82,33,3
1,01,72,02,6

Окончательно, для измеряемой величины y при заданной доверительной вероятности y и числе измерений n получается условие

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Величину Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьмы будем называть случайной погрешностьювеличины y.

Пример: см. лекцию №5 – ряд чисел.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

При числе измерений – 45 и доверительной вероятности – 0,95 получим, что коэффициент Стьюдента приблизительно равен 2,15. Тогда доверительный интервал для данного ряда измерений равен 62,6.

Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные оператором:

— неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы;

— неправильная запись результата наблюдений, значений отдельных мер использованного набора, например, гирь;

— хаотические изменения параметров напряжения, питающего средства измерения, например, его амплитуды или частоты.

Источник

Доверительный интервал и доверительная вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Для подавляющего большинства простых измерений достаточно хорошо выполняется так называемый нормальный закон случайных погрешностей (закон Гаусса), выведенный из следующих эмпирических положений.

1) погрешности измерений могут принимать непрерывный ряд значений;

2) при большом числе измерений погрешности одинаковой величины, но разного знака встречаются одинаково часто,

3) чем больше величина случайной погрешности, тем меньше вероятность ее появления.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, (2)

где Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность— функция распределения случайных ошибок (погрешностей), характеризующая вероятность появления ошибки Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, σ – средняя квадратичная ошибка.

Величина σ не является случайной величиной и характеризует процесс измерений. Если условия измерений не изменяются, то σ остается постоянной величиной. Квадрат этой величины называют дисперсией измерений. Чем меньше дисперсия, тем меньше разброс отдельных значений и тем выше точность измерений.

Точное значение средней квадратичной ошибки σ, как и истинное значение измеряемой величины, неизвестно. Существует так называемая статистическая оценка этого параметра, в соответствии с которой средняя квадратичная ошибка равняется средней квадратичной ошибке среднего арифметического Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность. Величина которой определяется по формуле

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, (3)

где Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность— результат i-го измерения; Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность— среднее арифметическое полученных значений; n – число измерений.

Чем больше число измерений, тем меньше Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьи тем больше оно приближается к σ. Если истинное значение измеряемой величины μ, ее среднее арифметическое значение, полученное в результате измерений Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, а случайная абсолютная погрешность Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, то результат измерений запишется в виде Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

Интервал значений от Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьдо Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, в который попадает истинное значение измеряемой величины μ, называется доверительным интервалом. Поскольку Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьявляется случайной величиной, то истинное значение попадает в доверительный интервал с вероятностью α, которая называется доверительной вероятностью, или надежностью измерений. Эта величина численно равна площади заштрихованной криволинейной трапеции. (см. рис.)

Все это справедливо для достаточно большого числа измерений, когда Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьблизка к σ. Для отыскания доверительного интервала и доверительной вероятности при небольшом числе измерений, с которым мы имеем дело в ходе выполнения лабораторных работ, используется распределение вероятностей Стьюдента. Это распределение вероятностей случайной величины Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность, называемой коэффициентом Стьюдента, дает значение доверительного интервала Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьв долях средней квадратичной ошибки среднего арифметического Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность. (4)

Функция распределения табулирована (табл.1). Значение коэффициента Стьюдента находится на пересечении строки, соответствующей числу измерений n, и столбца, соответствующего доверительной вероятности α

Таблица 1.

nαnα
0,80,90,950,980,80,90,950,98
1,92,94,37,01,52,02,63,4
1,62,43,24,51,41,92,43,1
1,52,12,83,71,41,92,43,9

Пользуясь данными таблицы, можно:

1) определить доверительный интервал, задаваясь определенной вероятностью;

2) выбрать доверительный интервал и определить доверительную вероятность.

При косвенных измерениях среднюю квадратичную ошибку среднего арифметического значения функции Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятностьвычисляют по формуле

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность. (5)

Доверительный интервал и доверительная вероятность определяются так же, как и в случае прямых измерений.

Источник

t-критерий Стьюдента для проверки гипотезы о средней и расчета доверительного интервала в Excel

Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Гипотезы бывают разные. Одна из них – это гипотеза о средней (математическом ожидании). Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя (точную правду мы никогда не узнаем, но можем сузить круг поиска).

Распределение Стьюдента

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Тогда случайная величина

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

имеет стандартное нормальное распределение со всеми вытекающими отсюда последствиями. Например, с вероятностью 95% ее значение не выйдет за пределы ±1,96.

Однако такой подход будет корректным, если известна генеральная дисперсия. В реальности, как правило, она не известна. Вместо нее берут оценку – несмещенную выборочную дисперсию:

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Возникает вопрос: будет ли генеральная средняя c вероятностью 95% находиться в пределах ±1,96s. Другими словами, являются ли распределения случайных величин

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Впервые этот вопрос был поставлен (и решен) одним химиком, который трудился на пивной фабрике Гиннесса в г. Дублин (Ирландия). Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения.

Собрав математическое обоснование и рассчитав значения функции обнаруженного им распределения, химик из Дублина Уильям Госсет написал заметку, которая была опубликована в мартовском выпуске 1908 года журнала «Биометрика» (главред – Карл Пирсон). Гиннесс строго-настрого запретил выдавать секреты пивоварения, и Госсет подписался псевдонимом Стьюдент.

Несмотря на то что, К. Пирсон уже изобрел распределение Хи-квадрат, все-таки всеобщее представление о нормальности еще доминировало. Никто не собирался думать, что распределение выборочных оценок может быть не нормальным. Поэтому статья У. Госсета осталась практически не замеченной и забытой. И только Рональд Фишер по достоинству оценил открытие Госсета. Фишер использовал новое распределение в своих работах и дал ему название t-распределение Стьюдента. Критерий для проверки гипотез, соответственно, стал t-критерием Стьюдента. Так произошла «революция» в статистике, которая шагнула в эру анализа выборочных данных. Это был краткий экскурс в историю.

Посмотрим, что же мог увидеть У. Госсет. Сгенерируем 20 тысяч нормальных выборок из 6-ти наблюдений со средней () 50 и среднеквадратичным отклонением (σ) 10. Затем нормируем выборочные средние, используя генеральную дисперсию:

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты. Изобразим на диаграмме фактическое (Norm) и теоретическое (ENorm) распределение частот выборочных средних.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Точки (наблюдаемые частоты) практически совпадают с линией (теоретическими частотами). Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия – это лишь ошибки выборки.

Проведем новый эксперимент. Нормируем средние, используя выборочную дисперсию.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения. Обозначим эмпирическое частоты средних, скажем, через букву t.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Видно, что распределения на этот раз не очень-то и совпадают. Близки, да, но не одинаковы. Хвосты стали более «тяжелыми».

У Госсета-Стьюдента не было последней версии MS Excel, но именно этот эффект он и заметил. Почему так получается? Объяснение заключается в том, что случайная величина

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

зависит не только от ошибки выборки (числителя), но и от стандартной ошибки средней (знаменателя), которая также является случайной величиной.

Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить (или узнать) из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:

1. средняя и выборочная дисперсия s 2 являются независимыми величинами;

2. соотношение выборочной и генеральной дисперсии, умноженное на количество степеней свободы, имеет распределение χ 2 (хи-квадрат) с таким же количеством степеней свободы, т.е.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

где k – количество степеней свободы (на английском degrees of freedom (d.f.))

Вернемся к распределению средней. Разделим числитель и знаменатель выражения

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Числитель – это стандартная нормальная случайная величина (обозначим ξ (кси)). Знаменатель выразим из теоремы Фишера.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Тогда исходное выражение примет вид

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Это и есть t-критерий Стьюдента в общем виде (стьюдентово отношение). Вывести функцию его распределения можно уже непосредственно, т.к. распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам.

Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Вероятности и квантили t-критерия приведены в специальных таблицах распределения Стьюдента и забиты в функции разных ПО вроде Excel.

Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента.
Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

где ξ распределена по стандартному нормальному закону, а χ 2 k подчиняется распределению χ 2 c k степенями свободы.

Таким образом, формула критерия Стьюдента для средней арифметической

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

есть частный случай стьюдентова отношения

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

При k > 30 t-критерий практически не отличается от стандартного нормального распределения.

В отличие от хи-квадрат, t-критерий может быть одно- и двусторонним. Обычно пользуются двусторонним, предполагая, что отклонение может происходить в обе стороны от средней. Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность критерия.

Условия применения t-критерия Стьюдента

Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, т.к. сам по себе происходит из предположения о нормальном распределении исходных данных. Если данные не являются нормальными (что обычно и бывает), то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения.

Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Отличие довольно заметно в малых выборках до 15-20-ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения – это, конечно, нехорошо, но некритично.

Больше всего t-критерий «боится» выбросов, т.е. аномальных отклонений. Возьмем 20 тыс. нормальных выборок по 15 наблюдений и в часть из них добавим по одному случайном выбросу.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Картина получается нерадостная. Фактические частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей.

Итак, в не очень малых выборках (от 15-ти наблюдений) t-критерий относительно устойчив к ненормальному распределению исходных данных. А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. Часто из выборки удаляют все значения, выходящие за пределы ±2 стандартных отклонения от средней.

Пример проверки гипотезы о математическом ожидании с помощью t- критерия Стьюдента в MS Excel

В Excel есть несколько функций, связанных с t-распределением. Рассмотрим их.

СТЬЮДЕНТ.РАСП – «классическое» левостороннее t-распределение Стьюдента. На вход подается значение t-критерия, количество степеней свободы и опция (0 или 1), определяющая, что нужно рассчитать: плотность или значение функции. На выходе получаем, соответственно, плотность или вероятность того, что случайная величина окажется меньше указанного в аргументе t-критерия, т.е. левосторонний p-value.

СТЬЮДЕНТ.РАСП.2Х – двухсторонне распределение. В качестве аргумента подается абсолютное значение (по модулю) t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия (по модулю), т.е. фактический уровень значимости (p-value).

СТЬЮДЕНТ.РАСП.ПХ – правостороннее t-распределение. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Если t-критерий положительный, то полученная вероятность – это p-value.

СТЬЮДЕНТ.ОБР – используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы. На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Поэтому для левого хвоста нужен сам уровень значимости α, а для правого 1 — α.

СТЬЮДЕНТ.ОБР.2Х – обратное значение для двухстороннего распределения Стьюдента, т.е. значение t-критерия (по модулю). Также на вход подается уровень значимости α. Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, т.к. достаточно указать лишь два диапазона с данными и еще пару параметров. На выходе получим p-value.

ДОВЕРИТ.СТЬЮДЕНТ – расчет доверительного интервала средней с учетом t-распределения.

Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: средняя масса () составила 50,3кг, среднеквадратичное отклонение (s) – 0,5кг.

Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг? Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка.

Краткое условие в обще принятых обозначениях выглядит так.

Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению (или не сильно от него отличается). Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двусторонний t-критерий.

Вначале применим допотопные средства: ручной расчет t-критерия и сравнение его с критическим табличным значением. Расчетный t-критерий:

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Теперь определим, выходит ли полученное число за критический уровень при уровне значимости α = 0,05. Воспользуемся таблицей для критерия Стьюдента (есть в любом учебнике по статистике).

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

По столбцам идет вероятность правой части распределения, по строкам – число степеней свободы. Нас интересует двусторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: 1 — 0,05/2 = 0,975. Количество степеней свободы – это объем выборки минус 1, т.е. 9 — 1 = 8. На пересечении находим табличное значение t-критерия – 2,306. Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, т.к. t-распределение на небольших выборках имеет более приплюснутый вид.

Сравниваем фактическое (1,8) и табличное значение (2.306). Расчетный критерий оказался меньше табличного. Следовательно, имеющиеся данные не противоречат гипотезе H0 о том, что генеральная средняя равна 50 кг (но и не доказывают ее). Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-value попробовать найти, но он будет приближенным. А, как правило, именно p-value используется для проверки гипотез. Поэтому далее переходим в Excel.

Готовой функции для расчета t-критерия в Excel нет. Но это и не страшно, ведь формула t-критерия Стьюдента довольно проста и ее можно легко соорудить прямо в ячейке Excel.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Получили те же 1,8. Найдем вначале критическое значение. Альфа берем 0,05, критерий двусторонний. Нужна функция обратного значения t-распределения для двухсторонней гипотезы СТЬЮДЕНТ.ОБР.2Х.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Полученное значение отсекает критическую область. Наблюдаемый t-критерий в нее не попадает, поэтому гипотеза не отклоняется.

Однако это тот же способ проверки гипотезы с помощью табличного значения. Более информативно будет рассчитать p-value, т.е. вероятность получить наблюдаемое или еще большее отклонение от средней 50кг, если эта гипотеза верна. Потребуется функция распределения Стьюдента для двухсторонней гипотезы СТЬЮДЕНТ.РАСП.2Х.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

P-value равен 0,1096, что больше допустимого уровня значимости 0,05 – гипотезу не отклоняем. Но теперь можно судить о степени доказательства. P-value оказался довольно близок к тому уровню, когда гипотеза отклоняется, а это наводит на разные мысли. Например, что выборка оказалась слишком мала для обнаружения значимого отклонения.

Пусть через некоторое время отдел контроля снова решил проверить, как выдерживается стандарт заполняемости мешков. На этот раз для большей надежности было отобрано не 9, а 25 мешков. Интуитивно понятно, что разброс средней уменьшится, а, значит, и шансов найти сбой в системе становится больше.

Допустим, были получены те же значения средней и стандартного отклонения по выборке, что и в первый раз (50,3 и 0,5 соответственно). Рассчитаем t-критерий.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность
Критическое значение для 24-х степеней свободы и α = 0,05 составляет 2,064. На картинке ниже видно, что t-критерий попадает в область отклонения гипотезы.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Можно сделать вывод о том, что с доверительной вероятностью более 95% генеральная средняя отличается от 50кг. Для большей убедительности посмотрим на p-value (последняя строка в таблице). Вероятность получить среднюю с таким или еще большим отклонением от 50, если гипотеза верна, составляет 0,0062, или 0,62%, что при однократном измерении практически невозможно. В общем, гипотезу отклоняем, как маловероятную.

Расчет доверительного интервала для математического ожидания с помощью t-распределения Стьюдента в Excel

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов. Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости α, стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Как узнать доверительную вероятность. Смотреть фото Как узнать доверительную вероятность. Смотреть картинку Как узнать доверительную вероятность. Картинка про Как узнать доверительную вероятность. Фото Как узнать доверительную вероятность

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия
2. Более современным, рассчитав p-value, добавив степень уверенности при отклонении гипотезы.
3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия). Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю видеоролик о том, как рассчитать критерий Стьюдента и проверить гипотезу о генеральной средней в Excel.

Иногда просят объяснить, как делаются такие наглядные диаграммы с распределением. Ниже можно скачать файл, где проводились расчеты для этой статьи.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *