Статистика и котики. Владимир Савельев

Читать онлайн книгу.

Статистика и котики - Владимир Савельев


Скачать книгу
target="_blank" rel="nofollow" href="#image39_580a0e0dbd36dd2822f9bf73_jpg.jpeg"/>

      Надо сказать, что статистика в это время активно развивалась. Было разработано большое количество методов, которые, впрочем, не совсем подходили Госсету. Это происходило в силу малочисленности выборок растительных культур, используемых им в исследованиях. Поэтому в 1904 году Госсет отправился за советом в Лондонскую биометрическую лабораторию, которой руководил Карл Пирсон, один из самых видных статистиков XIX и XX веков. Их совместная переписка, продолжавшаяся вплоть до смерти Пирсона, внесла огромный вклад в развитие методов обработки данных.

      В 1907 году Госсет решился опубликовать свои наработки в журнале Пирсона «Биометрика». Фирма «Гиннесс» разрешила сделать это только на том условии, что никакие конкретные данные в нее не попадут, а сам автор возьмет себе псевдоним. Таким образом пивовар Уильям Госсет превратился в математика Стьюдента, чьим именем назван ряд статистических критериев и открытое им t-распределение.

      К слову, превращение ученых и инженеров в профессиональных статистиков не является такой уж редкостью. Так, Рональд Фишер был биологом, Фрэнк Вилкоксон – химиком, а Чарльз Спирмен – психологом.

      Глава 4.

      Как понять, что песики отличаются от котиков

      или p-уровень значимости

      Предположим, что вы вычислили t-критерий Стьюдента. Или U-критерий Манна-Уитни. Или какой-нибудь другой. Как же по нему понять, действительно ли песики и котики различаются по размеру? Чтобы это выяснить, статистики используют весьма нетривиальный подход.

      Во-первых, они делают предположение, что котики и песики как биологические виды абсолютно не отличаются друг от друга. Это предположение называется нулевой гипотезой.

      Следующим шагом они вычисляют вероятность того, что две случайно выбранные группы котиков и песиков дадут значение критерия большее или равное тому, которое мы получили (чаще всего без учета его знака). Эта вероятность называется p-уровнем значимости.

      Если p-уровень значимости меньше 5% (чаще записывается как 0,05), то нулевая гипотеза отвергается и принимается гипотеза о том, что котики и песики все-таки различаются. Такая гипотеза называется альтернативной.

      Если же p-уровень значимости больше 0,05, то нулевая гипотеза не отвергается.

      Однако, то, что она не отвергается, еще не значит, что она верна. Это означает только то, что в данном опыте мы не обнаружили значимых различий.

      В специальных статистических программах p-уровень значимости вычисляется автоматически, и нам достаточно просто найти его в соответствующей таблице. Однако, если у вас таких программ нет, то вам придется пользоваться таблицами критических значений.

      Работать с ними просто: найдите нужную строчку и посмотрите на значение критерия, которое там указано. Если то, что вы получили, превышает это значение, то котики и песики отличаются друг от друга. Правда, для этого правила


Скачать книгу