Футболоматика: как благодаря математике «Барселона» выигрывает, Роналду забивает, а букмекеры зарабатывают состояния. Дэвид Самптер

Читать онлайн книгу.

Футболоматика: как благодаря математике «Барселона» выигрывает, Роналду забивает, а букмекеры зарабатывают состояния - Дэвид Самптер


Скачать книгу
не означает, что оно никогда не произойдет. Значение вероятности равна 1, поделенной на количество раз, когда событие не происходило, плюс один (за сезон, которым мы сейчас интересуемся). В нашем случае это 1/(23+1) = 1/24. В 2010 году казалось, что нужно нечто экстраординарное, чтобы обойти рекорд Уго Санчеса[31].

      Раз в жизни

      Итак, смог ли Месси забить больше 38 голов и побить рекорд Трофея Пичичи в ходе чудесного для «Барселоны» сезона-2010/11? Если вы еще не проверяли «Википедию», я могу вам сказать. Нет. Месси забил 31 мяч, на один меньше показателя предыдущего сезона. С другой стороны, Роналду улучшил свои результаты в Ла Лиге, забив 41 мяч, и получил Трофей Пичичи[32]. Оглядываясь назад, всегда трудно сказать: 23/1 – это хорошие шансы на успех или нет. Это безусловно было достижением, которое превзошло предыдущие рекорды. Успех Роналду мог показаться свершением, «которое бывает только раз в поколение».

      То, что произошло дальше, полностью опровергло нашу модель угадывания. В сезоне-2011/12 года Роналду забил 46 мячей, спокойно обойдя все предыдущие рекорды. Но Месси отгрузил 50 в 37 матчах. Не один, а сразу два игрока превзошли прошлогодние показатели. В сезоне-2012/13 водопад голов продолжился: Месси закончил чемпионат с показателем в 46 мячей, а Роналду – 34. В следующем сезоне было небольшое падение: Месси выпал из гонки, а португалец набрал 31 забитый мяч. Но в сезоне-2014/15 Роналду вернулся, наколотив 48 голов.

      50 голов Месси в одном сезоне действительно исключительны, но насколько они исключительны? Расчеты, которые мы совершили до этого, позволяют нам говорить о том, какова вероятность падения рекорда в следующем сезоне. Но они не показывают нам, насколько больше голов будет забито. Как часто мы предполагаем, что в одном сезоне Ла Лиги кто-то забьет 50 мячей? На этот вопрос мы можем ответить. Но для этого нам понадобится не игра в угадайку, а немного более продвинутая математика. Мы применим математическую модель, которая называется распределение экстремальных значений.

      Распределение экстремальных значений является математической моделью всех типов экстремумов, будь то самые жаркие или дождливые дни, скорость ветра или голы в Испании. Для его применения должны выполняться два ограничения. Первое ограничение заключается в том, что количество голов, забитых за один сезон, не должно влиять на количество забитых голов в следующем сезоне. Это вполне логично: как мы видели в главе 1, время для одного гола мало или вообще не влияет на время для следующего. Суть второго ограничения в том, что голевые тенденции не должны сравниваться с тенденциями прошлого года. Это сложнее, потому что баланс между атакой и защитой может меняться от сезона к сезону. Мы вернемся ко второму условию позже, но пока допустим, что оно соблюдается. Давайте посмотрим, что говорит нам теория экстремальных значений.

      На рисунке 4.2 показана гистограмма для главных бомбардиров от сезона-1986/87 до сезона-2013/14. Сплошная линия – это кривая для распределения экстремальных значений[33]. Используя модель с экстремальными значениями,


Скачать книгу

<p>31</p>

Игра в угадайку не является очень надежной. Хороший пример ее неверности: я жив сегодня, был жив вчера и в течение примерно 15 тысяч дней. Следуя логике игры, вероятность того, что я завтра умру, составляет менее 1/15 000. Когда мне исполнится 100 лет, эта вероятность будет равна лишь 1/36 525. Чем дольше я живу, тем меньше шансов умереть! Все модели имеют свои ограничения, и моделист должен знать о них.

<p>32</p>

Официальная статистика Ла Лиги считает 40 голов Роналду. Эксперты Трофея Пичичи присудили один гол Пепе на счет Криштиану.

<p>33</p>

Представленная здесь форма – это распределение Гумбеля. Вероятность того, что топ-бомбардир забьет G или меньше голов, равна , где a = 5,44 и b = 26,9 являются параметрами, полученными из данных. Распределение Гумбеля является наиболее распространенной формой распределения экстремальных значений и наиболее подходящей, поскольку соответствует случаю, когда распределение выборок имеет экспоненциальный хвост.