Почему средние показатели могут искажать прогнозы? Модус и медиана: важные понятия в беттинге

Роман Громов
Блог букмекерской конторы Pinnacle Sports подготовил материал о влиянии средних показателей на прогнозирование спортивных событий и проблемах, которые они могут создавать для игроков. «Рейтинг Букмекеров» русифицирует материал.

Содержание

Статья Pinnacle Sports

Самый популярный метод обработки данных в беттинге — использование средних показателей, но является ли этот метод самым полезным? Модус и медиана зачастую лучшая альтернатива, поэтому их понимание имеет решающее значение для успешности ставок.

Проблема средних показателей для игроков в букмекерских конторах

Из-за простоты многие игроки используют средние показатели для оценки команды в статистическом выражении. Но многие ли знают об ограниченности этого метода?

Читайте также:

К примеру, делая ставки на общий тотал голов в футболе, игроки могут полагать, что высчитав среднее количество мячей, забитое за предыдущие игры, они могут предсказать точное количество голов, которое ожидается в предстоящем матче. Но действительно ли здесь уместно использование средней результативности?

В качестве примера давайте рассмотрим количество голов, забитых в английской Премьер-лиге, по сравнению с испанской Примерой в сезоне 2013/2014. Среднее количество голов за игру в этих лигах составило 2.77 и 2.75 соответственно. Эти данные могут привести игрока к мысли, что в Ла Лиге матчи чаще играются на тотал меньше 2.5, чем в АПЛ. Тем не менее это не так — 48.4% матчей в АПЛ заканчиваются на ТМ2.5, по сравнению с 47.3% в Примере.

Хотя общее распределение количества голов схоже, в АПЛ чаще всего забивают два гола за матч, а в Примере этот показатель составляет 3 гола, как можно понять по изображению ниже. Средний показатель маскирует и скрывает от нас этот факт.

Средние показатели при прогнозировании

Почему так происходит? Хотя средние показатели дают нам общую картину результативности, они не показывают, как распределяются голы.

Другой пример опасности использования средних показателей — при ставках на гандикапы в матчах «футбольных карликов», которые считаются мальчиками для битья в каждой отборочной кампании. Но так ли они плохи, какими их пытаются представить? Среднее количество голов в их матчах может достигать больших показателей, однако эта цифра может возникнуть в результате редких, но очень крупных поражений команды. В итоге игроки ошибаются, часто переоценивая ожидаемое количество голов в матче.

Ниже мы рассмотрим альтернативы средним показателям — модус и медиану, и используем три набора чисел и два сценария, при которых средний показатель не даст адекватную информацию.

Рассмотрим следующие наборы чисел (в каждом из них средне арифметическое равняется 5).

Набор А: 4, 5, 5, 5, 6
Набор B: 3, 4, 4, 4, 10
Набор C: 3, 4, 5, 6, 7

Первый сценарий: наличие отклонений в меньшую или большую сторону

Хотя все три набора имеют одинаковое среднее арифметическое и сумма чисел в каждом наборе равняется 25, они имеют совершенно разное распределение.

Набор А можно назвать симметрично распределенным. Два числа из пяти одинаково отклоняются в большую и меньшую стороны от среднего значения: 4 меньше 5, а 6 больше 5 на одинаковую величину.

Средняя величина идеально подходит для использования в случаях с симметричным распределением, когда отклонения от среднего значения одинаковы и происходят одинаково часто, и средняя величина находится в середине множества значений.

В противоположность подобному распределению Набор В насчитывает четыре числа меньше среднего и только одно выше. Это можно назвать асимметричным распределением.

При использовании большой базы данных игроки могут проверить пригодность среднего показателя для анализа с помощью других методов измерения — модуса и медианы.

Медиана — это значение, которое лежит в середине распределения, в порядке возрастания или убывания. В наборах А и В это число 5 и 4 соответственно.

Модус — это наиболее часто повторяющаяся величина, и в наборах А и В это также соответственно 5 и 4.

Симметричное распределение должно иметь одинаковые среднюю, медиану и модус. Разница между двумя последними величинами и средней в Наборе В говорит о том, что это несимметричное распределение, и поэтому средняя не является идеальной величиной в данном случае.

Второй сценарий: разные распространения

Два набора из нашего примера могут быть оба симметрично распределены, но не в равной степени распространяться. К примеру, Набор С симметрично распределен, как и Набор А, потому что они имеют равные величины выше и ниже средней, а также отклонение от средней одинаково в обе стороны в обоих наборах.

Тем не менее хотя средняя арифметическая в обоих наборах 5, использование средней величины является более подходящим для Набора А, поскольку он содержит большее количество чисел, равных средней величине. Разница между двумя этими наборами лежит в дисперсии в значениях каждого набора. Поэтому мы должны измерить и эту дисперсию.

Чтобы сделать это, игроки должны высчитать диапазон и стандартное отклонение. Диапазон — это разница между максимальным и минимальным значениями, вычислить диапазон совсем не сложно. С другой стороны, стандартное отклонение является более сложным показателем. В общих словах, применительно к данной статье, эта величина отражает изменение значений в наборе относительно средней величины.

Набор А и С имеют диапазоны 2 и 4 соответственно, в то время как их стандартные отклонения составляют 0.71 и 1.58. Раз обе эти величины выше в Наборе С, мы можем сделать вывод, что распространение в ней выше.

Вывод

Понимая ограниченность средних показателей, перекос распределения и различия в дисперсии, игроки окажутся в более выгодном положении, используя эти методы в прогнозировании.

Нашли ошибку?Сообщите о ней
Остались вопросы? Спросите у наших знатоков!
Комментарии 3
  • Данный вид анализа наиболее пригоден для хорошего экспресса на тур одной из лиг ТОП-5, но никак ни на матчи ЛЧ. Здесь совершенно другие задачи и мотивация футболистов.

  • Когда я, будучи молодым, работал в одном из пунктов приема одной из популярных контор, у меня был постоянный клиент, профессор математики из университета напротив. Так вот у него были методы гораздо поизащреннее этого вашего графика).Сказать , что он выигрывал? Да нет, скорее напротив, это было похоже на наркоманию, т к, его статус и образование не позволяло ему признать ошибки его методов мат анализа. моё мнение, что каждый матч уникален (что касается тенниса) и сложно прицепить эти графики к многим спортсменам , процент из которых ставит на себя