Нарушения не прощаются! Они караются штрафными бросками в баскетболе. Продвинутая статистика нхл

Известный американский баскетбольный аналитик, работавший в командах НБА Денвер «Наггетс» и Сиэтл «Суперсоникс», автор книги о баскетбольной статистике «Basketball on paper» Дин Оливер выделил четыре ключевых фактора в игре, больше всего влияющих на конечный результат.

Эти четыре фактора относятся к четырем разным баскетбольным навыкам и они достаточно независимы друг от друга.

Первый и самый важный фактор в игре это попадания мяча в корзину. С самых первых дней, как только баскетбол был придуман Джеймсом Нейсмитом главной его задачей было забить мяч в корзину и не дать забить другой команде. В этом плане ничего со времен изобретения игры не изменилось. Однако считать просто процент попадания с игры не совсем корректно. Например, если игрок выполнил 6 бросков с игры и все двух очковые и забил 3 раза, то он набрал 6 очков с процентом попадания с игры 50. Если же баскетболист выполнил 6 бросков с игры из них все трехочковые и попал 2 раза, он набрал те же 6 очков за 6 атак, но процент попадания с игры у него всего 33. Поэтому за оценку фактора попадания бросков с игры был взят показатель эффективный процент попадания, который рассчитывается по следующей формуле:

Эф. ПП% = (П + 0.5*ЗБ 3очк) /СИ, где

П – общее количество попаданий с игры

ЗБ 3очк – забитые трех очковые мячи

СИ – общее количество бросков с игры.

Вторым фактором, который влияет на игру является бережное отношение к мячу и сведение к минимуму количество потерь мяча в игре. Это фактор может быть очень важным особенно в матчах детского и юношеского уровня, где дриблинг и передача еще не до конца разученные элементы игры в арсенале юных баскетболистов. Возможно, что некоторые совсем молодые игроки не способны перевести мяч через половину площадки, что означает отсутствие возможности даже бросить в атаке. В профессиональном баскетболе такая проблема не так явно выражена в виду того, что в каждой команде есть несколько игроков, которые способны перевести мяч на половину соперников, поэтому прессинг по всей площадке на высшем уровне далеко не так часто приносит успех, чем на детских или юношеских соревнованиях. Однако и на самом высоком уровне количество потерь мяча могут играть определяющую роль в успехе или не успехе команды. Так как потери лишают команду нападения даже возможности произвести бросок в атаке.

Данный фактор лучше всего отразить как отношение общего количества потерь к общему количеству владений мячом в матче.

% ПТ = ПТ/Вл, где

ПТ – общее количество потерь в матче,

Вл – Общее количество владений команды в матче.

Вл = СИ – ПдН + ПТ + 0.4* ШТв, где

СИ – общее количество бросков с игры;

ПТ- общее количество потерь в матче;

ШТв – количество выполненных штрафных.

Третий фактор, который влияет на результат матча – это подборы в нападении. Если команда способна вернуть себе мяч после промахов, то в общем и целом она способна решить проблему первого фактора – эффективного процента попадания. Понятно, что при подборах в нападении, цель забить мяч в корзину остается, но возможность повторной атаки кольца, может сослужить хорошую службу в матчах, когда бросок просто напросто «не идет».

Дин Оливер рассматривает способность команды подбирать в нападении, путем вычисления отношения подборов в нападении к общему числу подборов на чужом щите.

ПдН % = ПдН/(ПдН + ПдЗ прот), где

ПдН – количество подборов в нападении;

ПдЗ прот – количество подборов команды соперника на своем щите.

Четвертым фактором является способность вставать на линию штрафных бросков как можно чаще. Именно способность пробивать штрафные броски, а не «забивать штрафные» или показывать высокий процент попадания со штрафных. Команды, которые встают на линию штрафных чаще более эффективны, чем команды, которые забивают штрафные с более высоким процентом попадания. В любом матче могут быть исключения из правил, и команды могут проигрывать матчи не попадая штрафные, но в долгосрочном анализе способность часто вставать на линию штрафных позволяет выигрывать командам больше матчей, чем несколько промахов со штрафной линии проигрывать.

1) Рассчитывается отношение ШТв/СИ, где

ШТв – общее количество выполненных штрафных бросков;

2) рассчитывается способность попадать штрафные броски ШТз/СИ, где

ШТз –количество забитых штрафных бросков;

СИ – общее количество выполненных бросков с игры.

В книге был проведен анализ статистических показателей, где Дин Оливер определил что не все факторы одинаково равноценны. Команда может превосходить соперников по трем из четырех факторов, но все равно проиграть. Команда может выделяться в трех категориях, но быть слабой в четвертой и добиться среднего результата. Определение ценности каждого из этих факторов очень важно и помогает определить стратегию построения успешной команды.

Если производить оценку важности и ценности факторов по 10-тибальной шкале то:

1. Эффективный процент попадания – 10 баллов.

2. Отношение потерь к общему количеству владений – 5-6 баллов.

3. Процентное соотношение подборов в нападении – 4-5 баллов.

4. Способность часто пробивать штрафные броски – 2-3 балла.

В процентом соотношении важности эти факторы будут располагаться в следующем виде:

1. Эффективный процент попадания (40 %).

2. Отношение потерь к общему количеству владений – (25 %).

3. Процентное соотношение подборов в нападении – (20 %).

4. Способность часто пробивать штрафные броски – (15 %).

Проводя свои статистические исследования для матчей НБА можно увидеть, что команда, которая показывала более высокий процент попадания с игры выигрывала 79 % матчей.

Важность попадания в баскетболе неоспорима, но если команда теряет мяч, то она также теряет возможность не только попасть, но и даже выполнить попытку броска. В НБА команды, которые меньше всего теряли мяч выигрывают 58 % матчей. А если процент попадания двух соперников по итогам игры был примерно одинаков, то команды, которые теряли мяч реже, выигрывали 69 % матчей.

При примерно равном проценте попадания двух команд еще одним немаловажным фактором является подборы в нападении – команда, которая собирала больше отскоков в нападении выигрывала 63 % своих матчей.

Команды, которые набирают меньше персональных замечаний выигрывают в 67 % случаев.

После выхода статьи о важности темпа в баскетболе , многие начали активно использовать этот инструмент в своих анализах. На почту всё чаще стали приходить письма с просьбой объяснить, как правильно считать владения и атаки в баскетбольном матче.

Есть несколько формул подсчета, которые можно использовать. Всё зависит от ваших целей. Если вы пишите дипломную работу, то надо использовать точную математическую формулу.

В ставках же важна не точность подсчета, а системность вашей работы. Важно видеть перед собой общую картину по команде и чемпионату, а не отталкиваться от тех 3-5 матчей, на которые у вас хватило времени.

Точная формула подсчёта владений

С помощью этой формулы вы сможете подсчитать точное количество переходов соперника через середину поля, так как она не учитывает владения, которые образуются после подборов в нападении и компенсирует ситуации, когда игрок пробивает фол после забитого броска.

Количество владений = 0,96 * (FGA – Orb + TO + (0.44*FTA))

Условные обозначения:

  • FGA – количество бросков (двухочковые и трехочковые)
  • ORb – подборы в нападении
  • TO – потери
  • FTA — количество штрафных бросков
  • Коэффициент 0,44 применяется для того, чтобы не учитывать ситуации, когда игрок забивает с фолом и пробивает дополнительный штрафной.
  • Коэффициент 0,96 используется для того, чтобы закрыть погрешность, которая образуется из-за командных подборов в нападении. Например, в ситуациях, когда в борьбе за отскок мяч уходит в аут от защищающейся команды, нападающая команда получает возможность для атаки, но оно не будет входить в графу подборы в нападении.

Для подсчета владений чаще всего используют упрощенную формулу, которая не включает в себя компенсацию за командные подборы в нападении.

Количество владений = (FGA + TO + (0.44*FTA))

На увеличение математического темпа игры могут иметь и штрафные броски. Например, в финале Евролиги 2007 года команды пробили 71 штрафной. Хотя возможностей для атаки было всего 158 и близко к среднему по чемпионату (162).

Упрощенная формула

Я предпочитаю учитывать не только количество подборов в нападении, но и то насколько успешно команда борется в нападении за щит. Поэтому в своей формуле я беру в расчёт владения, которые команда набирает за счет активной борьбы на чужом щите:

Количество владений = 2FG + 3FG + TO + FT/2

Вместо умножения на 0,44 количество штрафных я всегда делю на два, чтобы легче было считать в уме, а значение всегда округляю в меньшую сторону.

Но для объективного расчёта своего значения тотала важно учитывать скорость игры. Потому что довольно часто случаются матчи, в которых команды делают по 15 подборов в нападении, а это даёт лишних 30 владений.

Для подсчета количества атак в матче, я использую следующую формулу:

Количество атак = 2FG + 3FG + TO + FT/2 — oRb

  • где oRb — подборы в нападении

В этой статье приводится подробная информация об эффективности набора очков, использовании трехочковой линии в современной лиге NBA (с 2010 г.), причинах увеличения частоты выполнения трехочковых бросков, включая сведения о том, как Стефен Карри и Golden State Warriors (GSW) смогли завоевать победу в непростом для команды чемпионате сезона 2014–2015 гг. благодаря эффективному набору очков.

Прошло уже более трех десятилетий с момента введения трехочковой линии в баскетболе. Хотя о ней не говорилось в оригинальных 13 правилах, она является важным элементом игры в баскетбол и в течение последних 5 лет находится в центре внимания в NBA.

Для начала следует вернуться в прошлое – к началу сезона NBA 2013–2014 гг. Леброн Джеймс и Heat, в составе которой уже были прославленные и знаковые игроки, отыграли сезон чемпионата NBA, одержав верх над San Antonio Spurs со счетом 4–3 в финале NBA.

Тем не менее когда сезон начался, что-то изменилось. Как известно большинству, к тому моменту Леброн Джеймс и остальные четыре игрока стартового состава уже сыгрались как команда, но один игрок вдруг стал выделяться все больше и больше. Этим игроком был Шейн Баттье.

Баттье нельзя отнести к типичным игрокам. День за днем он просматривал записи игр начиная с 2009 г., когда в NBA начали повсеместно использовать метод видеоанализа. Он с такой тщательностью изучал игровые склонности баскетболистов, что это заинтересовало тренерский состав лиги и вызывало вопрос «А что если..?».

К этой истории можно отнестись как к очередному забавному случаю, но именно тогда ситуация стала меняться.

Страхуют ставки

Очевидно, что определенную роль сыграли и другие факторы. Руководители, среди которых были Сэм Хинки (бывший руководитель главного офиса PHI), Дэрил Мори (в настоящее время являющийся генеральным менеджером HOU) и Боб Майерс (в данный момент занимает должность генерального менеджера GSW), стали обращать внимание на важность цифр и статистического анализа в конце сезона игр лиги.

Увеличение количества трехочковых бросков

По правде говоря, введение трехочковой линии, которое произошло еще до сезона NBA 1979–1980 гг., было сделано преднамеренно и изменило ход игры, расширив оригинальные 13 правил современного баскетбола.


Выше представлен график, на котором ясно показано, что после появления трехочковой линии тенденции набора очков резко изменились по всей лиге NBA. Но как это доказывает точку зрения, что выполнение броска с трехочковой линии способствует существенному повышению результативности?

Очевидный ответ заключается в том, что в настоящее время значение выполненного броска возросло для стороннего наблюдателя. Однако для того чтобы лучше понять суть этого явления, давайте изучим приведенный ниже график.


За последние 8 сезонов NBA (с 2010 по 2018 гг.) число попыток выполнения результативных трехочковых бросков резко увеличилось, так как команды осознали, что для получения очка требуется приложить куда больше усилий, а потому и результативность этих попыток также возросла.

Естественно, что если увеличивается частота выполнения броска одного типа, то количество бросков другого типа уменьшается. Согласно данным basketball-reference.com, откуда взяты все данные для этой статьи, наиболее популярным видом броска в играх NBA в период с середины 80-х гг. и до начала 2000-х гг. был бросок со средней дистанции.

Все команды пришли к единодушному мнению, что попытки выполнения трехочковых бросков, особенно из угла, статистически дают на 20–35 % больше шансов на победу в игре: на это указывают результаты вычисления вклада игроков в общую победу. Эти вычисления широко используются аналитиками команд и специалистами по обработке и анализу данных во всей лиге.

Боб Майерс, занимающий должность генерального менеджера GSW, является одним из самых авторитетных менеджеров высшего звена, который стал уделять приоритетное внимание игре с цифрами как ключевому фактору достижения победы.

До сих пор Golden State удавалось оставаться успешной командой благодаря результативным броскам, с легкостью выполняемым Стефеном Карри из-за дуги (близко к середине площадки). Клей Томпсон эффективно помогает Карри в реализации этих трехочковых бросков. Они даже получили совместное прозвище Splash Brothers как лидеры лиги по результативным трехочковым броскам.

Трехочковые броски и ставки на матчи NBA

Можно с уверенностью утверждать, что в современной лиге NBA явление эффективного набора очков стало тенденцией, которая влияет на процесс размещения ставок. Игроки могут делать ставки с большей эффективностью, используя для этого расширенные статистические данные, которые теперь доступны широкой публике.

В своем окончательном комментарии я бы сказал, что эффективность результативных трехочковых бросков очевидна. Выполнение бросков этого типа привело к увеличению количества очков, повысив средний балл по всей лиге NBA до отметки 100–101 балл, что совпадает с показателем, который был зафиксирован, когда трехочковая линия была введена впервые.

Однако существует одна интересная закономерность, которая проявляется все более и более явно. Тенденция к повышению числа результативных трехочковых бросков связана с игроками, которые в отличие от традиционных защитников, форвардов и центровых могут играть на большинстве позиций на площадке.

С увеличением количества в лиге игроков, способных играть на большинстве позиций, возможно, произойдет увеличение числа бросков со средней дистанции или двухочковых бросков с дальней дистанции, а также постепенный рост популярности попаданий с фолами.

Делающим ставки игрокам следует отслеживать информацию на веб-сайте stats.nba.com. На этом ресурсе приведены наиболее точные статистические данные, доступные широкой публике. Эти данные могут помочь вам понять, как в командах реализуются игровые склонности баскетболистов.

Всем хорошо известна фраза:

"Существуют три вида лжи: ложь, наглая ложь и статистика" .


Известность данное высказывание получило благодаря Марку Твену, но истинный автор данной фразы достоверно неизвестен.

Итак, речь пойдет о статистике и возможностях ее использования для благого дела - заработка денежных знаков у букмекера.

НЕМНОГО ИСТОРИИ

Статистику как средство оценки эффективности работы команды тренеры НХЛ используют давно. Родоначальником аналитики в НХЛ можно считать Роджера Пола Нильсона, который еще в конце 60-х будучи тренером начал использовать различные статистические метрики.

Остальные исторические аспекты можно опустить и сразу перейти к сезону 2014/2015.
Именно к этому сезону был обновлен сайт НХЛ и вместе с его запуском обновился и статистический модуль сайта, в который впервые вошли показатели продвинутой статистики.
Таким образом, начиная с сезона 2014/2015 продвинутая статистика публикуется лигой в открытом доступе.

CORSI, FENWICK, PDO

Наиболее популярными показателями продвинутой статистики являются:

  • CORSI
  • FENWICK

CORSI = количество бросков в створ ворот + количество бросков мимо ворот + заблокированные броски


FENWICK = количество бросков в створ ворот + количество бросков мимо ворот

PDO = процент реализации бросков + процент отраженных бросков

То есть Фенвик по сути тот же Корси без заблокированных бросков.

CORSI существует двух видов:
CF (Corsi For) - атакующие действия команды: броски, броски в створ, заблокированные соперником броски;
CA (Corsi Against) - атакующие действия соперника: броски соперника; броски в створ, нанесенные соперником; заблокированные броски соперника.

То есть упрощенно, CF - оценивает атаку, CA - оценивает оборону.

Я буду оперировать показателем CF% .

CF% = 100* CF / (CF + CA)

То есть CF% показывает стиль игры команды. Если он равен больше 50%, то это означает, что команда исповедует атакующий стиль игры.

TEAM CF%
Los Angeles 54.6
St. Louis 54.4
Carolina 54.0
Boston 53.5
Florida 53.0
Philadelphia 52.6
San Jose 52.2
Washington 52.1
Calgary 51.1
Tampa Bay 50.7
Toronto 50.5
Winnipeg 50.4
Chicago 49.8
Pittsburgh 49.8
Colorado 49.8
Vancouver 49.5
Edmonton 49.4
Anaheim 49.2
Dallas 49.2
Nashville 49.2
Montreal 49.1
Buffalo 49.0
NY Rangers 48.6
New Jersey 48.2
Minnesota 47.8
Ottawa 47.5
Arizona 46.6
NY Islanders 46.4
Columbus 46.2
Detroit 45.4

Синим выделены команды с CF% больше 50% , то есть команды с атакующим стилем игры.

Зеленым выделены команды с CF% меньше 50% , то есть команды с защитным стилем игры.

Кстати говоря, Лос-Анджелес и в прошлом сезоне был лидером по этому показателю.
Бросается в глаза отсутствие Далласа в списке атакующих. Все-таки звездные имеют ярко выраженный атакующий стиль игры и в прошлом сезоне они по этому показатлю были третьими.
Но думаю массовые травмы тому виной. Сейчас у Далласа в список травмированных внесены: Спецца, Шарп, Гудлер, Хемски, Икин, Янмарк. Это все форварды и форварды далеко не последнюю роль играющие в команде. Тем самым глубина, да и потенциал атаки в их отсутствие резко снижается.
Думаю, как начнет пустеть лазарет Далласа, начнет расти их CF%.

Сразу хочу отметить, что CF% никак не влияет на успешность выступления команды
(вроде бы не влияет ).

В доказательство приведу график, на котором представлен список команд по местам в турнирной таблице слева направо и распределение Корси в соответсвии с этим расположением.


Итак, как видно из графика по Корси сложно оценивать (прогнозировать) успешность команды.
Но есть одно НО.

Победитель Кубка Стэнли сезона 2015/2016 Питтсбург имел 2-й показатель CF% в лиге 52,7% .
Победитель Кубка Стэнли сезона 2014/2015 Чикаго имел 2-й показатель CF% в лиге 53,6%.
Победитель Кубка Стэнли сезона 2013/2014 Лос-Анджелес имел 1-й показатель CF% в лиге 56,8%.
Победитель Кубка Стэнли сезона 2012/2013 Чикаго имел 4-й показатель CF% в лиге 54,1%.
Победитель Кубка Стэнли сезона 2011/2012 Лос-Анджелес имел 2-й показатель CF% в лиге 54,8%.

Таким образом, все обладатели Кубка Стэнли последних лет являлись лидерами лиги по Корси.
И кстати все финалисты также имели Корси выше 50%.

PDO

Теперь разберем показатель PDO.
Напомню, что PDO = процент реализации бросков + процент отраженных бросков.


Принято считать, что нормой значения для показателя PDO является 100.
PDO многие эксперты называют не иначе как показателем везения.
То есть считается, что команды, имеющие показатель PDO выше 100, являются везунчикам, то есть их результат во многом достигнут либо запредельно высокой реализацией бросков, либо вратарем, который тащит почти все.
Соотвественно, команды с PDO меньше 100 - невезучие.

Но как-то не хочется соглашаться на эти условности в виде границы везения/невезения в 100 пунктов.

Давайте посмотрим на статистику предыдущих сезонов.

PDO 2011/2012 от 97,8 до 101,5
PDO 2012/2013 от 96,1 до 103
PDO 2013/2014 от 98 до 102,5
PDO 2014/2015 от 97,1 до 101,9
PDO 2015/2016 от 98,3 до 102,4

Как видим, за последние 5 сезонов PDO находится в диапазоне от 96 до 103 .

Теперь, если обратимся к текущим показателям сезона 2016/2017 (таблица выше), то увидим, что несколько команд имеют явно завышенные значения PDO .

К их числу относятся:

Chicago (105,3)
Monreal (105,1)
NY Rangers (104,9)
Columbus (104,1)
Minnesota (104)

Ни в одном из последних 5 сезонов ни у одной из команд не было столь высоких значений PDO.

То есть можно сделать вывод, что выше указанным командам пока очень сильно везет и следует ждать снижения PDO для этих клубов .

В чем же именно кроется это везение?

Как известно PDO складывается из процента реализации бросков (в таблице SH% )
и процента отраженных бросков (в таблице SV% ).

Чтобы оценить норму этих показателей, вновь обращюсь к предыдущим сезонам.

SH% 2011/2012 от 6,03 до 9,73 (лишь у 2-х команд показатель был больше 9)
SH% 2012/2013 от 5,77 до 10,57 (у 4-х команд показатель больше 9, у одной команды больше 10)
SH% 2013/2014 от 5,84 до 9,83
SH% 2014/2015 от 5,72 до 9,03
SH% 2015/2016 от 6,36 до 8,95

Выводы:

  • За 5 лет лишь у одной команды SH% был больше 10, а именно 10,57.
  • Единичны случаи с SH% больше 9 (8 команд за 5 лет), то есть вероятность этого события на уровне 5%.
  • Последние 4 сезона отмечается тенденция снижения SH%.

А теперь давайте вновь обратимся к нашей табличке (см. выше).


NY Rangers имеет SH% равный 12,65.
Columbus имеет SH% равный 10,39.

Это явно завышенные значения, которые будут снижаться.

Minnesota 9,93
Montreal 9,58
NY Islanders 9,09

Тоже достаточно высокие значения, расти явно не будут, скорее всего также следует ожидать снижения SH% для этих команд.

Вот мы и нашли причину так называемого везения 4 из 5 команд из списка выше.
Осталось Чикаго.

Ну а Чикаго имеет самый высокий SV% (процент отраженных бросков) в лиге и равняется он 96,41% .

Процент отраженных бросков (SV%) за последние 5 сезонов принимал значения в диапазоне
от 89% до 94% .

Так что Чикаго имеет явно завышенное значение этого показателя на текущий момент и следует ждать его снижения.

Также на текущий момент SV% завышен у Монреаля (95,55%) и Нью-Джерси (94,53%) .

Таким образом, используя показатели продвинутой хоккейной статистики можно оценивать стили игры команд (по Корси); комбинируя несколько показателей определять ключевые точки успеха команд.

Например, текущий лидер лиги Монреаль занимает лишь 21-е место по Корси (CF%).
При этом имеет завышенные значения показателей PDO, SH%, SV%.

То есть Монреаль побеждает за счет сверх надежной игры Прайса, завышенной реализации бросков (которых не так много относительно всей лиги), ну и больше тяготеет к игре от обороны.

Учитывая, что целых 2 показателя (SH% и SV%) у Монреаля имеют явно завышенные значения, предположу, что команда не останется на вершине таблицы и в будущем стоит ждать их снижения (если конечно они не сделают какой-то супер скачок вперед в своей игре).

Ну и не забываем, что до финала Кубка Стэнли не доходят команды с Корси (CF%) ниже 50%)))

В общем, с помощью продвинутой статистики можно нарисовать портрет каждой команды, оценить слабые и сильные стороны, понять игровую концепцию и так далее.

Все это может быть (и должно быть) одним из элементов принятия решения о ставке на тот или иной матч.

Прошу в комментариях делиться своими мыслями на этот счет.

Если тема интересна, продолжу публиковать в блоге статьи данного направления.

ВСЕМ УДАЧНЫХ СТАВОК!! !
(кстати прогнозы на сегодняшние матчи опубликую чуть позже).

Представьте, что вы подбрасываете монетку до тех пор, пока два раза подряд не выпадет «орел». Сколько бросков (в среднем) вам потребуется?

А теперь другой эксперимент: вы подбрасываете монетку до тех пор, пока последовательно не выпадет пара «орел + решка» (именно в таком порядке). Сколько бросков (в среднем) потребуется для этого?

Прежде чем вы начнете решать, попробуйте угадать, одинаковы ли ответы на эти два вопроса. Если, по-вашему, они разные, то в каком случае среднее число бросков будет больше?

Подсказка 1

Разумеется, мы считаем монетку «честной», то есть имеющей равные шансы выпадения «орла» и «решки». Ответ требует понимания того, что такое среднее число бросков. Математики обычно говорят о «математическом ожидании» числа бросков. Полезно заметить, что если результатом первого броска стало выпадение решки, то весь эксперимент как бы начался заново и продлится на один ход дольше.

Подсказка 2

На первый взгляд кажется, что поскольку вероятности выпадения двух орлов (ОО) и комбинации «орел + решка» (ОР) одинаковы, то и число бросков до появления нужной комбинации будет одинаковым. Подумайте, почему это может оказаться не так. В чем разница между выпадением (невыигрышных) двух орлов во второй игре и выпадением комбинации ОР в первой?

Решение

Начнем с двух орлов. Пусть B - количество ходов, через которое в среднем наступит выигрыш. Рассмотрим также две вспомогательных величины B Р и В О : первая из них будет означать среднее число ходов до выигрыша, если на первом ходу выпала решка, а вторая - среднее число ходов до выигрыша, если на первом ходу выпал орел.

Заметим, что так как орел и решка на первом ходу имеют равные шансы, то В = (B Р + В О )/2.

Однако это не все, что можно получить «на пальцах» из условий задачи и введенных только что обозначений. Действительно, если на первом ходу выпал орел, то на втором ходу с вероятностью 1/2 игра заканчивается и имеет длину 2, а с вероятностью 1/2 выпадает решка, и игра продолжается. Длина такого продолжения (опять же, в среднем!) на 1 больше чем длина игры, начавшейся решкой, потому что тут решка выпала на втором ходу. Это означает, что В О = (2 + (1 + B Р ))/2. Если же игра началась с решки, то она точно не закончится после второго хода, то есть после решки игру можно считать начавшейся заново и длящейся на один ход больше, чем если бы этой решки вначале не было. Иначе говоря, B Р = 1 + В .

Мы получили три линейных уравнения, связывающих величины В , B Р и В О . Решив полученную систему, найдем В О = 5, B Р = 7, В = 6. Итак, в среднем выпадение двух орлов можно ожидать на шестом ходу.

Теперь исследуем игру, в которой выигрыш наступает после комбинации «орел + решка».

Пусть D - средняя длина игры во всех случаях, а D О и D Р - длины в случае первого орла и в случае первой решки соответственно. Как и в первой игре, равенство D = (D О + D Р )/2 следует из равенства шансов выпадения орла и решки на первом ходу.

Далее, если игра началась с орла и не закончилась на втором ходу, то это означает, что вторым ходом тоже выпал орел. То есть длина такой игры в среднем равна 1 + D О (мы можем забыть про первого орла и считать, что игра началась со второго хода) - получаем уравнение D О = (2 + (1 + D О ))/2, из которого сразу находим D О = 3. Наконец, если игра началась с решки, то она фактически началась заново, то есть D Р = 1 + D . Из уравнений D = (3 + D Р )/2 и D Р = 1 + D находим D = 4, D Р = 5.

Итак, в этом случае игра в среднем закончится на четвертом ходу - на два хода быстрее.

Послесловие

Как бы изменились ответ и решение, если бы игра шла не до двух орлов, а до трех? Применим тот же прием для большего числа переменных.

Пусть Е ОО , Е ОР , Е РО и Е РР - средние продолжительности для игр, которые начались с выпадения «ОО», «ОР», «РО» и «РР» соответственно. Тогда средняя длина произвольной игры равна Е = (Е ОО + Е ОР + Е РО + Е РР )/4. С другой стороны, Е ОО = (3 + (1 + Е ОР ))/2, поскольку после «ОО» игра с равной вероятностью либо заканчивается, либо продолжается выпадением решки, и тогда длится в среднем на один ход дольше, чем игра, начавшаяся с «ОР». Аналогично, Е ОР = (1 + Е РО + 1 + Е РР )/2, Е РО = (1 + Е ОР + 1 + Е ОО )/2 и Е РР = (1 + Е РО + 1 + Е РР )/2. Эта система уравнений немного труднее предыдущих, но если не бояться трудностей, то из нее можно получить, что Е ОО = 10, Е ОР = 16, Е РО = 14 и Е РР = 16, поэтому Е = (10 + 14 + 16 + 16)/4 = 14.

Перечислим еще несколько обобщений полученных результатов.

Если считать выигрышем выпадение не обязательно трех орлов, но и трех решек подряд, то ждать придется ровно вдвое меньше - всего 7 ходов. В общем случае ждать выпадения комбинации из N одинаковых заданных результатов (то есть либо орлов, либо решек) при бросании монетки в среднем приходится 2 N + 1 − 2 хода, а если выигрышем считать появление любой из двух комбинаций, то - 2 N − 1 ход.

Если заменить монетку 6-гранной игральной костью, то ждать выпадения комбинации из N одинаковых заданных граней придется в среднем (6 + ... + 6 N ) ходов, а комбинации из любых N одинаковых граней - в шесть раз меньше. Почему так? Попробуйте доказать это самостоятельно.

А теперь представьте, что вы играете против «однорукого бандита». За участие в каждой игре вы платите определенную сумму, а в случае выигрыша сразу уходите с ним. Правда ведь полезно понимать, как часто можно ждать выигрыша? И стоит ли вообще его ждать, если в среднем сумма выигрыша оказывается меньшей, чем то, что вы тратите на продолжение игры?

Если бы вместо однорукого бандита вы играли в описанную в задаче игру с бросанием монетки (до двух орлов) и за каждый бросок платили 1, а за выигрыш получали N , то при каком наименьшем N вы бы сочли игру справедливой и согласились играть? Эквивалентен ли этот вопрос тому, который был задан в задаче? Не торопитесь отвечать...

Вот еще одна ситуация с заведомо невыгодной игрой, в которой требуется аккуратный математический расчет. Пусть условия игры таковы, что ваш выигрыш в каждом раунде происходит с вероятностью, меньшей 1/2 (например, именно так обстоят дела в рулетке, где из-за наличия сектора «зеро» вероятность выигрыша при любой ставке не превышает 18/37, то есть с такой вероятностью можно удвоить ставку, а с вероятностью 19/37 - потерять ее). Если можно сыграть один раунд, то считается разумным поставить всю сумму на кон и рискнуть. А если разрешается сыграть только четное число раундов и победителем игры можно стать, только выиграв больше половины из них? Многие считают, что в этой ситуации нужно играть две игры и «уносить ноги». На самом же деле (как показывают математические расчеты) выгоднее всего сыграть достаточно большое число игр - 18 или 20. Именно при таком количестве вероятность победы в игре в целом оказывается наибольшей.

В теории вероятностей и теории игр известно много задач, при решении которых интуиция подводит даже очень искушенных в математике людей. Часто такие задачи оформляются в виде парадоксов. Например, парадокс двух братьев обычно формулируется так: каждый из братьев - Ваня и Даня - «выбрасывает» 1 или 2 пальца, потом они складывают количество пальцев, и если сумма четна, то Даня дает Ване число щелбанов, равное этой сумме, а если нечетна - то Ваня дает Дане число щелбанов, равное этой сумме.

На первый взгляд, кажется, что игра вполне честная - Ваня ставит щелбаны в двух случаях из четырех равновозможных, и при этом выдает 3 + 3 щелбана. Даня ставит брату щелбаны в двух остальных случаях, и при этом выдает 2 + 4 щелбана. Загвоздка, однако, в том, что интуиция ошибается - оптимальная стратегия для каждого из братьев отличается от стратегии «выбрасывать 1 или 2 пальца с одинаковыми вероятностями», и поэтому игра оказывается невыгодной для одного из них и выгодной для другого. Как вы думаете, для кого именно она выгодна? Проверьте свою интуицию.

Вернемся к разобранной нами задаче с выпадением орлов. Использование линейных уравнений в этой задаче избавляет от гигантских вычислительных трудностей. Ведь если бы мы просто «в лоб» постарались перечислить все (равновероятные) случаи игр, продолжавшихся не более чем N ходов, для каждой такой игры установить точную ее продолжительность (момент первого появления двух орлов подряд) и усреднить все полученные значения, то столкнулись бы с необходимостью подсчета сложных рекуррентных соотношений и вычисления «телескопических» сумм. Даже задача подсчета числа игр, в которых первое появление двух орлов происходит ровно на k -м ходу, - это не самая простая задача, а ведь для нашей задачи она являлась бы легкой разминкой перед «основным блюдом».

Если вы хотите продолжить знакомство с теорией вероятности, рекомендуем следующие книги:
1) Г. Секей, «Парадоксы в теории вероятностей и математической статистике» - книга венгерского математика Габора Секея, содержащая огромное количество неожиданных утверждений из теории вероятностей, математической статистики и теории случайных процессов.
2) Ф. Мостеллер, «Пятьдесят занимательных вероятностных задач» - подборка несложных задач для начинающих.
3) В. А. Никифоровский, «Вероятностный мир» - научно-популярная книга об истории развития теории вероятностей и ее приложений.
4) David Salsburg, The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century - современная популярная книжка о математической статистике.

Похожие статьи