Переведено по заказу учебного портала university.poker
Оригинальный источник: GTO Wizard

Множество когнитивных искажений, ментальных моделей и эвристик, которые я собираюсь обсудить в контексте таких инструментов, как GTO Wizard, влияют на наше восприятие покера. Многое уже написано о том, как искажения влияют непосредственно на игру в покер. В частности, ошибка игрока (Gambler’s Fallacy) и ошибка выжившего (Survivor Bias) — оба эти искажения широко распространены в игре, где большую роль играет дисперсия. Однако гораздо меньше внимания уделяется искажениям, которые влияют на изучение покера. Сегодня я начинаю серию, посвященную одному из самых известных и, возможно, самых разрушительных искажений, которое может повлиять на использование инструментов для изучения покера - подтверждающему искажению (Confirmation Bias).
Подтверждающее искажение — это наша склонность обращать внимание на информацию, которая соответствует нашим уже существующим убеждениям, и игнорировать или недооценивать информацию, которая с ними не совпадает.
- Простой пример: если вы верите, что Дональд Трамп должен быть президентом, то, скорее всего, вы будете искать новости на каналах вроде Fox. Если же вы считаете, что Трамп — воплощение зла, то, вероятно, будете искать информацию на CNN. В обоих случаях вероятность того, что вам попадется информация, бросающая вызов вашей точке зрения, очень мала.
В покере подтверждающее искажение тоже встречается довольно часто, особенно когда речь идет о дисперсии. Если вы находитесь в даунсвинге или вообще считаете себя неудачником, вы, скорее всего, будете помнить те три раза, когда вас “переехали” (cooler) за одну сессию, и забудете о тех трех случаях, когда вы сами переехали кого-то другого. Вы можете даже сказать себе, что «заслужили» быть на хорошей стороне этих кулеров, потому что раньше вам не везло. В этой статье мы рассмотрим те же динамики подтверждающего искажения, но в контексте использования инструментов, таких как GTO Wizard, для изучения игры.
1. Подтверждающее искажение и изучение покера
- Давайте рассмотрим пример из одной руки, которую я недавно играл.
В начале турнира с эффективным стеком 50bb я открылся с BTN с . Большой блайнд (ББ) заколлировал, и на флоп пришло
, который ББ чекнул. Я почувствовал, что несмотря на то, что 6 и 3 благоприятствуют ББ, это был хороший борд для ставки, потому что у меня в диапазоне были более сильные руки с Q-x и все сеты. Кроме того, я ожидал, что ББ рейзил бы такие руки, как AQ, QQ, 66 и 33 на префлопе, как в GTO, так и в реальной игре.
Я решил поставить половину пота, хотя знал, что, согласно моим исследованиям, более маленькая ставка была бы более подходящей. Оглядываясь назад, думаю, что мой инстинкт был: «Это динамичный флоп, ставь больше», хотя на самом деле ни одно дро не сбросит свою руку на любую из этих ставок. Ставка привела к фолду, и я отметил эту руку, чтобы не забыть вернуться к ней позже в GTO Wizard, когда буду заниматься обучением.


Во-первых, сама ставка — это относительно частое явление для этого флопа: мы ставим около 63% раз, а чекаем 37%. BTN имеет легкое преимущество в диапазоне (53%), и как я уже говорил, у нас больше «лучших рук», но это очень близко:

Решение солвера - использовать смесь разных размеров ставок. Хотя два меньших размера ставок предпочтительнее, у нас есть руки, которые ставят около 50% пота, и — одна из них. На этом этапе я мог бы гордо выпятить грудь и заявить, что сыграл руку правильно, а затем перейти к следующей. Так делают некоторые игроки, когда работают с покерными решениями — они «проверяют линию» руки и идут дальше, не углубляясь в анализ.
Однако при более тщательном осмотре можно увидеть, как часто моя рука использует каждый размер ставки:

Моя рука использует ставку в половину пота всего лишь 3,5% времени. Здесь подтверждающее искажение может полностью взять управление на себя. Я мог бы продолжить утверждать, что сыграл руку правильно, и двигаться дальше. Это действительно было «утверждено GTO». Если бы я был опытным пользователем, я мог бы даже сказать себе: «Да, это низкочастотное действие, но я знал это и сделал так, чтобы сбалансировать свою среднюю ставку.» Это коварный аспект подтверждающего искажения: мотивированное рассуждение и защита идентичности как основная мотивация. Я мог бы быть настолько мотивирован защищать свою идентичность, что больше не стал бы задаваться вопросом о низкой частоте.
На самом деле, я могу решить, оглядываясь назад, что знал, что это низкочастотный ход, и поскольку мне удалось найти его, несмотря на эту редкость, это делает меня еще умнее. На самом деле, я должен более детально исследовать эту ситуацию. Важный вопрос, который стоит себе задать: почему преобладающий размер ставки составляет от 20% до 33%, и это размер, который используется 58,6% времени с этой конкретной комбинацией? Также есть смешанные размеры ставок по всему диапазону. У нас также есть средние (55%) и большие (83%) ставки, есть даже овербет (125%). И вместо того чтобы сосредоточиться на редком ходе, полезнее рассмотреть, почему существует смесь размеров ставок и какие руки предпочитают каждый из них.
2. Малые ставки
Фильтр «Grouped» позволяет нам группировать размеры ставок в абстрактные категории (Малая/Средняя/Большая ставка или Овербет). Если мы наведем курсор на иконку в правом верхнем углу группы «Малая ставка», мы сможем увидеть разбивку диапазона ставок по классам рук.
Разбивка диапазона группы «Малая ставка» (Ставка 20% и Ставка 33%):

Малые ставки, например, в основном используются руками, которые я бы назвал средней частью диапазона. В основном этот размер ставки используют руки от топ-пары до третьей пары. А основной блеф в этом сайзинге, похоже, А-х. Мое толкование этого следующее: мы ставим маленькую ставку с более слабыми руками нашего диапазона, чтобы достаточно слабых рук могли заколлировать и сделать этот ход прибыльным. Эти руки находятся в середине нашего диапазона. Малая ставка, таким образом, позволяет нам чаще вэльюбетить. Затем мы защищаем эту часть диапазона сильными руками, такими как сеты. Мы блефуем с А-х, потому что эта рука все еще опережает некоторые дро, которые могут заколлировать, и часто будет продолжать быть впереди, если на поздних улицах выпадет туз. А-х без дополнительного дро имеет около 50% эквити, так что когда нас “крутят” (т.е. противник делает рейз) - это легкий фолд.
3. Средний размер ставки
Топ-пара — пропорционально более крупная часть вэлью диапазона здесь. К-х и бэкдор флеш-дро — это основные блефы. К-х блефует, вероятно, потому, что наша цель — А-х. Мы никогда не заставим пару сбросить свою руку, но можем заставить сбросить много А-х, что делает ставку с К-х успешным блефом.
4. Овербет
Наконец, мы рассматриваем состав диапазона овербетов, который составляет 5,6% стратегии для всего диапазона. Мы пропустили группу «Bet Large», потому что она является чересчур маленькой частью (3,7%) составляющей стратегии диапазона, и мы получаем более яркий контраст, рассматривая более удаленные части спектра ставок.
Разбивка диапазона группы «Овербет» (Ставка 125%):

Оверпары и топ-пара составляют основную часть вэлью диапазона. Мы никогда не используем овербет для двух пар или более сильных рук, как это делаем с другими ставками. Это классический поляризованный диапазон ставок: мы ставим большую ставку с руками, которые, как правило, впереди и которые нуждаются в защите. K-x — это основной блеф. Снова, его выбирают по той же причине, что и в случае со средней ставкой: чтобы заставить А-х сбросить, и также потому, что эта рука блокирует KQo в диапазоне большого блайнда. Возвращаясь к нашей конкретной руке , очевидно, есть смысл включить её в наш диапазон средней ставки. Нам нужно иметь А-х, когда на терне или ривере выпадет туз.
Также эта рука может составить бекдор-стрит. Она блокирует QT, A6, A3, T6 и T3, которые есть в диапазоне ББ. Мы также не блокируем флеш-дро, что полезно, когда терн и ривер не дают ничего полезного, и мы ищем блефы на ривере. На практике, однако, наша рука лучше работает как блеф для меньшего размера ставки. Она опережает дро, которые коллируют, лишает эквити слабые непарные руки, которые сбросят, и достаточно сильна, чтобы продолжать, когда на терне выпадет туз. Наконец, у неё только 50% эквити, так что это довольно легкий фолд, если нас чек-рейзят (фолд будет сложнее, когда мы поставим ставку в 55% пота).
Обратный эффект
Но подождите. Что если я скажу вам, что игроки в моих играх очень часто коллируют и никогда не сбросят на такую маленькую ставку? Ну, мы можем воспользоваться искусственным интеллектом (ИИ) GTO Wizard и залочить такое «липкое» поведение, чтобы посмотреть, какой будет оптимальный ответ на него.
Давайте заблокируем стратегию BB так, чтобы он никогда не сбрасывал А-х, К-х или любые бекдор-дро на маленькую ставку:

Вот как BTN корректирует свою стратегию контбета:


Ох, похоже, что всё пошло не по плану. Теперь мы перестали использовать средний размер ставки в этой ситуации, и фактически, мы исключительно используем маленькую ставку в 33%, чтобы использовать то, что наш оппонент никогда не сбросит, делая тонкие вэлью беты с более широким диапазоном. На самом деле, я хотел сказать, что игроки в моих играх воспользуются такой маленькой ставкой, часто повышая ее.
Вот что они на самом деле будут делать, столкнувшись с маленьким контбетом:

Против чрезмерной агрессии я должен буду подстроиться так:


Ох, это снова произошло. Мы ставим ещё чаще, при этом вводя новый, ещё меньший размер ставки. Похоже, что провоцирование частого чек-рейза — это хорошо для нас.
На самом деле, я хотел сказать, что оппоненты не только будут “крутить” нас чаще, когда мы ставим маленькую ставку, но они также будут перефолживать на ставку в 56% пота:

Так выглядит наша новая подстройка:


когда он видит с-бет 33% банка и слишком тайтовая, когда он видит с-бет 56% банка)
Фух, наконец-то мы дошли до этого. Простите за попытку пошутить. То, что я пытался показать выше — это второй аспект когнитивного искажения подтверждения, который, возможно, еще более вреден: эффект обратного результата. Это ситуация, когда представление противоречащей информации на самом деле усиливает нашу первоначальную позицию, а не меняет её. Эффект обратного результата особенно заметен в эпоху «фейковых новостей» и социальных сетей. Очень часто люди сталкиваются с доказательствами того, что их «сторона» была неправой в каком-то вопросе, и это как будто еще больше укрепляет их убеждения. Например, новость о том, что Трамп сделал что-то ужасное или был оправдан по какому-то делу, не изменит мнения зрителей Fox или CNN по этому вопросу.
Эффект обратного результата проявляется, когда человек становится более уверенным в своей первоначальной позиции, сталкиваясь с противоречивой информацией, вместо того чтобы изменить свою точку зрения.
Я думаю, что эффект обратного результата также может быть проблемой при использовании GTO Wizard. Во-первых, мы можем полностью отклонить выводы, потому что «никто не играет по GTO в реальной жизни». Мы можем также без устали лочить (т.е. блокировать) решения так, чтобы они соответствовали нашему мировоззрению, и «доказать» себе, что мы правы.
5. Заключение
В описанной выше раздаче мне повезло: я использовал ее как отправную точку для обсуждения Когнитивного искажения подтверждения, поэтому мне было легко заметить свои собственные предвзятости во время изучения. Это, возможно, самый важный способ бороться с предвзятостями в целом: признать, что они у нас есть. Когнитивное искажение подтверждения часто проявляется, потому что наши убеждения связаны с нашей идентичностью. Будь то наша политическая идентичность или просто наша идентичность, как компетентных игроков в покер, естественно ощущать угрозу или боль, когда нам противоречат. Нам нужно отделить результаты решения солвера от нашей покерной идентичности. Намного полезнее развивать идентичность «игрока, обучающегося покеру», а не «покерного победителя», когда мы работаем с инструментами для обучения, которые часто могут нас удивить.
Рассматривайте обучение покеру как приключение, а не как способ доказать свою правоту.
Также очень полезно подходить к выводам солвера с намерением изучить не только конкретную раздачу, с которой вы столкнулись. Когда вы изучаете, как должен играться ваш весь диапазон, а также как играл ваш оппонент в свете того, что для него теоретически оптимально. Это должно уменьшить необходимость валидации своей идентичности, так как ситуация становится менее личной. Это меньше касается того, что вы сделали с вашей рукой, и больше — того, что каждый игрок должен делать со всеми своими руками.