Новость

Прощай, лимитный холдем?

GipsyTeam

11.01.2015 12:02 7975 102 комментария

В начале 2015 года команда ученых из канадского университета Альберты, усиленная специалистом из Финляндии, объявила о решении лимитного холдема один на один. Созданная ими программа Cepheus («Цефей», по-английски читается как «Сифиус») играет максимально близко к GTO. Префлоп-чарт, стратегия на постфлопе и код программы выложены на сайте проекта.

Что поделать, должно было случиться.
feruell

Новость об этом достижении программистов появилась 8 января практически одновременно на сайтах The Guardian, Wall Street Journal, Washington Post, Nature и других авторитетных СМИ, а также на форуме 2+2 (http://forumserver.twoplustwo.com/29/news-views-gossip/computers-conquer-texas-holdem-poker-first-time-1502189/). Статья авторов «Цефея» (Майкл Боулинг, Нейл Бёрч, Майкл Йохансон и Оскари Таммелин) с описанием алгоритма вышла в престижном журнале Science (для чтения требуется платная подписка).

Интерес игроков в покер к практически оптимальной стратегии быстро обрушил серверы сайта канадского университета. (Возможность потренироваться против «Цефея» не восстановили до сих пор.)

«Даже сыграв против нашей программы 60 миллионов раздач и не сделав ни одной ошибки, вы всё равно не смогли бы статистически достоверно утверждать, что имеете против неё преимущество, – заявил Майкл Боулинг. – Мы не пришли к абсолютному совершенству, но подошли к нему так близко, что для доказательства перевеса над программой идеальному игроку не хватит всей жизни».

В твиттере проекта Боулинг конкретизировал: соперник, знавший стратегию «Цефея» в моменты принятия решений, после 60 миллионов раздач обыграл программу с преимуществом менее 0.05 бб/100.

Работа над проектом продолжалась 11 лет. Прорыв состоялся после подключения соавтора из Финляндии Оскари Таммелина, более чем на порядок улучшившего эффективность старого алгоритма канадцев. Кодирование новой программы началось в октябре 2013 года. Компьютерные мощности для расчета предоставил исследовательский консорциум Calcul Québec. Запись решения лимитного холдема для двух человек заняла 11 терабайт (в 10 раз больше всей англоязычной Википедии) и потребовало 900 CPU-лет (1 CPU-год соответствует годовой работе машины, делающей миллиард операций в секунду).

«Цефей» решал холдем полным перебором: играл множество раздач сам с собой, принимая случайные решения, после чего «учился на ошибках» – неудачные решения получали «минус в карму» и вероятность их принятия в будущем снижалась. Хороший алгоритм обучения и избыток машинного времени – много ли нужно для счастья? Так лимитный холдем один на один стал первым видом покера, для которого удалось найти решение, близкое к оптимальному.

Несколько цитат от разработчиков:

Игроки в покер часто спорили о том, следует ли лимпить с малого блайнда с какой-то частью своего диапазона. Общепринятым стало мнение, осуждающее этот прием за то, что он не позволяет немедленно выиграть раздачу после фолда оппонента. Наше решение полностью его подтверждает: программа делает опенлимпы в 0.06% случаев. В некоторых других ситуациях стратегия отличается от общепринятой, показывая, в каких областях люди могут прибавить. Программа практически никогда не делает кэп на префлопе, тогда как многие сильные игроки кэпят различные и порой достаточно широкие диапазоны. Даже с сильнейшей рукой – парой тузов – стратегия кэпит менее 0.01% случаев, а чаще всего ставится кэп с парой двоек – 0.06%. Возможно, ещё важнее то, что на большом блайнде программа играет больше рук, чем многие профессионалы, и с большей вероятностью 3-бетит с мелкими парами – тройками и четверками...

Программа училась играть два месяца, используя более четырех тысяч процессоров, каждый из которых отыгрывал более шести миллиардов раздач каждую секунду. В рамках подготовки было сыграно больше раздач, чем за всю историю человечества.

Цефей – созвездие в Северном полушарии. Гамма Цефея станет самой северной звездой на видимом ночном небе в районе 3000 года, перехватив первенство у Полярной звезды. Предыдущая программа, созданная командой университета Альберты, называлась «Полярис» – Полярная звезда. Именно «Полярис» первым обыграл профессионального игрока в покер в серьезном матче один на один. «Цефей» пошёл дальше – он не только может побеждать сильнейших игроков мира, его игра практически идеальна...

Итак, лимитный холдем один на один решен. Возможно, не в математическом смысле, но уж точно в практическом. Играть в него на деньги с 8 января 2015 года, не имея доступа к оптимальной на сегодня стратегии, могут только исключительно беспечные люди. (В момент, когда пишутся эти строки, на PоkerStars играется один хэдз-ап на лимите $50/$100 – регуляр из Украины против неизвестного игрока из Великобритании. Два матча идут на $10/$20, остальной экшен – на микролимитах.) Должна ли последовать какая-либо реакция со стороны покер-румов? Что нас ждет в будущем – насколько велика угроза со стороны компьютеров?

В чистом виде лимитным холдемом один на один давно бросили интересоваться даже отпетые фанаты книги Майкла Крэйга. Однако в микс 8 игр регулярно сражаются на серьезные деньги, и 1/8 этой ротации – лимитный холдем. Вероятно, игрокам следует дать программную возможность отказаться от состязания в этом виде покера. Если оба хотят сражаться и доверяют друг другу, пусть ставят соответствующие галочки, но возможность уклониться от потенциально безнадежной битвы – право каждого.

Ситуация меняется, как только игроков становится трое. Дерево решений немедленно разрастается настолько, что создание GTO-бота становится исключительно трудноразрешимой задачей. «Цефей» для 3-макса (не говоря уже про 6-макс) потребует на порядки большей работы как по созданию алгоритма, так и по чисто вычислительной мощности.

А что думают заинтересованные стороны о перспективах решения безлимитного холдема один на один?

Майкл Боулинг: «Маловероятно, что безлимитный холдем будет когда-либо решен – в нем слишком много различных вариантов действий».

Uran: «То, что для лимитного холдема один на один можно найти относительно точное равновесие, стало понятно лет семь назад. Ситуация с нахождением равновесия для NL HU, даже в 100 бб стеках, весьма неудовлетворительная и, скорее всего, в ближайшие десятилетия не будет найдено удовлетворительного решения».

Понятно, что при добавлении за стол новых игроков математическое решение безлимитного холдема отодвигается намного дальше.

А как же боты, разрывающие 6-макс, которыми пугают онлайн-игроков в последние годы? Да, их существование – суровая реальность. Они обладают рядом серьёзных достоинств – как минимум, не устают и никогда не тильтуют! И благодаря этому приносят своим хозяевам какие-то деньги – если/пока их не забанят с конфискацией... Но, конечно, они крайне несовершенны с точки зрения оптимальной покерной стратегии. Стратегия такого бота, выложенная в публичный доступ, не совершит революции в игре. В отличие от «Цефея»...

Стратегия «Цефея»

Вся информация, касающаяся префлопа, выложена на сайте разработчиков.

С малого блайнда программа практически всегда открывается рэйзом.

Процент лимпов крайне незначителен, причем чаще всего лимп делается с 2x 2x – 0.53% и Ax Ax – 0.51%. Есть немало рук, рэйз с которыми делается в 100% случаев. Фолды и рэйзы миксуются только с двумя руками: Tx 4x разномастные – 25.16% фолдов и 74.65% рэйзов и 7x 4x разномастные – 94.48% фолдов и 5.49% рэйзов.

На большом блайнде «Цефей» крайне неохотно сдается на рэйз. Всегда выкидываются только 3x 8x , 2x 8x , 2x 7x , 2x 6x , 2x 4x и 2x 3x – естественно, все разномастные. Зеленым цветом ниже отмечен диапазон 3-бета, синим – колла.

Со многими руками используется смешанная стратегия. В частности, с парой двоек «Цефей» делает 3-бет в 45.65% случаев, с 3x 3x – в 83.43% (остальные пары 3-бетятся всегда). Разномастные Kx Tx программа 3-бетит в 49.51% случаев, одномастные Jx 4x – в 53%...

Против лимпа «Цефей» обычно дает рэйз.

Получив 3-бет, программа, как уже упоминалось выше, практически во всех случаях делает колл. 4-беты от неё исчезающе редки: с тузами – никогда, с королями, дамами и валетами – 0.02%, и т. д. Из слабых рук, с которыми изредка ставится кэп, отметим Kx 5x (0.02%) и Kx 4x (0.01%) разномастные.

Постфлоп также можно посчитать на сайте проекта.

Для примера мы рассмотрели игру с 9h Th с малого блайнда. Мы сделали рэйз и заколлировали 3-бет соперника. На флопе Ad Qc 7h противник поставил контбет. Что делать Hero?

73.57% – рэйз, остальное – колл, говорит нам «Цефей».

Оппонент коллирует, и на терне падает 2s . К нам приходит чек. Как продолжать?

64.06% – продолжаем атаку, 35.94% – берем бесплатную карту.

Ривер – Kh .

1) Оппонент чекает.

В 45.17% случаев программа сдается, в 54.83% – блефует.

2) Оппонент донкает.

В 47% случаев программа фолдит, в 24% – рэйзит, и в 29% делает колл!!

Вот так своеобразно играет самый близкий к GTO покерный робот наших дней...

Историческое для покера событие, состоявшееся в январе 2015 года, можно, пожалуй, сравнить с появлением в шахматах так называемых таблиц Налимова – полных баз пяти- и шестифигурных позиций. (В 2013 году появилось решение и всех позиций с семью фигурами, которое заняло 140 терабайт.) Теперь для любой позиции с семью и менее фигурами известна точная оценка и идеальная последовательность ходов за обе стороны. Но, поскольку шахматы – это намного больше, чем малофигурный эндшпиль, появление таблиц Налимова мало повлияло на практическую игру. Решение методом полного перебора шахматам на сегодняшний день тоже не грозит: слишком мала производительность компьютеров. Даже восьмифигурные базы считать никто пока не собирается. Так и в покере нахождение оптимальной стратегии в лимитном холдеме один на один закрывает лишь частный случай той единственной разновидности покера, которая лучше всего поддается расчету, и отнюдь не приближает решение той же игры для большего числа участников или других, более популярных покерных вариантов.

Вторую часть статьи мы посвятим анализу раздач по лимитному холдему один на один с помощью «Цефея». Раздачи будем брать из книг, блогов, статей или просто из головы. Может быть, компьютерные решения помогут нам лучше понять логику покера?

Следите за обновлениями GipsyTeam в телеграме, инстаграме, вконтакте, на YouTube, на фейсбуке, и в твиттере.

06.08.2014 16:15

Орлянка, недорого

18 комментариев

17.02.2013 07:00

«Почему мы такие отмороженные? Наверное, дело в климате»

32 комментария

26.01.2014 16:32

Управление стеком в турнирах по FLHE

22 комментария

Лучшие комментарии

valeg
Профиль

На сайте: 14 лет

779
11,032

феруелл должен послать в прошлое терминатора чтобы нейтрализовать мать программиста из финляндии

11.01.2015 13:34

Показать в ленте

380
MepJIuH
Профиль

На сайте: 14 лет

558
6,944

Так это они на идеальном ГСЧ 11 лет экспериментировали. На ПС они бы, думаю, свернули разработку через недельку-другую.

11.01.2015 13:35

Показать в ленте

141
EuroDollar
Профиль

$Бесконтрольный€

На сайте: 9 лет

9
2,411

ждем матча с feruell

11.01.2015 12:08

Показать в ленте

81
ApparatVS
Профиль

На сайте: 13 лет

89
570

Так и не сыграл ни одной сдачи в лимит.

11.01.2015 12:39

Показать в ленте

66
fragaLY
Профиль

66726167614c59

На сайте: 12 лет

67
1,546

Сообщение от medved_86rus
в ВК есть приложение
дальше не читал.

11.01.2015 13:49

Показать в ленте

58
DartSerg
Профиль

На сайте: 11 лет

105
1,024

Сообщение от IceWindL
Работа над проектом продолжалась 11 лет

Мля, нет слов, лучше бы придумали как вылечить рак или спид.
нет, нужно было залезть в покер!
т.е. ты предлагаешь математикам и программистам искать панацею от рака?может еще дарье донцовой поискать пути выхода из финансового кризиса,а николая валуева сделать депутатом единой России?

11.01.2015 15:57

Показать в ленте

48

102 комментария

MAXAJIUK
Профиль

На сайте: 10 лет

11
5,608

В свете последних споров,новость о программе,которая решила одну из разновидностей покера,как никогда кстати. Вы всегда знаете как поддержать, GipsyTeam

Ссылка скопирована
11.01.2015 12:07

Ответить Цитировать

-7
Largomax
Профиль

На сайте: 12 лет

132
692

Самого feruell оцифровали?

Ссылка скопирована
11.01.2015 12:08

Ответить Цитировать

16
EuroDollar
Профиль

$Бесконтрольный€

На сайте: 9 лет

9
2,411

ждем матча с feruell

Ссылка скопирована
11.01.2015 12:08

Ответить Цитировать

81
IceWindL
Профиль

ty nh gg wp

На сайте: 13 лет

11
8,100

Работа над проектом продолжалась 11 лет

Мля, нет слов, лучше бы придумали как вылечить рак или спид.
нет, нужно было залезть в покер!

Ссылка скопирована
11.01.2015 12:18

Ответить Цитировать

27
ApparatVS
Профиль

На сайте: 13 лет

89
570

Так и не сыграл ни одной сдачи в лимит.

Ссылка скопирована
11.01.2015 12:39

Ответить Цитировать

66
Catch27
Профиль

На сайте: 12 лет

53
7,025

Интересно, на чьи деньги проводились эти разработки?

Ссылка скопирована
11.01.2015 12:49

Ответить Цитировать

12
BadSeed
Профиль

GIPSYTEAM

На сайте: 14 лет

1,092
15,251

Сообщение от IceWindL
Мля, нет слов, лучше бы придумали как вылечить рак или спид.
нет, нужно было залезть в покер!
Из статьи в Nature:

"The team is now focusing on applying their approach to medical decision-making, in collaboration with diabetes specialists"

Ссылка скопирована
11.01.2015 12:57

Ответить Цитировать

14
Gunpowder
Профиль

На сайте: 12 лет

12
6,058

Краткая статья на тему *Как угробить 11 лет своей жизни, исследуя мёртвую дисциплину*.

Ссылка скопирована
11.01.2015 13:00

Ответить Цитировать

16
usd
Профиль

На сайте: 11 лет

6
420

Rip

Ссылка скопирована
11.01.2015 13:06

Ответить Цитировать

0
benyya
Профиль

На сайте: 13 лет

12
1,073

Мощный материал

Ссылка скопирована
11.01.2015 13:07

Ответить Цитировать

6
ThanDdaR
Профиль

На сайте: 12 лет

13
570

Gunpowder, Это для тебя мертвая дисциплина, а для этих парней это прокачивание скилла в программировании

Ссылка скопирована
11.01.2015 13:14

Ответить Цитировать

4
valeg
Профиль

На сайте: 14 лет

779
11,032

феруелл должен послать в прошлое терминатора чтобы нейтрализовать мать программиста из финляндии

Ссылка скопирована
11.01.2015 13:34

Ответить Цитировать

380
MepJIuH
Профиль

На сайте: 14 лет

558
6,944

Так это они на идеальном ГСЧ 11 лет экспериментировали. На ПС они бы, думаю, свернули разработку через недельку-другую.

Ссылка скопирована
11.01.2015 13:35

Ответить Цитировать

141
fragaLY
Профиль

66726167614c59

На сайте: 12 лет

67
1,546

они 11 лет умоляли feruella поделиться чартами. Дал слабину , старичок ! :)

Ссылка скопирована
11.01.2015 13:47

Ответить Цитировать

41
medved_86rus
Профиль

We Live Forever

На сайте: 9 лет

203
1,059

Я единственного не понимаю, какой смысл? Боты запрещены, с ними борятся румы, при подозрении сразу блокируют. если они попытаются заработать им - это как минимум незаконно. Единственное - использовать его, как практическое обучение, наподобие того, как люди в шахматы с компьютером играют. К слову в ВК есть приложение, где тебе предлагается обыграть универсального бота в НL Холдем на условные, так же может подсаживаться несколько оппонентов. ради прикола попробовал, легко обыгрывается, за час около 100 БИ набил и больше не играл с этим фишом))

Ссылка скопирована
11.01.2015 13:47

Ответить Цитировать

-23
valeg
Профиль

На сайте: 14 лет

779
11,032

Сообщение от EuroDollar
ждем матча с feruell
бери выше, с исполнителем

Ссылка скопирована
11.01.2015 13:48

Ответить Цитировать

34
Melgry
Профиль

На сайте: 11 лет

28
505

На очереди sng, скорее всего. Печально это

Ссылка скопирована
11.01.2015 13:49

Ответить Цитировать

-1
fragaLY
Профиль

66726167614c59

На сайте: 12 лет

67
1,546

Сообщение от medved_86rus
в ВК есть приложение
дальше не читал.

Ссылка скопирована
11.01.2015 13:49

Ответить Цитировать

58
BocxoD
Профиль

Заблокирован

На сайте: 11 лет

24
5,469

Бомба!
не важно то, что на 3-х игроков и более- пока расчетов нет. Лимитный холдем при любом количестве игроков вероятно скоро закончится. Эта инфа даст людям еще более глубокое понимание покера. Думаю, что скоро, очень возрастет количество стратегий

Ссылка скопирована
11.01.2015 13:53

Ответить Цитировать

3
EV0
Профиль

РЕГРЕАЦИОННЫЙ ИГРОК

На сайте: 12 лет

538
9,493

Хорошо, что предупредили.
А то как раз планировал в ХА ФЛ переходить, думал, наживать начну наконец-то.

Ссылка скопирована
11.01.2015 14:02

Ответить Цитировать

14
NewAirLegend
Профиль

На сайте: 10 лет

8
135

Сообщение от BadSeed
Из статьи в Nature:

"The team is now focusing on applying their approach to medical decision-making, in collaboration with diabetes specialists"
Вот теперь самое время заняться и медициной

Ссылка скопирована
11.01.2015 14:06

Ответить Цитировать

0
just_pro
Профиль

NeverNothingToRegret

На сайте: 10 лет

75
735

Больше никогда не лимпим в ха!

Ссылка скопирована
11.01.2015 14:09

Ответить Цитировать

6
mrmarone
Профиль

Заблокирован

На сайте: 13 лет

73
815

страта похожа на мою для гиперов ХА 25 бб. удивительное совпадение

Ссылка скопирована
11.01.2015 14:18

Ответить Цитировать

0
genuis_loser
Профиль

На сайте: 9 лет

12
125

Умирает романтика... Не будет больше заруб в духе Кельтр против Антониуса, Феруэлл против Айви... Немного грустно.

Ссылка скопирована
11.01.2015 14:46

Ответить Цитировать

8
WrongMan
Профиль

На сайте: 9 лет

3
-8

С такими успехами скоро онлайн покер пропадет( все будут ботами зарабатывать!!!

Ссылка скопирована
11.01.2015 15:05

Ответить Цитировать

-5

Войти или Зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.