В Facebook создали нового покерного бота, превосходящего Libratus

В Facebook создали нового покерного бота, превосходящего Libratus

Разработчики команды Facebook создали основу для нового искусственного интеллекта – он обещает быть лучшей на сегодняшний день программой, которая может обыграть человека в NLH. ИИ уже протестировали за столами – по результатам он превзошел своего предшественника Libratus, который справился с командой покер-про в 2017 году.

Новый бот получил имя ReBeL, что трактуется как рекурсивное обучение на основе убеждений. Его концепция позволяет получить максимум информации от игры с неполной информацией.

За последние несколько лет боты отлично показали себя в самых сложных играх. Несколько лет назад бот смог стать непобедимым в нескольких видах шахмат. Он использовал правила игры, самообучался и через пару часов достигал высокого уровня мастерства. Такой же принцип использует Libratus и ReBeL, но последний имеет ключевое отличие – при принятии решения он учитывает не только видимые данные, как диапазон, размер ставок и карты, но и мнение каждого оппонента.

Как работает ReBeL

Для самообучения ReBel использует два ИИ – сеть политики и сеть вэлью. Проанализировав раздачу по двум сетям, окончательное решение бот принимает на основе общественных убеждений (PBS).

Например, в шахматах боту достаточно видеть доску и фигуры, чтобы принимать правильное решение. В случае PBS ИИ будет составлять модель вероятностей и возможных действий, которые может совершить оппонент. А также — какие из этого будут последствия.

Именно благодаря использованию PBS новый бот преуспел в играх с неполной информацией. В первых испытаниях он отлично сыграл в Холдем, Holdem Endgame (упрощенная версия без возможности рейза на двух первых улицах) и кости лжеца.

ReBeL обошел Libratus

В тестировании обоих ботов принимал участие профессиональный игрок и специалист по хедз-апу Донг Ким. В случае с Libratus играла команда игроков, но конкретно у Кима бот выигрывал по 0.029 BB в каждой раздаче.

Ким согласился протестировать новый ИИ на дистанции 7,500 рук. На этом отрезке раздач ReBeL выиграл у покер-про по 0.165 BB в каждой раздаче.

Понимая всю серьезность ситуации, которую может создать бот за реальными онлайн-столами, команда Facebook не будет выпускать код для покера. ReBeL планируется использовать в благих целях – на аукционах, в кибербезопасности и автопилотировании.

Добавить комментарий

Ваш адрес e-mail не будет опубликован. Обязательные поля помечены *