?

Log in

No account? Create an account

masterok


Мастерок.жж.рф

Хочу все знать


Previous Entry Share Next Entry
Машина против человека: искусственный интеллект обыграл людей в покер.
masterok


Вот оно! Искуственный интеллект "наступает"!

Впервые сильнейшие игроки в техасский холдем проиграли искусственному интеллекту. Выигрыш Алгоритма Libratus после двадцатидневного покерного турнира Brains VS Artificial Intelligence в питтсбургском казино Rivers составил почти 2 миллиона долларов.

Мы уже привыкли к тому, что компьютерные программы способны обыграть профессиональных игроков в шашки или шахматы - игры, в которых соперники могут видеть расклад друг друга на доске и, в соответствии с этим, продумывать свои ходы (вот тут например искусственный интеллект победил человека в Го). С покером дело обстоит иначе: игроки не имеют представления о картах оппонентов - искусственный интеллект не может просчитать все.

Кроме того, преимуществом человека в этой игре является наличие интуиции и, соответственно, возможность вычислить, блефует ли соперник.

Поэтому, победа Libratus над ведущими игроками стала для общественности полной неожиданностью.

Программа начала выигрывать у людей начиная с первых дней турнира. Поначалу игроки экспериментировали, полагая, что легко смогут найти изъяны программы и пробовали разные стратегии. Затем пытались играть с компьютером, как с человеком, но ничего не срабатывало. Хотя живым участникам удалось сократить разрыв с программой на шестой день соревнований, после этого программа стала играть только сильнее.

По словам участников, у них было ощущение, что они играют против очень сильного игрока, причём, игрока, который умеет блефовать.

Libratus

Libratus (от лат. "Баланс") - программа созданная в университете Карнеги. Это усовершенствованная программа Claudico, которая в 2015 году проиграла живым игрокам в покер на аналогичном турнире.

Либратус "знал" только основы покера. Долгое время алгоритм играл сам с собой и через миллионы раздач, определил выигрышные комбинации.

Исследователи полагают, что выигрыш программы является как раз следствием усердной практики. На протяжении 20 дней турнира участники проводили за компьютером в среднем 12 часов в сутки, затем готовились к следующему дню, разрабатывали стратегию игры, затем шли спать.

Libratus же работал без остановки, и совершенствовал стратегию всю ночь.

Примечательно, что Libratus не был создан исключительно для игры в покер. Программа может оценивать риски при игре на бирже, продумывать план лечения и даже проводить переговоры.


promo masterok январь 2, 2018 12:00 47
Buy for 300 tokens
Вот так выглядит трафик в блоге за 2019 год по месяцам. Это более трех миллионов просмотров в месяц, среди которых не только залогиненные в ЖЖ , но и любые просмотры из поисковых систем. При этом за месяц приходит около 800 000 посетителей. А вот статистика по дням одного из месяцов 2019…

  • 1
это он что ли?

похоже на то!

А вот это уже ерунда. Я как-то лет 20 назад написал на Паскале простенькую программку - игру "Морской бой". Программка играла по рэндомайзу и выигрывала приблизительно в 70% случаев. И хотя абсолютных случайностей в компьютере не существует даже сейчас (а тогда и подавно), алгоритм рэндомайза явно не был заточен, чтобы выигрывать в "Морской бой". Так и здесь. Надо не один раз играть, а года 2-3 опиграть различным игрокам против этого алгоритма. Тогда будет видно, случайно он выиграл или нет.

С вейци (aka Го) - то же самое. Надо, чтобы алогитм провёл сотни партий с лучшими и не очень игроками, а не просто 3-4 раза выиграл у действующего чемпиона. Пока что всё можно легко списать на случайность. И весьма вероятно, что это будет верно.

не ну покер вроде бы не только математика !

турнир длился 20 дней. Игра требует очень высокого нервного напряжения. Думаю, у игроков просто мозги сплавились и закипели за это время - а тут уж недалеко и до самой примтивной ошибки. А у машины такого не бывает.
В общем, круто, но ... не сенсация и переворот;-)

понятно, мне всегда казалось, что покер - это игра нервов прежде всего , а не математики или памяти

Вот это скорее. Потому и говорю, что надо несколько лет с алгоритмом поиграть, чобы понять.

Вот именно. От этого вероятность случайности возрастает. Ну и усталость живых игроков тоже играет немалую роль, как справедливо указано ниже.

Дело в том, что цели написать программу, которая будет обыгрывать всех в покер (или го), никто не ставит - такая программа не принесёт дохода, даже приблизительно похожего на стоимость разработки. Первые несколько турниров соберут зрителей, а потом, когда станет очевидно, что она у всех выигрывает, ходить на её матчи никто не будет. И будут её покупать только чемпионы мира для тренировки, но у них средства тоже ограничены: неограниченное количество денег есть только у толпы.

Поэтому все эти успехи - это просто результаты тестов универсальных нейронных сетей, собирающие заодно немного денег.

AlfaGo Сыграла 60 партий, с топовыми игроками . Счет 60:0

AlphaGo — Ли Седоль: 4-1

29 декабря 2016 на го-сервере Tygem[en] новый аккаунт «Master» начал играть партии с профессионалами го, 1 января 2017 он перешёл на го-сервер FoxGo. 4 января 2017 компания DeepMind подтвердила, что за Master и ещё за один более ранний аккаунт Magister играла обновлённая версия AlphaGo[18][19]. AlphaGo выиграла все 60 сыгранных партий (30 на каждом сервере)[20]. По окончании всех игр сооснователь DeepMind Демис Хассабис[en] написал в своём твите: «с нетерпением ждём официальных полных матчей го позже в 2017, в сотрудничестве с организациями и экспертами го»[18][19].
Master играл по 10 игр в день и быстро привлёк внимание многих игроков сервера Tygem своими исключительными навыками. Многие быстро заподозрили, что это ИИ-игрок, так как между играми или не было перерывов, или они длились очень мало. Противниками Master становились чемпионы мира, такие как Кэ Цзе, Пак Чжон Хван, Юта Ияма, То Цзяси, Ми Юйтин, Ши Юэ, Чэнь Яое, Ли Циньчэн, Гу Ли, Чан Хао, Тан Вэйсин, Фань Тинъюй[en], Чжоу Жуйян, Цзян Вэйцзе[en], Чжоу Цзюньсюнь[en], Ким Джисок[en], Кан Дон Юн, Пак Ён Хун, Вон Сонджин[en]; помимо них национальные чемпионы и серебряные призёры мировых чемпионатов: Лянь Сяо, Тань Сяо[en], Мэн Тайлин, Дан Ифэй, Хуан Юньсун, Ян Динсинь[en], Син Джинсо, Чо Хансын, Ан Сунджун. Все 60 игр, кроме одной, были быстрыми с тремя 20- или 30-секундными бёёми, лишь в игре с Не Вэйпином Master предложил увеличить бёёми до одной минуты ввиду пожилого возраста последнего. После 59 выигрышных партий Master раскрыл в чате, что им управляет доктор Айа Хуань из DeepMind[21].
https://ru.wikipedia.org/wiki/AlphaGo

Новичкам везёт)


тоже есть такое

Конечно, игрокам было тяжело в том, что они не видели морду лица искусственного интеллекта и по ее выражению не могли угадать, что у него на руках. Но ведь и ИИ не мог анализировать состояние игроков. Или он им в карты подглядывал?

вот вот, писал уже выше, что покер это все же психология и нервы. А нервы на лице в том числе и в движениях и в мимике и в поте. Хотя с другой стороны играют же на электронных площадках Покер.ком например. А там целые турниры проводятся

почему не было такого раньше? да, наверно, не пускали компьютер в казино :)

оценить вероятности задача для компа простая - то есть шансы стоит ли блефовать, например

и мне всегда казалось, что покер это психология, то есть опытные игроки смотрят на поведение противников - то есть компу проще дурить противников, если есть какая-то возможность передать эмоции в этом компютерном покере


  • 1