Вдохновленный тем, что MoGo не так давно победил сильного игрока (и зная, что там использовался метод Монте-Карло), заменил в своей программе полный перебор на Монте-Карло (то есть доигрываются в случайном порядке партии до конца, смотрится статистика и на ее основе делает ход). Как результат, программа стала играть еще хуже
Программисты, что скажете по поводу сабжа? Там какая-то хитрая реализация?
Что это за метод upper confidence bounds applied to trees? В чем его суть?