GTO 포커전략에서 벗어나야 할 때

게임을 플레이 하는 대부분의 사람들은 어떻게 틱-택-토, 체커 또는 체스와 같은 게임이 컴퓨터에 의해 플레이 할 수 있다는 것을 이해할 수 있다. 그러나 그들은 포커와 같은 게임이 어떻게 컴퓨터에 의해 플레이 할 수 있지는 이해하지 못한다.

사실은 충분한 계산 능력과 시간을 가지게 되면 고난이도의 게임을 수학과 게임 이론으로도 해결할 수 있다는 것이다.

게임은 GTO (게임 이론에 대한 최적의 전략)가 결정되었을 때 문제가 해결되었다고 간주하게 된다. GTO 전략은 아주 강력하다. 왜냐하면 이 전략은 상대가 같은 전략으로 플레이할 때 손해는 보지 않으며 상대가 다른 전략으로 플레이할 때 이길 수 있기 때문이다.

노-리밋-홀덤보다 더 많은 옵션을 가진 리밋 홀덤과 같은 게임들은 몇 년전 해결되었고 노-리밋-홀덤도 곧 해결될 예정이다. 2017년 포커봇을 개발한 Libratus는 100핸드에 14빅블라인드 이상의 결과를 내며 잘 알려진 헤즈업 노-리밋-홀덤 플레이어들 중 4명을 이기게 되었다. $1-$2 블라인드에서 100핸드당 $28을 올렸으며 이것은 정말 엄청난 확률의 승리이다.

몇몇 플레이어들은 어떻게 봇이 언제 어떻게 블러핑을 잘 할 수 있는지에 대하여 이해 할 수 없을 것이나 이 블러핑은 이미 게임 이론 수업에서 논의되는 일반적인 전술로 밝혀졌다. 예를들어 당신이 프리미엄 핸드부터 쓰레기 핸드까지의 극과극의 레인지로 리버에서 플레이하는 당신 자신을 발견하게 될 것이고 반면 상대방은 대부분 당신의 프리미엄 핸드에 지게 되는 다소 낮은 핸드와 당신의 쓰레기핸드에 이기게 되는 응축된 레인지를 가지게 될 것이다. 극과극의 레인지를 가지는 플레이어는 그들의 팟 승률에 맞게 상대를 이기는 결과를 가져오는 만큼 배팅하는 것에 의해 평균적으로 팟을 이길 수 있다.

만약 당신이 67%의 프리미엄 핸드와 33%의 블러핑을 하는 레인지로 플레이한다면 상대방이 33%의 확률로 이기기 위한 금액을 베팅해야 한다.   

이러한 경우 팟금액만큼 베팅하는 것은 상대방에게 2:1의 팟확률(팟오즈)을 주는것이다. 이 의미는 상대방이 33%의 확률을 가져야 비길 수 있다는 것이다.  따라서 극과 극으로 플레이하는 레인지에서 팟금액만큼 베팅하는 것은 상대방이 무엇을 하던 평균적으로 당신이 팟을 이길것이다.

대신 당신의 레인지가 83%의 프리미엄 핸드와 17%의 블러핑으로 이루어져 있다면 팟의 1/4을 베팅하면 (상대방에게 5:1의 팟확률/팟오즈를 주는 것) 평균적으로 팟을 이기게 될 것이다. 여기서 발생하는 한가지 흥미로운 점은 당신의 레인지에서 블러핑이 많을수록 당신은 더 쿠게 베팅할 수 있을 것이라는 것이다. 만약 당신의 레인지가 완벽하게 극과 극으로 되어 51%의 프리미엄 핸드와 49%의 블러핑으로 이루어 진다면 당신은 다른 누구도 하지 않는 팟 크기의 24.5배 베팅할 수 있을 것이다.

현재 사용 가능한 GTO솔버(PioSolver와 MonkerSolver)를 사용하여 연구한다면 당신은 계속 반복되는 패턴을 발견할 수 있을 것이다. 예를들어, 어떠한 핸드로 플랍에서 상대에게 C벳(컨티뉴에이션 벳)을 할것인지 결정할 때 당신의 주요 관심은 어떻게 당신의 레인지가 상대방 레인지와 비교되어 질 것인가이다. 만약 당신의 에쿼티가 우위에 있다면(플랍에서 당신의 전체 레인지 안에서 당신의 에쿼티가 상대방 레인지 안의 에쿼티보다 상당한 금액으로 높다는 의미이다) 작은 베팅을 하는 당신의 레인지에 비하여 종종 크게 베팅을 해야 할 것이다.

만약 당신이 에쿼티에서 우위에 있지 않다면, 당신은 프리미엄 핸드와 몇몇 드로우로 구성된 극과극의 레인지에서 큰 사이즈의 베팅을 종종 하여야 할 것이다. 그리고 당신의 핸드와 정크, 몇몇 함정과 같은 것에 주의하면서 말이다. 이러한 것을 이용하여 당신은 어떠한 상황에서도 이상적인 베팅과 체크 전략을 결정할 수 있는 구현 가능한 시스템을 발전해 나갈 수 있다.

GTO 전략은 정말 강력한 도움이 될 수 있으나 오직 세계 최고의 선수들을 상대할 때 이상적인 전략일 뿐이다. 상대방이 좋지 않게 플레이 할수록 당신은 그들이 플레이하는 것이 어떠한 방법이든 잘 이용하여 전략을 계속 바꾸어 주어야 한다. 만약 당신이 GTO전략만 고수한다면 당신은 테이블에서 많은 손해를 볼 것이다.

소극적인 익스플로잇은 당신이 GTO를 플레이할때 당신의 상대방이 어떠한 잘못된 플레이를 하여도 당신에게서 승리를 가져가는 것이고 적극적인 익스플로잇은 당신이 상대방에게서 당신의 이익을 최대로하는 방법으로 GTO 전략에서 벗어나는 것이다.

때때로 몇몇 상대방이 플레이를 잘못 하는지 아닌지를 아는 것은 어려울 수 있지만 많은 경우를 그와 맞들이다 보면 명백하게 보일 것이다. 예를들어 많은 스몰 스테이크 플레이어들이 리버에서 거의 블러핑을 하지 않는다고 하자. 당신이 리버 배팅에서 이러한 성향의 상대방이 첵-레이즈를 한다면 당신이 최고의 핸드를 가지지 않은 이상 대부분 폴드를 하여야 할 것이다. 다른 플레이어들이 자주 블러핑을 하여서 당신의 마진에 있는 핸드에 대해서 당신을 쉽게 폴드를 하게 할 것이다. 이러한 것 모두 상대방을 적극적으로 익스플로잇 하는 예시이다.

최대한으로 익스플로잇하는 전략을 사용하는 큰 문제는 상대방의 전략에 대한 평가가 잘못될 수 있다는 것이다. 만약 당신이 상대방이 절대 블러핑하지 않는다고 판단하였으나 실제로 그가 블러핑을 많이 한다면 당신이 그의 배팅에 대부분 폴드를 함으로 당신은 나락으로 서서히 갈 것이다. 만약 당신이 상대가 블러핑을 많이 한다고 판단하고 당신의 마진에 있는 핸드로 계속 폴드를 하였으나 결국 상대가 플러핑을 하지 않는 것으로 판명된다면 이 또한 당신은 무너질 것이다. 만약 상대가 당신이 최대한으로 익스폴로잇하는 전략에 맞서 빠르고 정확하게 태세변환을 한다면 당신은 초기 변환에 의해서 잠재적으로 수익을 가져갈 수 있었던 것보다 더 많은 손해를 볼 것이다.

GTO전략을 이용하여 플레이 하는 것은 이러한 딜레마를 비켜갈 수 있지만 당신의 평가가 대부분 맞다고 가정할 때 월드클라스가 아닌 플레이어들과 장기적으로 플레이 할 때 적은 수익을 가지게 되는 결과를 가져올 것이다. 그러므로 당신의 플레이에 대하여 특정 상대방이 잘못 플레이 하는 것에 대하여 확신이 설 때까지 당신이 파악한 평균적인 플레이어들이 잘못 플레이하는 것에 대하여 고려하기 위한 근본적으로 약간 변화를 준 전략으로 플레이하는 것이 현명한 플레이다.

error: SSS POKER 문의