Perjudian Counterfactual Regret Minimization di Taruhan Poker

Perjudian Counterfactual Regret Minimization di Taruhan Poker

Ungkapan “Counterfactual Regret Minimization” mungkin terdengar terlalu rumit untuk dimasukkan ke dalam diskusi tentang strategi poker. (Memang, mungkin memang begitu.) Namun untungnya konsep yang menjadi acuannya dapat dijelaskan lebih sederhana, dan pada kenyataannya mungkin terbukti sangat berguna bagi mereka yang berjuang untuk bermain poker secara menguntungkan dan bahkan untuk para pemain yang sudah sukses.

Counterfactual Regret Minimization atau “CRM” mengacu pada algoritma yang digunakan oleh jaringan saraf untuk melatih bermain poker sempurna. Ini memiliki kemiripan yang mencolok dengan strategi heuristik (yaitu, berdasarkan pengalaman) yang digunakan pemain manusia ketika mereka mencoba untuk belajar poker dengan bermain.

Ketika memenangkan pro poker ditanya bagaimana mereka berhasil secara konsisten berhasil, jawaban mereka biasanya datang dalam dua varietas yang mengacu pada dua sistem pembelajaran yang berbeda: heuristik dan analitis.

Mereka yang melompat tepat di meja poker dan belajar permainan dengan trial and error mengadopsi pendekatan heuristik. Sementara itu, mereka yang lebih suka menganalisis mekanika permainan dan menerapkan secara ketat prinsip-prinsip matematisnya di meja, terlepas dari apa yang “intuisi” mereka mungkin berbisik di telinga mereka, mengambil pendekatan analitis.

Tentunya, sebagian besar pemain berprestasi akan menggunakan kedua metode pembelajaran tersebut. Yang mengatakan, sebagian besar pro poker – terutama anak-anak sekolah tua dan penggiling hidup – lebih suka belajar heuristik dengan memainkan volume tinggi dan dengan demikian mengembangkan strategi intuitif yang benar, yang banyak dari mereka bahkan tidak dapat menjelaskan dengan kata-kata mereka sendiri.

Ketika datang ke pembelajaran berbasis pengalaman, sistem TI memiliki tangan atas manusia yang sangat besar. Mereka dapat memperoleh dalam hitungan menit pengalaman bahwa seorang pemain manusia tidak akan berhasil menumpuk dalam seumur hidup. Jenis kekuatan brute yang tepat ini dipekerjakan oleh para peneliti di University of Alberta di Kanada pada tahun 2007 sambil mengejar tujuan untuk mengajarkan suatu mesin kecerdasan buatan (AI) untuk menghancurkan poker sambil berlari di superkomputer yang dapat memecahkan quadrillions of kalkulasi per detik. .

Leave a Reply

Your email address will not be published. Required fields are marked *