カテゴリー: BackEnd

麻雀で自分が何を切るか学習させる

1 はじめに
2 プロジェクト名を決めてみる
3 何切る問題で考慮される要素
4 学習の方法
5 さいごに

はじめに

前回執筆しました、配牌からアガれるかアガれないか予測するの続編になります。

麻雀において、「アガれない」はいくつかパターンがあり、難しいのではないか？というアドバイスをいただきました。

そのため、方向を修正し、「何切る問題」のディープラーニングをしてみることにしました。
ゆくゆくは、自分の打ち筋を学習したCPUを作れるようにしたいと思います。

今回は実装がまだ途中なので、経過報告として記載したいと思います。

プロジェクト名を決めてみる

リスタートするために、何かこのコンテンツに名前をつけてモチベーションをあげることにしました。
ディープラーニングはざっくり言うと、「今までのデータをもとにパラメータを計算し、そのパラメータで予測する」ことかと思っています。

そんなとき、とある美少女麻雀漫画のキャラクターが思い浮かびました。

家は雀荘を経営しており、その関係で膨大な量の対局を記憶していて、その記憶を元に戦術に組み込むことができる。

Wikipediaより

これはぴったりだったので、このコンテンツを「someyamako」とすることにしました。

何切る問題で考慮される要素

本当は全ての要素を組み込みたいですが、全く計算方法が想像できないものもあり、とりあえず作成してみたかったので、以下の要素を考慮しました。

手牌

これは必須です。
以前作成したものが流用できそうです。

ドラ

ドラによって受けのかたちが決まってくるので要素に含めました。
計算方法は下の項目を参照ください。
（間違っているかもしれません）

考慮していない要素（本当は入れたい）

精度の高いコピーを作るためには、下記のような要素が必要ですが、私の実力不足で今回は考慮できませんでした。

場、点棒状況
捨牌、仕掛け

学習の方法

まずは、手牌を4×9の行列に変換します。

# example
[[ 1.  0.  0.  0.  0.  1.  0.  0.  0.]   # マンズ（1〜9）
 [ 3.  0.  0.  1.  1.  1.  2.  0.  0.]   # ピンズ（1〜9）
 [ 0.  0.  0.  2.  1.  1.  0.  0.  0.]   # ソウズ（1〜9）
 [ 0.  0.  0.  0.  0.  0.  0.  0.  0.]]  # 字牌（東南西北白発中）

これは下の手牌になります。

それぞれの牌が何枚あるか表示しています。

ドラも同様に4×9にして、ドラの部分を1とします。

例えばドラが白であれば、

[[ 0.  0.  0.  0.  0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  0.  0.  1.  0.  0.]]

とします。

計算方法は下記になります。
なお、各パラメータは以下のようになっています。