前回執筆しました、配牌からアガれるかアガれないか予測するの続編になります。
麻雀において、「アガれない」はいくつかパターンがあり、難しいのではないか?というアドバイスをいただきました。
そのため、方向を修正し、「何切る問題」のディープラーニングをしてみることにしました。
ゆくゆくは、自分の打ち筋を学習したCPUを作れるようにしたいと思います。
今回は実装がまだ途中なので、経過報告として記載したいと思います。
リスタートするために、何かこのコンテンツに名前をつけてモチベーションをあげることにしました。
ディープラーニングはざっくり言うと、「今までのデータをもとにパラメータを計算し、そのパラメータで予測する」ことかと思っています。
そんなとき、とある美少女麻雀漫画のキャラクターが思い浮かびました。
家は雀荘を経営しており、その関係で膨大な量の対局を記憶していて、その記憶を元に戦術に組み込むことができる。
これはぴったりだったので、このコンテンツを「someyamako」とすることにしました。
本当は全ての要素を組み込みたいですが、全く計算方法が想像できないものもあり、とりあえず作成してみたかったので、以下の要素を考慮しました。
これは必須です。
以前作成したものが流用できそうです。
ドラによって受けのかたちが決まってくるので要素に含めました。
計算方法は下の項目を参照ください。
(間違っているかもしれません)
精度の高いコピーを作るためには、下記のような要素が必要ですが、私の実力不足で今回は考慮できませんでした。
まずは、手牌を4×9の行列に変換します。
# example [[ 1. 0. 0. 0. 0. 1. 0. 0. 0.] # マンズ(1〜9) [ 3. 0. 0. 1. 1. 1. 2. 0. 0.] # ピンズ(1〜9) [ 0. 0. 0. 2. 1. 1. 0. 0. 0.] # ソウズ(1〜9) [ 0. 0. 0. 0. 0. 0. 0. 0. 0.]] # 字牌(東南西北白発中)
これは下の手牌になります。
それぞれの牌が何枚あるか表示しています。
ドラも同様に4×9にして、ドラの部分を1とします。
例えばドラが白であれば、
[[ 0. 0. 0. 0. 0. 0. 0. 0. 0.] [ 0. 0. 0. 0. 0. 0. 0. 0. 0.] [ 0. 0. 0. 0. 0. 0. 0. 0. 0.] [ 0. 0. 0. 0. 0. 0. 1. 0. 0.]]
とします。
計算方法は下記になります。
なお、各パラメータは以下のようになっています。
W1・(4, 9) + W2・(4, 9) + b
ただ、500サンプルほど学習させてみましたが、あまり目立った特徴が見られませんでした。。。
現状はこのような感じでひたすら私が何切る問題を実施しております。
計算方法など、何か面白いことがあればまたブログに記載したいと思います。
よろしくお願いします!