社内勉強会で強化学習を勉強しています


昨年までは年4回、春夏秋冬研修を行っていましたが、今年から月1回の勉強会に変更しました。

で、何をしているかというと、「強化学習」です。
強化学習とは名前の通り、AIが学習していくもので、例えば、自動運転ミニカーを障害物のあるコースで動かして、衝突したら、NGだと学習させて、それを次回以降の運転に活かして衝突しないでコースを回れるようにするというようなものです。(私も学習中なので、うまく説明はできませんが、、)

強化学習をやろうとしたきっかけは、ストリートファイターという格闘ゲームのキャラクタを学習させて強くしていくという動画を見たことでした。他にも横スクロールゲームのスーパマリオを学習させていくとい動画もあったりして、興味をそそられました。

電力の制御を強化学習で行う事例もあって、最終的には、それに近いこともやりたいのですが、いろいろ検討した結果、今年取り組むのは、オセロゲームです。

オセロの対戦ロジックだけを記述すれば良いフレームワークのようなものを提供されている方がいて、そのフレームワークを使って強化学習版オセロを作って年度末に対戦大会を行うのを今年の目標にしました。強化学習もQテーブルを使う強化学習とディープラーニングの深層強化学習もあるようで、できれば深層強化学習版で対戦したいと考えています。

現在の進捗(講師メンバー)
・フレームワークの環境構築手順作成
・フレームワークを使って、強化学習版オセロ、深層強化学習版オセロのプロトを作成

現在の進捗(全員)
5月:上記フレームワークの環境構築
6月:フレームワーク内での対戦ロジックの例の学習