【ReLU, PReLU, シグモイド etc...】ニューラルネットでよく使う活性化関数の効果をKerasで調べてみた

こんにちは、ほけきよです！

Kerasは簡単に実験ができて便利ですね！今回は、Kerasを使って活性化関数が実際の精度に与える影響を調べてみます。

Kerasの動かし方とかわからない人はこの記事を参照！

指標

基本的に学習時の精度の上がり方を見たいという時は、trainingとvalidationを見る(testは最後に試す用のものなので使えない)

f:id:imslotter:20170112005513p:plain

今回は、training dataでの正解率(accuracy)とvalidation dataでの正解率について各epochごとにどう変わるか見てみた。

Linear〜Leaky ReLUまでの関数系はこれ。数式を知りたい人はググってみてください、そんなに難しくないです。

f:id:imslotter:20170112005543p:plain

PReLUというのは、Leaky ReLUの負の部分の傾きを、データによって学習させていく賢い方法。どうやって学習させてるの？時になる方は論文を読んでみましょう→論文

Linearは活性化関数をかけない状態 つまり線形分類器
- そのまま(線形分類器)だと、精度が全然出ていない
- 非線形性がニューラルネットに重要ということがわかる
ReLU系強い。そしてsoft plusもなかなか健闘している。
- 両者の関数系は似ている
PReLUが、validation accuracyまで見るともっとも優秀
意外にLeaky ReLUが力を発揮しきれていない？

f:id:imslotter:20170112010055p:plain

trainingデータの精度的にはは小さい方がいい
- これは正解データに対して当てはめているだけ
- 実際は過学習している可能性がある。
大事なのはvalidation accuracyで、実際にそのepochでtrainingしなかったものに対してどのくらいの効果を発揮するか。
- validation accuracyを見ると、 ${0.0 \le a \lt 0.4}$ あたりで Leaky ReLUを調節すればよさそう。
- だが、大幅な精度改善というわけにはいかない
今回は層が一層だから差があまりないのかも。深いそうになってくるとPReLUやLeaky ReLUが過学習を防ぐ方向に活躍してくれるらしい。