なつれNotes

一般向けに、'科学そのもの'と'科学者の思考法'を簡単に説明していきます。書評や雑記も書くよ。

教師あり学習・教師なし学習の違い

教師あり・教師なしって何が違うの?

この疑問点を定性的に理解して解消します。

教師あり学習

硬貨で例えてみます。

ここに三つの硬貨1円、10円、100円があり、それぞれ3g、6g、10gであると仮定します。

これらの重さは硬貨の"特徴"(feature)と呼ぶことに決め、硬貨のそれぞれ種類を"ラベル"(label)としよう。

教師あり学習とは、”特徴”(重さ)と"ラベル"(硬貨の種類)を関連づける学習のことです(図1)。

f:id:Coji_02:20180927163205j:plain
図1硬貨の種類と重さを関連付ける

関連付けが終わったら、計算機に重さを入力すれば適切に硬貨の種類を当ててくれるようになります(図2)。

f:id:Coji_02:20180927163619j:plain
図2 学習後に重さから硬貨の種類を推論する

教師なし学習

あるバスケットチームに所属する選手のリバウンド数とパス数を記載したリストがあるとします(図3)。

f:id:Coji_02:20180927165313j:plain
図3 バスケット選手のリバウンド数とパス数のリスト

このリストを元に二次元の散布図を書いて見ると図4のようになったとします。

f:id:Coji_02:20180927165319j:plain
図4 選手の散布図

こうして見ると、パスが多くてリバウンド数が少ない集まり(A)と、パスが少なくてリバウンド数が多い集まり(B)に別れていることがわかります。おそらく、AはセンターでBはポイントガードと考えられます。このように、あるデータから情報を抽出して要約してくれる学習のことを、教師なし学習と呼びます。教師あり学習とは異なり、ラベルと特徴を結びつけることはしません。今回は二次元のケースでしたが、多次元になると図4のような図は私たちには描けません。しかし、教師なし学習を使用すれば、多次元を低次元にすることができ、我々にも理解ができる形にしてくれます。