機械学習は、AI(人工知能)の中核をなす技術です。機械学習には様々な手法がありますが、学習方法や入力データにより、「教師あり学習」「教師なし学習」「強化学習」の3つに分けられます。
今回のコラムでは、機械学習の3種類の学習方式について、詳しく解説していきます。
教師あり学習
教師あり学習は、正解のラベルや数値が分かっているデータをもとに構築された学習モデルを使って、コンピューターが学習していく手法です。機械学習の学習手法の中でも最もシンプルであり、分類や予測において、人間が予め立てておいた予測に近い結果が得られやすいことが特徴です。
教師あり学習は、過去のデータから将来を予測するような場合にも使われます。例えば、株取引における市場予測や、自社の商品をよく購入してくれるクライアントの推定などです。教師あり学習の精度を向上させるには、人間が設計した通りに分類できるよう、特徴を抽出しやすい学習データを用意しておきましょう。
教師あり学習のタスク「識別」と「回帰」
教師あり学習には、「識別」と「回帰」の2種類の代表的なタスクがあります。「識別」とは、画像を入力し、正解として犬や猫といった、予め定められたいくつかのクラスに分類するものです。また「回帰」とは、気温を入力し書籍の販売量を予測するといったタスクです。
例えば、教師あり学習で靴の画像を分類したい場合、学習データとして様々な靴の写真を数千~数万枚用意します。画像にはそれぞれ「これはハイヒール」「これはパンプス」「これはブーツ」と、正解ラベルを付けておきます。この正解ラベルと、用意した膨大な量の画像データの組み合わせを、機械学習のプログラムに読み込ませます。そこから画像データと正解ラベルの組み合わせを観察して、「ハイヒール」「パンプス」「ブーツ」を上手く分類するためのモデルを見つけ出していきます。
教師なし学習
教師なし学習は、正解ラベルの付いていない入カデータから、共通する特徴を持つグループを見つけたり、データを特徴づける情報を抽出したりする学習手法です。
教師なし学習の代表的なタスクに、クラスタリングがあります。クラスタリングはデータの中から似た特徴があるデータを自動で見つけて、何種類かのグループに分けるものです。例えば、年齢や性別消費傾向といったユーザーの購買データから、購買行動が似ているユーザーをグループ分けしたり、アンケートデータからユーザーの嗜好を抽出したりすることができます。
教師なし学習のメリット・デメリット
データに正解ラベルが付いている必要がないため、教師あり学習に比べてスタートしやすい点が、教師なし学習のメリットとして挙げられます。また、人間の手による正解ラベル付けが必要な教師あり学習に比べて、教師なし学習は正解ラベル付けがなくてもデータを分類可能です。
一方で、コンピューターがどのような分類基準を作るか予測できないので、人間が想定できない分類方法を見つけ出せる反面、分類が実用上役に立たないこともあるようです。また、教師なし学習によって導き出された結果の使用方法に対して、どのように使用するか、判断がつかないなどのデメリットもあります。
強化学習
「強化学習」は、教師あり学習や教師なし学習と異なり、結果が出るまでに時間がかかったり、多数の繰り返しが必要になったりするタスクに関して、実際に行動しながら最適な判断を見つけ出す手法です。自動車の自動運転、ロボットの制御やAlphaGo(アルファ碁)に代表されるようなゲームに利用されています。
教師なし学習同様、学習データとして用意するのは入力のみですが、出力(行動)の善し悪しに応じた報酬が与えられます。どのような行動を取れば最大の「報酬」が得られるかを、コンピューターが試行錯誤しながら学んでいくことで最適な解に到達します。
強化学習の場合の習得法とその原理
入力の際、「〇〇できたら+1点」というように、予め報酬を決めておきます。最初コンピューターは「何をしたらいいか分からない」状態にあるため、用意した選択肢の中からランダムに動いてしまいます。しかし、報酬がもらえたときに「どのような状態」で「何をしたら」報酬がもらえたかを記憶していくのです。
次にランダムな動きを残しつつ、前回の記憶を手がかりに動きます。そこで再び報酬がもらえたら、「どのような状態」で「何をした」を記憶していきます。この流れを繰り返すうちに、報酬がもらえる「状態」と「行動」のペアを獲得するようになります。
犬や猫を飼い始めたとき、人間の指示を聞き入れてもらうために餌を使うでしょう。犬や猫たちは、人間からご褒美をもらえると、どうすればご褒美(=餌)がもらえるか試行錯誤し始めます。最終的には、その繰り返しの中で「こうするとご褒美(=餌)がもらえる」という事実に気づき、ご褒美を獲得できるようになります。強化学習も同じ発想に基づいているのです。