【2022】機械学習の種類はどれくらい？3つのアプローチとアルゴリズムの種類

人工知能開発を後押ししてきた仕組みの一つが、機械学習です。コンピューターに判断能力をもたらす上で大きな役割を果たす機械学習は、紐解いてみるといくつもの方法が存在します。

今回は、機械学習の仕組みやその種類に注目し、それぞれどんな違いがあり、どのように手法を選べば良いのかについて紹介します。

機械学習の仕組み

そもそも機械学習の仕組みは、大量のデータをプログラムに読み込ませることで、データの分類や予測を自発的に行えるよう設計するものです。

これまで、コンピュータープログラムはあらかじめ決められた計算式を実行することしかできず、自ら新しい答えをアウトプットすると言うことはできませんでした。足し算や引き算はどれだけ桁が大きくなっても瞬時に回答できるけれど、計算式を新たに生み出すことはできないといったようなものです。

しかし、機械学習アルゴリズムを組み込んだプログラムの場合、大量のデータからそのパターンを予測することで、自ら新しい解法を導き、データを独自に解釈することが可能になります。従来の売り上げデータから最も商品が売れるシーズンや売れる商品ラインナップを導いたり、株価の値動きを予測したり、その運用方法はさまざまです。

そして、目的のAI活用の方法によって、さまざまなアプローチで機械学習プログラムが組まれています。以下では、機械学習の仕組みについて、さらに細かく解説していきます。

機械学習の主な3つのアプローチ

機械学習のアプローチは、全部で3つに大きく分けられます。「教師なし学習」「教師あり学習」、そして「強化学習」はいずれも人工知能開発において重要な役割を果たします。

教師あり学習

教師あり学習とは、正解データをプログラムに与えながら学習を進めていく方法です。答えを常に提示してもらいながらデータをインプットできるため、効率的に人工知能の強化を進められます。

正解のデータをあらかじめ付与して人工知能に読み込ませる必要があることから、答えの正誤判定が明快なタスクに最適化された方法です。

例えば、りんごとみかんの分類です。りんごの画像データには「りんご」の解答タグを与え、みかんのデータには「みかん」とタグづけしておくことで、コンピューターはデータを読み込んだときにりんごとみかんの特徴を少しずつ学習ができます。

あるいは、コンピューターウイルスの有無を検知できるセキュリティシステムの構築や、商品のレコメンデーション機能なども、教師あり学習によって実現できる人工知能の活用方法です。株価の予測や気象予報など、明確な数値やタグづけはできないものの、パターン化して予測ができるもののも教師あり学習によって実現が可能です。

ディープラーニングもまた、教師あり学習をグレードアップさせた高度な機械学習として、発展を続けています。

教師なし学習

一方の教師なし学習は、教師あり学習とは対照的に、学習データに正解が付与されていないタイプの学習方法です。

例えば、データの分類タスクが教師なし学習を採用した人工知能に与えられているとします。教師あり学習の場合、正解のタグをもとに、機械学習は分類を行えば良いだけですが、教師なし学習の場合はアルゴリズムが独自解釈で分類を実施し、人間はその結果からどのような分類を行なっているかを検討しなければなりません。

この際、教師なし学習において実行されるのがクラスタリングです。クラスタリングとはデータ分類方法の一環で、データの特徴を導きながらグルーピングを行います。

また、データの特徴を把握する上では、次元削減というプロセスも実行しています。データの特徴を見分ける上で必要な情報を抽出するための方法で、丁寧なクラスタリングを実行するために欠かせません。

ディープラーニングを支えるニューラルネットワークの仕組みは、この特徴量把握に優れていることから、教師なし学習の実行に活躍している技術です。

人間からは正解・不正解の把握が難しい問題や、イエス・ノーで回答できないタスクに教師なし学習は使われます。3Dモデルの生成技術や画像認識、自動運転技術など、高度なAI技術を支えているのが教師なし学習です。

ディープラーニングの「教師なし学習」とは？教師あり・強化学習との違いと活用事例

強化学習

強化学習は、「教師あり学習」「教師なし学習」とは異なり、コンピューターシステムが自律的にトライアンドエラーを行い、最適なパフォーマンスを実現するための技術です。

強化学習のプロセスにおいて重要なのが、目標の設定です。ユーザーによって定められた目標（スコア）の値を最大化するため、コンピューターはさまざまな試行錯誤を繰り返しながら、少しずつアルゴリズムを強化していきます。

代表的なのが、コンピューターゲームに強化学習を用いてAIにプレイさせるプログラムです。初めはろくにプレイもおぼつかなかったAIが、何千回、何万回とプレイを重ねることで、人間と変わらないプレイングを実現できるようになります。プレイを重ねるごとに、キャラクターの動かし方や敵の倒し方を覚え、ハイスコアを取るための方法を導き出すという仕組みです。

あるいは、二足歩行ロボットの実現です。ロボットの歩行制御は高度な技術であり、人間の技術者が検証を行いながら進めていくには膨大な時間がかかります。そこで、人工知能の強化学習アルゴリズムを活用すればAIが自動で試行錯誤を繰り返し、長距離の歩行を実現するために最適な制御機能を学習できます。

近年、さまざまな歩行ロボットの発展が見られるのも、このような強化学習の発展が背景にあります。

ディープラーニングの「教師なし学習」とは？教師あり・強化学習との違いと活用事例

教師あり学習のアルゴリズムの種類

ここで、各学習方法で採用されているアルゴリズムの種類についても解説していきます。まずは、教師あり学習からです。

線形回帰

教師あり学習において最もポピュラーなのが回帰分析です。その中でも、線形回帰は初歩的な分析手法の一つで、適合性の高い直線を引きながら、最適解を把握しようという手法です。

説明変数が一つの線形回帰を「単回帰分析」、説明変数が二つ以上の分析を「重回帰分析」と呼び、目的に応じて使い分けられます。

線形回帰の活用シーンは、最適な数値の予測が必要な場面です。売り上げや土地の価格など、過去のパターンから予測ができるものが一般的です。

ロジスティック回帰

ロジスティック回帰は、特定の事象が発生する要因が複数考えられるとき、それぞれの要因から特定の結果がもたらされる確率を計算するための手法です。未だ判明していない結果を予測するのに活躍することはもちろん、すでに判明している結果の確認や説明をする際にも使われます。

どんな食事が体重の増減に関連しているのか、飲酒量が病気の罹患率にどう影響しているのかを検証するときなど、活用機会は多岐に渡ります。

サポートベクターマシン（SVM）

サポートベクターマシンは、教師あり学習の代表的なアルゴリズムで、精度の高さやスピードの速さから人気の手法です。データを分割する際に現れる直線に最も近い点をサポートベクターと呼びますが、このサポートベクターを使って直線が上にあるか、下にあるかを把握し、クラスの分類を実行するという仕組みです。

識別能力が高く、少ないパラメータで実行できることから、頻繁に利用されています。

決定木分析

決定木分析は、特定の目的に合わせたツリー構造を形成し、データ分析を進める手法です。

特定の行動、例えば使い捨てカイロの購入に関して、その日の気温や客層、天気などの条件を分類して設問を樹形図状に繰り返します。異なる条件下において購入割合がそれぞれ割り出され、最終的な購入確率を把握できるという仕組みです。

上記で描かれる樹形図は分類木と呼ばれますが、もう一つ重要なのが回帰木です。回帰木では、特定の行動に伴う推定値を樹形図で表したものです。

上の例でいえば、カイロの購入率ではなく、「〇円のカイロが最も売れた」という事象を把握したい場合に有効なのが回帰木です。どんな条件においていくらのカイロがよく売れているのかにあたりをつけられます。決定木分析では、分類木と回帰木を組み合わせて実施します。

ニューラルネットワーク

ニューラルネットワークは、ディープラーニングに採用されている分析手法です。人間の脳神経（ニューロン）をモデルにしたネットワーク構造で、多層構造の中にデータをインプットさせることで、特徴量を把握したり、データのパターンを読み込んだりすることが可能です。

「入力層」「隠れ層」「出力層」の三層構造で成立していますが、隠れ層が増えるほどに精度の高い読み込みが実現します。近年のニューラルネットワークは隠れ層の多層化に成功したことで、ディープラーニングのような高度な学習プロセスを実現しました。

教師なし学習のアルゴリズムの種類

続いて、教師なし学習のアルゴリズムについても確認しておきましょう。

K平均法

K平均法はK-means法とも呼ばれ、類似する要素同士をクラスタリングする際に用いられる手法です。座標状にさまざまなデータが散らばっている場合、分類の形式や分類するクラスの数を指定してやることで、座標上のデータが条件に合わせて分類されます。

教師あり学習とは異なり、正解があらかじめ与えられていないため、ユーザーが自ら分析結果を解釈する必要があります。

自己組織化マップ

自己組織化マップはニューラルネットワークの一種で、高次元のデータを二次元に落とし込み、平面空間でマッピングすることで理解を促そうという仕組みを備えています。二次元にデータをマッピングすることで、そのデータの特徴や傾向、データ間の相関関係を把握できるようになるため、汎用性の高い手法として重宝されています。

検索システムの実現や経営分析など、さまざまなシーンで活躍しています。

主成分分析

主成分分析は、多様な種類のデータを要約し、特徴の把握を促すために用いられる手法です。そのままでは把握が難しい説明変数をより少ない指標に落とし込んでしまうことで、データのわかりやすさを突き詰めることができます。

ビッグデータから重要な情報を抜き出す上でも、主成分分析の手法は用いられます。目的に応じて必要な変数を抽出し、機械学習へと応用するというものです。次元を縮小しても重要な要素が削られにくいということから、教師なし学習を実施する上ではポピュラーな手法です。

強化学習の種類

続いては、強化学習の種類について紹介していきます。

一般的な強化学習

強化学習の基本的な仕組みは、「エージェント」と「環境」の関係によって成立します。

エージェントは現在の状態を確認、分析し、目的に応じて最適な意思決定を行うためのプログラムです。一方の環境は、ビデオゲームやロボットといったエージェントに条件を与えたり、意思決定を下したりするための場のことを指します。

また、環境はエージェントに対して報酬を与える役割も果たします。敵を倒してスコアを獲得したり、正しくロボットの足を動かして歩行距離を稼いだりすることがエージェントの達成すべきタスクです。エージェントの意思決定に対して環境が現在の状況を観測し、目標に向かって近づいていれば報酬を与え、そうでなければ与えないという仕組みが強化学習の基本です。

仮に、環境から報酬が与えられなかった場合、つまり敵からの攻撃を受けてゲームオーバーとなったり、ロボットがこけてしまったりした場合は、エージェントは修正を行います。環境から与えられたフィードバックをもとに、何度もエージェントは意思決定を繰り返すことで、正解に近づいていく仕組みです。

深層強化学習

最近では、強化学習の仕組みにディープラーニングを導入した新装強化学習と呼ばれる手法も導入されつつあります。深層強化学習では、ディープラーニングが持つ自律的な特徴量抽出の仕組みを生かし、エージェントの自律制御機能と組み合わせることで、より高度な意思決定を行えるようになっています。

この結果、エージェントが総当たり的にパターンを解析する必要はなくなり、特徴量抽出によって確度の高い意思決定にあたりをつけ、効率よく報酬を獲得できるようになりました。今後、深層強化学習はますます普及し、AIの発展に役立ってくれるはずです。

機械学習手法の選び方

これまで消化してきたように、機械学習のアプローチにはさまざまな方法が挙げられます。では、実際に機械学習を実施する際には、どのような手法を選べばよいのでしょうか？ここでは、機械学習手法の選び方について解説します。

データの種類を確認する

まずは、データの種類を確認するところから始めましょう。「教師あり学習」か「教師なし学習」を選ぶかを把握する際には、そのデータに正解データは付与されているかどうかを確認します。

正解が用意されている場合には教師あり学習、ない場合には教師なし学習を選べば良いので、わかりやすい分類方法といえます。データの特徴を理解することで、適切な機械学習を素早く採用できるようになります。

タスクの内容を確認する

機械学習を実施する上では、どんな目的があって実行するのかを把握することも大切です。

特定商品の売り上げ予測を見たい場合には「教師あり学習」が有効ですし、データの分類を進めたい場合には「教師なし学習」のアルゴリズムからピックアップが必要です。ロボットの制御能力を高めたい場合には「強化学習」が有効であるなど、目的に応じた機械学習手法の使い分けが求められます。

逆に、必要のない分類や回帰分析を行なっても、目的にたどり着くことは難しいものです。同じ機械学習でも、正しい手法や結果を選べなければ、労力が無駄になってしまうケースもあります。漠然と機械学習を扱うのではなく、意味のある使い方を意識することが大切です。

実際に動かしながら比較する

機械学習手法を選びきれない場合は、実際に動かしてみながら比較検討することが有効です。特に、教師なし学習が必要な場合などは、どのような結果が弾き出されるかわからないことも多く、手法を一つずつ確認しながら出力結果を比較しなければならない場合もあります。

有効と思われる方法をいくつかピックアップし、目的の達成を目指しましょう。

まとめ

機械学習のアプローチは大きく分けると「教師あり学習」「教師なし学習」「強化学習」の3つですが、それぞれの方法にもさまざまなアルゴリズムが存在します。基本的な方法から発展的で難易度の高いものまでさまざまですが、まずはベーシックな分析手法を学び、分析を行えるようになることが大切です。

扱える分析手法が増えれば増えるほど、実行できる学習方法も増えていきます。できるだけ多くの手法に触れることが、最適な手法を選ぶ能力を養うことにもつながるでしょう。2021