今回は、「教師あり学習と教師なし学習の違い」について、詳しくご紹介します。
機械学習は、トレンドを理解するためにデータ値をモデリングする際に、重要な概念として浮上しています。
同じような観点から、機械学習には教師あり学習と教師なし学習の2種類のアルゴリズムがあります。
まずは,この2つのアルゴリズムについて簡単に理解しましょう.
それでは,始めましょう
教師付き学習とは
教師あり機械学習とは、機械学習の一種で、過去のデータ値から学習するモデルです。
つまり、モデルに過去のデータ値(学習データセット)を与え、モデル/アルゴリズムが与えられたデータから学習して予測を行う。
過去のデータから学習する際に、パターンを決定し、それを用いて未知のデータ値に対する予測を行う。
モデルに供給されるデータは完全にラベル付けされている。
一般的な教師あり学習アルゴリズム
- 線形回帰
- 決定木回帰
- ランダムフォレスト・レグレッサー など
ここで、教師あり機械学習アルゴリズムの概念を理解するために、いくつかの教師あり機械学習アルゴリズムを理解しましょう。
この記事もチェック:知っておきたいPythonの機械学習アルゴリズムTOP5
線 形 回 帰
線形回帰では、独立変数のデータから得られる印象に基づいて、従属変数を決定するための最適な直線を得ようとします。
つまり、アルゴリズムに値の集合を与える(学習データセット)。
これらの値に基づいて、アルゴリズムは従属変数の値を見つけ、予測しようとします。
ここでいう変数はすべて線形であり、最終結果の値も線形であることが前提です。
決定木
決定木は、フローチャート構造を持つ教師あり機械学習アルゴリズムです。
つまり、データ値の予測が起こるための決定ルールに依存します。
ツリー構造の内部ノードは、属性を表す。
木はこれらの属性の値に基づいて分割され、分割される。
分割は、すべてのノード/属性がなくなるまで続けられる。
教師なし学習とは?
教師あり機械学習とは異なり,教師なし学習は過去のデータから学習するのではありません.つまり,パターンを持った学習データを一切受け付けません.むしろ,データから似たような特徴を見つけ出し,それをカテゴリーとして予測する.
ラベル付けされていないデータを利用し、その範囲内でパターンを検出し、未知のデータを与えたときに検出しやすいようにグループ化された形で収集します。
一般的な教師なし学習アルゴリズム
- K手段クラスタリング
- アソシエーションアルゴリズム
教師なし学習アルゴリズムでは、学習データは提供されない。
例えば、K means clusteringでは、特定の値(n)に対してデータをクラスタリングし、独立変数に基づいて類似性を持つ属性を収集するアルゴリズムです。
このように、パターンを検出するという概念が証明される。
基本的には、n個の属性のうち、周りの他の属性に基づく何らかのパターンや類似性を考慮して、アルゴリズムがグループ化(クラスタリング)することを意味します。
教師あり学習と教師なし学習の基本的な違い
教師あり学習と教師なし学習の3つの違いについて説明します。
1. 実世界のデータセットでの結果
予測の後、モデルの評価について考えると、教師ありの機械学習モデルは教師なしの学習モデルと比べて、より高い精度で良い結果を与えてくれます。
その理由は、教師ありの機械学習モデルは過去のデータから学習し、予測を行うため、より精度が高くなるからです。
教師なし学習モデルについては、アルゴリズムがパターンを検出し、予測を行うのは少し難しいです。
しかし、教師なしモデルに実世界のデータセットで十分な「練習」をさせると、モデルが今まで見たこともないようなパターンを学習するため、精度が急上昇することがあります。
この場合も、モデルとデータの種類に依存します。
この記事もチェック:機械学習の4つの種類について解説していく
2. 入力データの性質
教師あり学習アルゴリズムでは、モデルに与える入力データはラベル付けされている。
そのため、アルゴリズムはデータからパターンを検出することができる。
一方、ラベル付けされていないデータは、教師なしモデルに供給され、類似した特徴を検出し、グループ化します。
3. 学習データモデルの挙動
教師あり機械学習の場合、モデルは学習データと出力モデルの両方を投入する必要があります。
入力値と出力値をよく認識している。
教師なし機械学習の場合、モデルには入力/学習データのみが与えられる。
モデルは(過去のデータに対する)予測の出力を入力としないので、モデルにとっては全く未知のものです。
まとめ
ここまでで、このトピックは終了です。
ご不明な点がありましたら、お気軽にコメントください。
Pythonプログラミングと機械学習に関連したこのような記事をもっと見るには、私たちにご期待ください。
この記事もチェック:Pythonで機械学習をライブラリや概要をまとめてみた