教師あり学習・教師なし学習・強化学習の違い

AIの基本

機械学習には、学び方の違いによって大きく3つのタイプがあります。「教師あり学習」「教師なし学習」「強化学習」です。

名前だけ見ると難しそうですが、それぞれの考え方はとてもシンプルです。この記事では、3つの学び方の違いを身近なたとえで整理します。

3つの学び方を「勉強のやり方」にたとえると

まず、ざっくりしたイメージをつかみましょう。3つの学び方を、人間の勉強にたとえてみます。

  • 教師あり学習 — 先生が問題と正解をセットで教えてくれる(ドリル型学習)
  • 教師なし学習 — 正解は教えてもらえず、自分で共通点やグループを見つける(自由研究型学習)
  • 強化学習 — 何度も挑戦して、うまくいったら褒められる(ゲーム攻略型学習)

このイメージを持っておくと、これからの説明がスムーズに入ってきます。

教師あり学習:正解つきのデータで学ぶ

教師あり学習は、「問題」と「正解」がセットになったデータで学ぶ方法です。

学校のドリルのようなものです。「1 + 1 = ?」という問題に「2」という正解がついていて、たくさんの問題を解くうちに計算のパターンを覚えていきます。

AIの場合は、たとえば次のようなデータで学びます。

  • 写真 → 「犬」(正解)
  • 写真 → 「猫」(正解)
  • メール本文 → 「迷惑メール」(正解)
  • メール本文 → 「普通のメール」(正解)

こうした正解つきのデータをたくさん見せることで、AIは新しいデータに対しても「これは犬だろう」「これは迷惑メールだろう」と判定できるようになります。

教師あり学習は、3つの中で最もよく使われている方法です。画像認識、音声認識、翻訳など、多くのAIサービスの基盤になっています。

教師なし学習:正解なしで共通点を見つける

教師なし学習は、正解が与えられていないデータから、共通点やグループを自分で見つける方法です。

たとえるなら、初めて訪れた外国のスーパーマーケットで、商品のラベルが読めないのに、見た目や形から「これは飲み物」「これはお菓子」「これは洗剤」とグループ分けするようなものです。正解を教えてもらわなくても、似ている特徴のものを自分でまとめていきます。

AIでの具体的な使い方としては、次のようなものがあります。

  • 顧客のグループ分け — 購買パターンが似ている顧客を自動で分類する
  • 異常検知 — 普段と違うパターンを見つけて、不正アクセスや故障を検出する
  • データの圧縮 — 大量のデータから重要な特徴だけを取り出す

正解がない分、何を見つけるかは事前にわからないこともあります。その代わり、人間が気づかなかったパターンを発見できることがあるのが魅力です。

強化学習:試行錯誤しながら「よい行動」を学ぶ

強化学習は、何度もチャレンジして、うまくいったときに「ごほうび」をもらうことで、よい行動を学ぶ方法です。

テレビゲームを攻略する過程に似ています。最初はうまくいかなくても、何度もプレイするうちに「ここではジャンプしたほうがいい」「ここでは右に行ったほうがいい」と、高得点が取れる行動を覚えていきます。

強化学習が使われている有名な例には、次のようなものがあります。

  • 囲碁AI「AlphaGo」 — 何百万回もの対戦から勝てる打ち方を学習した
  • ロボットの歩行制御 — 転びながらも少しずつ歩き方を覚える
  • 自動運転 — 安全な運転操作を試行錯誤で学ぶ

強化学習は、正解が一つに決まらない問題や、長期的な戦略が必要な場面で力を発揮します。

3つの学び方を表で比較する

教師あり学習教師なし学習強化学習
正解データありなしなし(報酬あり)
学び方正解を見て覚える自分でグループ分け試行錯誤で覚える
たとえドリル学習自由研究ゲーム攻略
得意なこと分類、予測グループ分け、異常検知戦略、制御
代表例画像認識、翻訳顧客分析囲碁AI、ロボット

どの方法を使うかは「データと目的」で決まる

3つの学び方のうち、どれを使うかは「手元にどんなデータがあるか」と「何をしたいか」で決まります。

  • 正解つきのデータがたくさんある → 教師あり学習
  • データはあるが正解がない → 教師なし学習
  • 正解はないが、試行錯誤できる環境がある → 強化学習

実際のAI開発では、これらを組み合わせて使うこともあります。ChatGPTも、教師あり学習と強化学習の両方を組み合わせて作られています。

学びすぎにも注意が必要

機械学習では、学習用のデータに特化しすぎてしまう「過学習」という問題が起きることがあります。テスト問題の答えだけを丸暗記してしまい、少し問題が変わると解けなくなるのと同じです。

これは3つのどの学び方でも起こりうる問題です。

覚えておきたい3つのポイント

  • 教師あり学習は正解つきデータで学ぶ、最もよく使われる方法
  • 教師なし学習は正解なしで共通点やグループを見つける方法
  • 強化学習は試行錯誤で「よい行動」を覚える方法

機械学習の基本については、機械学習とは何かもあわせて読むと理解が深まります。

あわせて読みたい記事

Comment

タイトルとURLをコピーしました