生成AIの確率モデルとハルシネーションとは？“もっともらしい嘘”の仕組みを解説【JDLA Generative AI Test対策】

こんにちは、マナです。
今回は、生成AIの仕組みを正しく理解するために大切な「確率モデル」と「ハルシネーション」について解説します。

自然な文章を書いたり、画像や音声を作ったりできる生成AI。でもその裏側では、「もっともらしい言葉の並びを予測する」だけのシンプルな仕組みで動いているんです。

JDLA Generative AI Testでもよく問われるポイントなので、しっかり押さえておきましょう！

生成AI、特に大規模言語モデル（LLM）は、確率的な予測を繰り返すことで文章を生成しています。

たとえば、次のような文があるとします：

「私は今日、カフェでコーヒーを＿＿。」

この「＿＿」に続く言葉をAIは以下のように予測します：

この中から確率に応じて1つを選び、次の単語へ…という流れで文章を組み立てていくのが、確率モデルの基本です。

つまり、AIは「理解している」わけではなく、「統計的にそれっぽい言葉」を並べているだけなんです。

生成AIは、情報を記憶しているわけではなく、ありそうな文章を生成するため、事実ではない情報を出力してしまうことがあります。

この現象を「ハルシネーション（hallucination）」と呼びます。

しかも、そういった出力が一見すると正しく見えるのが厄介なポイントです。

主な原因は以下のとおりです：

生成AIは便利なツールですが、出力内容を盲目的に信じてはいけません。
以下のような対策が有効です：

→ 確率モデルとは、次に来る単語や内容を統計的に予測するモデル。
生成AIでは、過去のデータから「もっともありそうな出力」を作るために使われている。

→ ハルシネーションとは、AIが事実でない情報をもっともらしく生成してしまう現象。
対策としては、①人間による確認、②プロンプトで根拠を要求するなどがある。

このテーマは、仕組みの理解とリスク管理の両方をバランスよく問われる重要なポイントです。

JDLA Generative AI Testでは、「AIをどう使うべきか？」という視点も重視されるので、
ぜひこの内容をしっかり押さえておきましょう！

確率モデルとハルシネーションとは？〜生成AIの“思考の癖”を正しく理解する〜