ハルシネーションとは何か

生成AIのしくみ

ChatGPTなどの生成AIに質問すると、自信たっぷりに答えてくれます。しかし、その答えが100%正しいとは限りません。実在しない本のタイトルを紹介したり、架空の統計データを引用したりすることがあるのです。

このようにAIが事実ではない情報をもっともらしく生成する現象を、「ハルシネーション(Hallucination)」と呼びます。日本語では「幻覚」という意味です。

この記事では、ハルシネーションとは何か、なぜ起きるのか、どうすれば見抜けるのかをやさしく解説します。

ハルシネーションは「もっともらしい嘘」

ハルシネーションの厄介なところは、AIが出す間違った情報が一見すると本当のように見えることです。

たとえば、AIに「○○大学の創立年を教えて」と聞いたとき、「○○大学は1923年に創立されました」と具体的な年号を出してくることがあります。しかし、この年号がまったくのデタラメということがあるのです。

人間の嘘と違うのは、AIには「嘘をつこう」という意図がないことです。AIは正しい答えを出そうとしていますが、結果的に間違った情報を生成してしまうのです。

ハルシネーションが起きる具体例

ハルシネーションは、さまざまな場面で発生します。代表的なケースを見てみましょう。

  • 架空の書籍・論文の紹介 — 存在しない本や研究論文のタイトルと著者名を、あたかも実在するかのように紹介する
  • 間違った人物情報 — 有名人の経歴や発言を、事実と異なる内容で回答する
  • でたらめな統計データ — 具体的な数字を挙げるが、出典が存在しない
  • 架空の法律・制度 — 実在しない法律や制度を説明する
  • URLの捏造 — 存在しないWebページのURLを案内する

なぜAIは「幻覚」を見るのか

ハルシネーションが起きる根本的な理由は、AIの文章生成のしくみにあります。

理由1:AIは「確率」で文章を作っている

生成AIは、「次に来る確率が高い単語」を選んで文章を組み立てています。つまり、AIは「この言葉の後にはこの言葉が来やすい」というパターンで文を作っているだけで、内容が事実かどうかを確認しているわけではありません。

料理のたとえで言うと、AIは「カレーのレシピにはたいてい玉ねぎが入る」というパターンは知っていますが、目の前の冷蔵庫に玉ねぎがあるかどうかは確認していないのです。

理由2:「知らない」と言えない

AIは「次の単語を予測する」ことが基本動作なので、質問を受けると何かしらの回答を生成しようとします。人間なら「わかりません」と答えられる場面でも、AIはもっともらしい答えを作ってしまうことがあります。

最近のAIは「わかりません」と答えるよう改善されていますが、それでも完全ではありません。

理由3:学習データの限界

AIが学習したデータには、間違った情報や偏った情報も含まれています。また、学習データの時点以降の情報は持っていません。この限界が、ハルシネーションの原因になることがあります。

ハルシネーションを見抜くための5つのチェックポイント

ハルシネーションを完全に防ぐことは難しいですが、見抜くためのポイントがあります。

1. 具体的な数字や固有名詞を疑う

AIが出す具体的な年号、統計データ、人名、書籍名などは、特にハルシネーションが起きやすい部分です。重要な数字は、公式サイトや信頼できる情報源で確認しましょう。

2. 出典が示されたら実際に確認する

AIが「○○の研究によると」と出典を示しても、その研究自体が存在しないことがあります。示されたURLや論文名は、実際にアクセスして存在を確認しましょう。

3. 複数の情報源で照らし合わせる

AIの回答を一つの情報源として扱い、他の信頼できる情報源でも同じ内容が確認できるかチェックしましょう。

4. 自信満々の回答こそ注意する

AIは自信がないときでも断定的な口調で回答することがあります。「〜です」「〜ました」と言い切っているからといって、正しいとは限りません。

5. 自分の専門分野で試してみる

自分がよく知っている分野についてAIに質問してみると、ハルシネーションの感覚がつかめます。正しい部分と間違っている部分があることを実感できるでしょう。

AIの回答を鵜呑みにしないための心構えについては、AIの答えをそのまま信じてはいけない理由も参考になります。

ハルシネーションを減らすための対策

ハルシネーションを完全になくすことは現時点では難しいですが、減らすための取り組みは進んでいます。

RAG(検索拡張生成)

AIが回答を生成する前に、外部のデータベースや文書を検索して、正確な情報を取得してから回答するしくみです。AIの知識だけに頼らず、信頼できる情報源を参照することで、正確性を高めます。

RAGについて詳しくは、RAGとは何かをご覧ください。

プロンプトの工夫

ユーザー側でもハルシネーションを減らす工夫ができます。たとえば、「わからないことは『わかりません』と答えてください」「出典を明記してください」といった指示をプロンプトに含めることで、AIがでたらめな情報を生成するリスクを下げられます。

ChatGPTを使った調べものでのコツについては、ChatGPTで調べものをするときの注意点で具体的に紹介しています。

覚えておきたいポイント

  • ハルシネーションとは、AIが事実ではない情報をもっともらしく生成する現象
  • AIは「確率で次の単語を予測する」しくみのため、事実確認をしていない
  • 具体的な数字・固有名詞・出典は特に要注意
  • AIの回答は必ず信頼できる情報源で確認する習慣をつける

あわせて読みたい記事

Comment

タイトルとURLをコピーしました