生成AIパスポート第2章のポイント

生成AIパスポートの第2章は「生成AI」です。生成AIのしくみに関する技術的な内容が中心で、用語が最も多い章です。

この記事では、第2章で押さえておくべきポイントを、できるだけやさしい言葉で整理します。

生成AIとは何か

生成AI(Generative AI)は、文章、画像、音声、動画などのコンテンツを新しく「生成」できるAIの総称です。ChatGPTやStable Diffusionなどが代表例です。

従来のAIが「分類する」「予測する」ことが中心だったのに対して、生成AIは「新しいものを作る」ことができるのが大きな違いです。

詳しくは「生成AIとは何かをやさしく説明する」で解説しています。

大規模言語モデル(LLM)

LLM(Large Language Model)は、大量のテキストデータを学習した巨大なAIモデルです。ChatGPTの中核にあるのがこのLLMです。

LLMは「次に来そうな言葉」を予測することで文章を生成しています。意味を理解しているわけではなく、パターンに基づいて出力しているという点が重要です。

Transformerのしくみ

Transformer(トランスフォーマー)は、2017年にGoogleが発表したAIの設計図(アーキテクチャ)です。現在の主要な生成AIのほとんどが、このTransformerをベースにしています。

Transformerの最大の特徴は「Attention(注意機構)」です。これは、文章の中でどの言葉とどの言葉が関連しているかをAIが自動的に見つけ出すしくみです。

試験では、「TransformerはAttentionを使っている」「GPTもBERTもTransformerがベース」という関係を理解しておくことが大切です。

GPTとBERTの違い

GPTとBERTはどちらもTransformerをベースにしたモデルですが、役割が異なります。

  • GPT:文章を「生成する」のが得意。左から右へ順番に次の単語を予測する。ChatGPTのベース
  • BERT:文章を「理解する」のが得意。文章全体を見て意味を把握する。検索エンジンなどで使われる

「GPT=生成向き、BERT=理解向き」という違いは頻出ポイントです。

ハルシネーション

ハルシネーション(Hallucination)は、AIが事実ではない内容をもっともらしく生成してしまう現象です。「幻覚」という意味の英語に由来します。

なぜ起こるのかというと、AIは「正しさ」ではなく「自然さ」を基準に文章を作っているためです。試験では、ハルシネーションの定義だけでなく、なぜ起こるのか、どう対処すべきかも問われる可能性があります。

アラインメント

アラインメント(Alignment)は、AIの出力を人間の意図や価値観に沿わせるための技術・取り組みです。

ChatGPTでは、RLHF(人間のフィードバックによる強化学習)という手法で、AIが不適切な回答をしないように調整しています。

その他の押さえておきたい用語

  • ファインチューニング:学習済みモデルを、特定の目的に合わせて追加学習すること
  • トークン:AIが文章を処理するときの最小単位。単語や文字の断片
  • パラメータ:AIモデルの中にある調整可能な数値。数が多いほど表現力が高い
  • マルチモーダルAI:テキスト、画像、音声など複数の種類のデータを扱えるAI

第2章のまとめ

第2章は用語が多く大変ですが、「Transformerがベース」「GPTは生成、BERTは理解」「ハルシネーションはもっともらしい間違い」という大きな枠組みを押さえれば、細かい用語も整理しやすくなります。

このサイトの「生成AIのしくみ」カテゴリの記事を読むと、第2章の内容をより深く理解できます。

あわせて読みたい記事

Comment

タイトルとURLをコピーしました