生成AIパスポート第3章のポイント

生成AIパスポートの第3章は「生成AIの最新動向」です。生成AIでできることや、主要なサービス・技術について問われます。

この記事では、第3章で押さえておくべきポイントを整理します。

生成AIでできることの全体像

生成AIは、さまざまな種類のコンテンツを作ることができます。試験では、それぞれの特徴と代表的なサービスを知っておく必要があります。

試験では、主要な生成AIサービスの特徴を問われることがあります。

各サービスの開発元と大まかな特徴を押さえておけば十分です。

マルチモーダルAIは、テキスト、画像、音声、動画など複数の種類のデータを同時に扱えるAIです。

たとえば、画像を見せて「この写真の内容を説明して」と聞いたり、テキストの指示から画像を生成したりすることができます。最新のChatGPTやGeminiはマルチモーダル対応しています。

AIエージェントは、AIが自律的に判断しながら複数のタスクを実行するしくみです。単に質問に答えるだけでなく、必要な情報を自分で調べ、ツールを使い、一連の作業を自動的に進められるのが特徴です。

「AIエージェントは自律的に行動できる」という点が、通常のチャットAIとの違いです。

RAG（Retrieval-Augmented Generation）は、AIが回答する前に外部のデータベースやドキュメントを検索し、その情報を参考にして回答を生成するしくみです。

RAGのメリットは、AIの学習データにない最新情報や社内情報も活用できることです。ハルシネーションの軽減にも役立ちます。

ディープフェイクは、AI技術を使って作られた偽の動画や音声のことです。第3章では技術的な概要が、第4章ではリスクの観点から出題されます。

顔の入れ替え（フェイススワップ）、音声クローンなどの手法を理解しておきましょう。

第3章は実際のサービスや技術に関する内容が中心です。ChatGPTを日常的に使っている人にとっては取り組みやすい章ですが、各サービスの特徴の違いやRAG・AIエージェントなどの新しい概念は意識して押さえておく必要があります。