転移学習とは何か

AIを一から学習させるには、膨大なデータと時間が必要です。でも、もし「すでに学んだ知識を別の場面に使い回せる」としたら、どうでしょうか。

それを実現するのが「転移学習（てんいがくしゅう）」です。英語では「Transfer Learning」と呼ばれます。

この記事では、転移学習とは何かを身近なたとえで説明し、なぜ今のAIにとって重要なのかをやさしく解説します。

転移学習は「別の場所で学んだことを活かす」技術

転移学習をざっくり言うと、あるタスクで学習した知識を、別のタスクに転用する技術です。

ゼロから学び直すのではなく、すでに持っている知識をベースにして、少ない追加学習で新しいことに対応できるようにします。

身近な例で考えてみましょう。

自転車に乗れる人は、バイクの運転も比較的早く覚えられます。バランスの取り方やハンドルの操作感覚など、自転車で身につけたスキルがバイクにも活きるからです。

逆に、自転車に乗ったことがない人がいきなりバイクに挑戦すると、すべてをゼロから覚えなければなりません。

転移学習はまさにこれと同じ考え方です。すでに学んだ基礎的な能力を土台にして、新しい課題に取り組むのです。

転移学習が実際のAIでどう使われているか、具体例を見てみましょう。

たとえば、何百万枚もの画像で「犬」「猫」「車」「花」などを見分けるように学習したAIがあるとします。このAIは、画像の中から「線」「形」「色のパターン」などの基本的な特徴を見つける能力をすでに身につけています。

このAIを土台にして、「皮膚の病変を見分ける」という医療用途に転用することができます。基本的な画像の見方はすでに学んでいるので、少量の医療画像を追加で学習させるだけで、高い精度を出せるようになります。

ChatGPTのような大規模言語モデルも、転移学習の考え方を使っています。まず大量のテキストデータで「言葉の使い方」を幅広く学習し、その後で「質問に答える」「文章を要約する」「翻訳する」といった特定のタスクに適応させています。

言葉の基礎を幅広く学んだ土台があるからこそ、さまざまな用途に対応できるのです。

転移学習が重要視される理由はいくつかあります。

特にディープラーニングの分野では、学習にかかるコストが非常に大きいため、転移学習の重要性はますます高まっています。

実は、今話題の生成AIの多くは、転移学習の発展形と言えます。

ChatGPTを例に取ると、次のような流れで作られています。

ステップ1で得た汎用的な言語能力を、ステップ2で特定の目的に転用している。これはまさに転移学習の考え方です。

つまり、転移学習なしには今の生成AIは存在しなかったと言っても過言ではありません。

転移学習は便利ですが、注意すべき点もあります。

元の学習内容と新しいタスクが違いすぎると効果が薄い — 自転車の経験はバイクに活きますが、水泳にはあまり活きません。同じように、画像認識で学んだ知識を音声処理に転用するのは難しいことがあります
元のモデルの偏りが引き継がれる — もとの学習データに偏りがあると、その偏りが新しいタスクにも影響する可能性があります