こんにちは。MedTechToday編集部の吉谷文孝(よしがいふみたか)です。
今回の記事では、医療用画像処理にもよく使われる「転移学習」について解説します。
転移学習とは「機械学習」の一分野です。機械学習については、以下の記事の中に解説がありますので、あわせてご覧ください。
1.転移学習のメリット
転移学習は、大量のデータを学習したモデルの再利用によって、「少ないデータで高性能のモデルを作成」することを目的とした学習手法です。
高性能のモデルを作成する際には、ネットワークに対して膨大なデータを用いた学習が必要になってしまいます。(例としてGoogleNetやResNetのようなものが挙げられます)
しかし、個人で何か実験を行う場合には、膨大なデータを集めて巨大なネットワークを一から学習するという事はほとんどありません。あくまでも、ニューラルネットワークによる予測を行いたい場合に必要なものは「最適化されたネットワークの重み」です。
膨大な時間が必要な「学習」は、その「重み」を得るためのステップにしか過ぎません。そのため、すでに学習済みのネットワークがある場合は、それを用いることによって、新たに学習する必要がなくなるのです。
このように、「少ないデータで学習できる」ことが、転移学習のメリットです。
2.転移学習のデメリット
一方で、デメリットとしては、再利用するモデルの学習に用いられるデータが、新たに作成するモデルの学習に利用するデータに類似していない場合には、あまり結果に期待できないことが挙げられます。
そのため、転移学習で高い精度のモデルを作成したい場合には、再利用するモデルの学習に使用されたデータに、ある程度類似したデータを用いる必要があります。
3.医療における転移学習の使用例
転移学習の使用例として、arXivから最近の記事を紹介します。
最近では、新型コロナウイルス対策のためにAIが利用されることが多くなっています。
(Covid-19診断のための不確実性を考慮した転移学習に基づくフレームワーク)
https://arxiv.org/abs/2007.14846
こちらの研究では、転移学習を利用して、4つの事前訓練された「深い畳み込みニューラルネットワーク (VGG16、ResNet50、DenseNet121、InceptionResNetV2)を用いて、胸部X線画像とCT画像から、有益で差別化できる特徴を、階層的に抽出します。
胸部X線画像においては、COVID-19の25枚の画像が撮影されました。
また、CT画像においては349枚のCOVID画像、および397枚の非COVID画像を利用し、転移画像を用いたモデル作成が行われました。
これらによって、X線画像とCT画像の両方において、他の手法に比べて診断制度が高いことが示されました。
4.まとめ
以上、転移学習について簡単にまとめました。
医療者の方のお役に少しでも立てていれば幸いです。
ご質問など、ぜひこちらにコメントください。↓