MedTechToday編集部のいとうたかあきです。
今回の医療AI講座のテーマは、Federated Learning(連合学習)の基礎です。
医療AIのモデルを構築する上で問題となるのが、医療データには個人情報が含まれているため、データを集めることが難しいという点です。
この問題点を解消するアイデアが、Google発のFederated Learning(連合学習)になります。
今回は、「さらっと読んで、理解したい!AI知識を増やしたい!」という方向けに解説します。
1.AIモデル構築における問題点
ディープラーニング(深層学習)には、膨大な学習用データが必要となり、基本的に大容量のデータをサーバーに集める必要があります。
実際には、収集できるデータには限りがあり、収集できたデータの数がモデルの精度に大きく影響します。
特に医療分野では、個人情報保護の観点から、所有しているデータを、病院間を超えて収集し、AIモデル構築に使用するのは困難です。
そのような中で、Googleは2017年にFederate Learning(連合学習)と呼ばれる学習手法を発表しました。
これは、上述したAIモデル構築における問題点を、解決する学習方法です。
2.連合学習とは
通常の機械学習では、データを一箇所に集め、トレーニングデータを使って、学習していくことを行います。
それに対して、連合学習では、データを一箇所に集めずに、中央サーバーが、クライアント側で計算されたモデルパラメータのみを集めて、より洗練されたモデルを作成します。
医療分野では、例えば、各病院がクライアントに相当し、各病院内での患者の個人情報を含む多数のデータを、全体に共有することなく、AIモデル構築に使用できることが、連合学習の強みです。
ここからは、連合学習のプロセスについて、手順ごとに4stepで解説していきます。
Step1 まず中央サーバーがトレーニングに使用するモデルを決定します。

Step2 次に、中央サーバーが初期モデルを各クライアントに転送します。

Step3 クライアントは自身の持つデータを使って、モデルを学習します。

Step4 最後に、クライアントのモデル情報を中央サーバーにアップロードすることで、中央サーバーはデータに直接アクセスせずにモデル構築ができます。

以上が、連合学習の基本プロセスになります。
3. 医療AIへの応用例
医療への応用の例として、アメリカのNVIDIAのHolger R.Roth氏らのArXiv論文の概要を紹介します。
https://arxiv.org/abs/2009.01871
『患者の乳がん発症リスクを推定する上で重要な、乳房密度による4つのクラスの分類をするために、連合学習が用いられています。
世界の7つの臨床機関のそれぞれのトレーニングセットを用いて、モデルをトレーニングしたところ、ある機関の現地データのみでモデルをトレーニングした場合よりも、平均して6.3%精度が高くなる結果が得られました。』
詳しくは下記の記事で紹介していますので、興味のある方はご覧頂ければ幸いです。
4.まとめ
連合学習についてなんとなくイメージがつかめましたでしょうか。
本記事では、さらっと理解できることに重点を置きました。
少しでも本記事を通して、連合学習について理解が深まったと感じて頂ければ幸いです。