医療AI講座

「図解で簡単!!よくわかるFederated Learning(連合学習)の基礎」

MedTechToday編集部のいとうたかあきです。

今回の医療AI講座のテーマは、Federated Learning(連合学習)の基礎です。

医療AIのモデルを構築する上で問題となるのが、医療データには個人情報が含まれているため、データを集めることが難しいという点です。

この問題点を解消するアイデアが、Google発のFederated Learning(連合学習)になります。

今回は、「さらっと読んで、理解したい!AI知識を増やしたい!」という方向けに解説します。

1.AIモデル構築における問題点

ディープラーニング(深層学習)には、膨大な学習用データが必要となり、基本的に大容量のデータをサーバーに集める必要があります。

実際には、収集できるデータには限りがあり、収集できたデータの数がモデルの精度に大きく影響します。

特に医療分野では、個人情報保護の観点から、所有しているデータを、病院間を超えて収集し、AIモデル構築に使用するのは困難です。

そのような中で、Googleは2017年にFederate Learning(連合学習)と呼ばれる学習手法を発表しました。

これは、上述したAIモデル構築における問題点を、解決する学習方法です。

2.連合学習とは

通常の機械学習では、データを一箇所に集め、トレーニングデータを使って、学習していくことを行います。

それに対して、連合学習では、データを一箇所に集めずに、中央サーバーが、クライアント側で計算されたモデルパラメータのみを集めて、より洗練されたモデルを作成します。

医療分野では、例えば、各病院がクライアントに相当し、各病院内での患者の個人情報を含む多数のデータを、全体に共有することなく、AIモデル構築に使用できることが、連合学習の強みです。

ここからは、連合学習のプロセスについて、手順ごとに4stepで解説していきます。

Step1 まず中央サーバーがトレーニングに使用するモデルを決定します。

Step2 次に、中央サーバーが初期モデルを各クライアントに転送します。

Step3 クライアントは自身の持つデータを使って、モデルを学習します。

Step4 最後に、クライアントのモデル情報を中央サーバーにアップロードすることで、中央サーバーはデータに直接アクセスせずにモデル構築ができます。

以上が、連合学習の基本プロセスになります。

3. 医療AIへの応用例

医療への応用の例として、アメリカのNVIDIAのHolger R.Roth氏らのArXiv論文の概要を紹介します。

https://arxiv.org/abs/2009.01871

『患者の乳がん発症リスクを推定する上で重要な、乳房密度による4つのクラスの分類をするために、連合学習が用いられています。

世界の7つの臨床機関のそれぞれのトレーニングセットを用いて、モデルをトレーニングしたところ、ある機関の現地データのみでモデルをトレーニングした場合よりも、平均して6.3%精度が高くなる結果が得られました。』

詳しくは下記の記事で紹介していますので、興味のある方はご覧頂ければ幸いです。

4.まとめ

連合学習についてなんとなくイメージがつかめましたでしょうか。

本記事では、さらっと理解できることに重点を置きました。

少しでも本記事を通して、連合学習について理解が深まったと感じて頂ければ幸いです。

Delicious にシェア
Pocket
LinkedIn にシェア
LINEで送る