画像はイメージです original image: megaflopp / stock.adobe.com
画像はイメージです original image: megaflopp / stock.adobe.com
AIの活用が期待されている領域のひとつに医療分野がある。
医療向け診断AIを専門に開発する「エルピクセル」のような企業もある。
先日、社団法人未踏のNEDO委託事業であるAIフロンティアプログラムでAIパスファインダー(救急)の称号を与えられた岡田直己氏も、救急医療用のスカウトCTの画像診断を自動化するAIを自ら開発した。詳しくはビジネスインサイダー の記事を参照
特に日本はCTとMRIの普及率が全世界でダントツに高く、救急医療の分野でもかなり活用されているのだという。
CTスキャンされた画像から病理を見つける作業を「読影(どくえい)」と呼ぶが、この読影が人間にもかなり難しいそうだ。
特に救急医療の現場では30時間連勤といった過酷な状況で読影ミスが起きることは少なくなく、それが岡田氏が救急医療用AIの開発の必要性を強く感じた動機だという。
医療向け画像診断はAIの技術そのものよりも、医師としての経験や読影の技術がはるかに重要である上に、そもそもそうしたデータを集めることが根本的に難しい。臨床現場にできるだけ近い医師が自らの強い使命感によってデータ作成にコミットしないと精緻なデータを集めることができない。
東京医科大学の放射線科医であり研究者である藤岡氏も、基本的にはAIの技術については素人だったという。
しかし、最新のAI開発ツールを使えば非常に簡単にAIを学習させることができ、少なくともCT画像の読影に使えるのか、その場合、どの程度の精度が期待できるのかということを手軽に確認できる。
こうした臨床現場の医療データの活用は全世界で非常に活発化してきている。
以前から脳腫瘍のCT画像を読影するデータセットは公開されていたが、あくまでも目的は機械学習のためのテーマ設定に過ぎず、実用的に使用されることを想定していなかった。提供されているデータセットにおいてはかなり大きな脳腫瘍のみが示され、罹患部は一目瞭然であり、AIに頼る必要性が少ないからだ。
しかし脳梗塞を引き起こす小さな血栓や、脳内出血を引き起こす動脈瘤はかなり精緻に読影しないと見つけることができない。そのためにはもっと膨大で、しかも2次元ではなく3次元的なデータセットが必要になる。
藤岡氏の談話のなかでなるほどと膝を打ったのは、大量のCT画像を敵対的生成学習(GAN学習)させることで架空の病理の写真を作り出し、学習データとして利用したり論文に引用したりすることで、患者のプライバシーに配慮した発表ができるのだという。
通常のGANでは、題材となるデータセットは人物の顔や自動車、部屋の写真などだが、「世界のどこにもいない人物」が生成できるということは、「世界のどこにもないCT画像」が生成できるということでもある。
新型コロナウィルスの研究においては、いまだに世界中の研究者が研究を進めているが、公開されたデータセットが少ないため、人工知能を活用することは困難だった。
この度、UCSD(カリフォルニア大学サンディエゴ校)の研究チームが新型コロナウィルスを罹患した肺のCT画像と、健常な肺のCT画像を公開したことが話題を呼んでいる。
https://github.com/UCSD-AI4H/COVID-CT
まだまだ公開されたデータは数百程度と少ないが、研究チームは広くCT画像の収集を呼びかけている。
この呼びかけに呼応して世界各国の医療機関から順次CT画像が送られ始めているようだ。
筆者もAIの研究者として試しに新型コロナウィルスを識別するニューラルネットを訓練してみようと思ったのだが、UCSDの学生はよほど慌てているのかサンプルについてきているコードがバグだらけだったのでこちらで修正して再試する手順をまとめたものを公開した。
https://github.com/shi3z/COVID-CT
手元に深層学習用ワークステーションがあれば、簡単に追試できるほか、MacなどのUNIXマシンでも(速度は遅いだろうが)追試は可能なはずだ。Raspberry Piはそのままではもしかするとメモリが足りないかもしれない。
筆者は自分が企画開発した深層学習用PCを使って追試しているが、今のデータ量なら充分学習可能だった。
この程度のデータ数でも、正解率は80%を超える。完全に人間の医者の代用にはならないだろうが、医師の判断を手助けする程度には役立つかもしれない。
少し器用な人ならば、すぐにiPhone向けにCT画像から自動的に病理かどうかを見つけるAIを作ることかできるだろう。
CTより簡易なレントゲン画像からコロナウィルスかどうか診断するという、人間の医師でも難しいことに挑戦するプロジェクトも立ち上がったようだ。
https://github.com/lindawangg/COVID-Net
また、これ以外にも医療用画像の三次元画像診断を行うための枠組みが整理され始めている。
https://github.com/black0017/MedicalZooPytorch
これは先週発表されたばかりのブログポストに基づく活動だ。
医療分野へのAIの適用は急務である。特に今のような状況では感染者をいち早く識別し隔離する必要がある。PCR検査よりもはるかに手軽にとれるCT画像やレントゲン画像から、「疑い」の痕跡を見つけるだけでも意味があるかもしれない。
ただ、実際に臨床領域にAIを導入しようとすると、医療機器としての認可が必要になり、これには膨大な時間と手間がかかかってしまう。
AIの場合、データの正確性さえハッキリしていれば、かなり高い再現性で識別できることはわかっているので、AI関連の医療機器の認可をとりやすくするか、限定された条件下では免除するなどの措置がとれれば、医療現場の負担を軽減できる可能性があることは指摘しておきたい。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。