名古屋ではたらく社長のITニュースポッドキャスト

Ep.645 DeepSomatic──AIで腫瘍の体細胞変異を精密検出、長短リード横断の新標準へ(2025年10月23日配信)


Listen Later

発表は2025年10月16日、Google Researchのブログでした。DeepSomaticは腫瘍の遺伝子配列データから“がんを駆動する”体細胞変異を特定するAIツールで、臨床で一般的な変異同定の精度と網羅性を高めることを狙います。論文は同日付でNature Biotechnologyに掲載され、オープンソース実装と学習データの公開も同時にアナウンスされました。


技術の肝は、配列リードを画像化して畳み込みニューラルネットワーク(CNN)で判定する“画像として読む”方式です。DeepVariantと同様の発想を体細胞変異に拡張し、Illuminaの短リード、PacBio HiFiとOxford Nanoporeの長リードという主要3方式の横断に対応。腫瘍と正常のペア解析に加え、白血病など正常サンプル確保が難しいケースを想定した“腫瘍のみ”モードも備えます。学習には、乳がん4例と肺がん2例の腫瘍/正常を3方式すべてで全ゲノム配列した新データセットCASTLEを整備し、プラットフォーム固有の誤りを打ち消す形で高品質な教師データを構築しています。


性能評価では、短リードでSomaticSniper、MuTect2、Strelka2、長リードでClairSと比較して高い精度を示しました。特に難度の高いインデル検出でF1スコアが大幅に向上し、Illuminaでは次点の80%に対しDeepSomaticは90%、PacBioでは次点が50%未満に対しDeepSomaticは80%超と報告。全6系統と保存検体を合わせて計329,011個の体細胞変異を同定し、FFPE標本やWESといった現実的・歴史的サンプル条件でも優位性を確認したと述べています。


汎用性の検証として、訓練外のがん種でもテストを実施。変異数が少ない膠芽腫サンプルで駆動変異を的確に指摘し、正常サンプルが取りにくい小児白血病の“腫瘍のみ”解析でも既知変異に加え新規10変異を見つけたとしています。臨床研究の現場で直面する“データの制約”に対し、アルゴリズム側で現実解を提示した格好です。


研究はUC Santa Cruz Genomics Instituteや米国立がん研究所(NCI)、Children’s Mercyらとの共同で、成果はNature Biotechnologyに掲載。コードはBSDライセンスでGitHub公開、CASTLEの生データやベンチマーク一式も公開され、再現性と追試のしやすさが担保されています。国内外メディアも“長短リード横断での高精度化”と“オープン公開”をポイントとして報じ始めています。


実装面では、DeepVariantと統合されたパイプラインとしてDockerでそのまま走らせられ、WGS/WES、FFPE、腫瘍-正常/腫瘍のみなどユースケースごとにプリセットを用意。配列プラットフォームの選択に縛られず、一貫手順で変異リストが得られる点は、病院ラボや創薬現場の“ワークフローの整流化”に効いてきます。AIが配列ノイズと真の変異を見分け、臨床での解釈・治療選択につながる“素材”を安定に出せるか──精密医療に向けた現場の期待を、確かな実装で後押しするアップデートと言えるでしょう。

...more
View all episodesView all episodes
Download on the App Store

名古屋ではたらく社長のITニュースポッドキャストBy ikuo suzuki