発表は2025年10月15日、Googleの公式ブログからでした。Gemmaファミリーを基盤に、細胞の“言語”を読み解くために設計された「Cell2Sentence-Scale 27B(C2S-Scale)」という270億パラメータのモデルを、イェール大学と共同で公開。単一細胞データを材料に、がん免疫のボトルネックを崩す新しい仮説をAIが自ら立て、実際の生細胞実験で確かめた、と報告しています。
このモデルの狙いは、“冷たい腫瘍(cold tumor)”を“温かい腫瘍(hot tumor)”へと傾けること。免疫が見逃しがちな腫瘍に、どうすれば「ここに敵あり」と印を付けられるのか──鍵は抗原提示(MHC-I)の増強です。研究チームはC2S-Scaleに「低レベルのインターフェロンが存在する免疫文脈では効くが、免疫文脈のない条件では効かない、条件付き“ブースター”薬を探せ」と指示。患者サンプルと細胞株という二つの文脈で、4,000種以上の薬剤を“仮想スクリーニング”し、前者でのみ抗原提示を押し上げる候補をあぶり出しました。
そこで浮かび上がったのが、CK2阻害薬のsilmitasertib(CX-4945)。モデルは「免疫文脈があるときだけ、抗原提示が強く上がる」という“文脈依存の分岐”を予測。重要なのは、これは既存文献の焼き直しではなく、モデルが生んだ新規仮説だという点です。実験では、人の神経内分泌系の細胞モデルで、silmitasertib単独では効果なし、低用量インターフェロン単独では小さな効果、そして併用で約50%の顕著な増強──という結果が再現されました。腫瘍の“見え方”が増すことで、免疫療法の効きやすさを高める可能性が見えてきます。
この成果の学術的な裏付けとして、bioRxivで最新改訂のプレプリントが公開され、手法や評価の詳細が整理されています。モデルとコードはHugging FaceとGitHubで一般公開。Gemma-2 27Bを土台に、CellxGeneやHuman Cell Atlasなど計5,700万細胞超のデータで学習し、GoogleのTPU v5を用いたスケールアップで性能と推論力を引き上げた、と説明されています。オープン提供ゆえに、他の研究者も検証や拡張にすぐ入れる体制です。
もちろん、これは臨床試験の結果ではなく、まずは“生細胞での実験段階”という初期の一歩。とはいえ、AIが「薬の効き方は文脈次第」という生命現象の微妙な条件分岐を読み取り、条件付きのシナジーを仮説として提示し、それを人の手で確かめるという流れが、実際に動いた意義は小さくありません。国内メディアでも、C2S-Scale 27Bが4,000超の薬を仮想評価しsilmitasertibを指名した経緯が報じられ、注目の広がりが見て取れます。
技術の観点で見れば、単一細胞の発現ベクトルを“遺伝子名の並び=文”として表現するCell2Sentenceの発想が、LLMの得意領域に生物データを引き寄せたことがポイント。巨大化したGemma派生モデルが、既存タスクの最適化にとどまらず「新しい問いと答え」を生み出しうることを示した事例として、AI×創薬の進展に弾みをつけるでしょう。投資や事業の文脈でも、オープンなモデルと資材が公開されていることは、検証・再現・派生研究のスピードを押し上げ、エコシステム形成を早めます。