English

大学共同利用機関法人 自然科学研究機構

基礎生物学研究所

  • Home
  • ニュース
  • > マウスの遺伝子解析を行う大規模基盤モデルの開発に成功 ─データ変換によるヒトの疾病予測や創薬への応用も可能に─

ニュース

プレスリリース概要

2025.04.08

マウスの遺伝子解析を行う大規模基盤モデルの開発に成功 ─データ変換によるヒトの疾病予測や創薬への応用も可能に─

中部大学
自然科学研究機構 基礎生物学研究所
筑波大学
 
1. 研究成果のポイント
  • 約2100万個のマウスの単一細胞遺伝子発現データセット「mouse-Genecorpus-20M」を構築し、Transformer Encoderアーキテクチャを用いて事前学習したマウス版の大規模基盤モデル「Mouse-Geneformer」を開発。
  • Mouse-Geneformerをファインチューニングすることで、コンピュータ上での遺伝子操作シミュレーション実験(in silico遺伝子摂動実験)を実現し、動物による実験と同等の結果が得られた。これにより、動物実験のコストを大幅に削減できる可能性を示した。
  • 相同遺伝子変換することで、Mouse-Geneformerを用いてヒトのデータの解析も可能である事を示した。
  • 大規模基盤モデルを用いた異種間トランスクリプトーム解析の有用性を示し、創薬研究や進化生物学への貢献、さらには非モデル生物への応用の可能性も提示。
 
2. 発表概要
近年、生成系AI技術の発展により、ChatGPTなどに代表される大規模基盤モデルが様々な技術分野に急速に利用が普及しつつあります。遺伝子解析の研究分野においても、2023年に米国の研究グループが発表したヒト単一細胞遺伝子発現データを大量に学習した「Geneformer」が注目を集めました。この技術により、細胞の遺伝子発現データから高精度に細胞型を分類することや、細胞内の遺伝子発現変動をコンピューター上でシミュレーションすることが可能になりました。

一方で、基礎研究の現場では、マウスが重要なモデル生物として広く利用されており、膨大な量の遺伝子発現データが蓄積されています。このデータを活用し人工知能(AI)で細胞の変異や異常を予測し、さらにヒトに応用することができれば、創薬や医療が大きく前進することが期待されます。

このたび、中部大学工学部情報工学科の山下隆義教授、藤吉弘亘教授、伊藤啓太大学院生、基礎生物学研究所 超階層生物学センターおよび筑波大学生存ダイナミクス研究センター(TARA)の重信秀治教授(クロスアポイントメント)らの研究グループは、マウス版Geneformerである「Mouse-Geneformer」の開発に成功しました。本モデルは、先行研究であるヒト版Geneformerを基盤に、最先端のAI技術であるTransformer Encoderアーキテクチャを用いて2100万細胞のマウス単一細胞遺伝子発現データを事前学習させた、遺伝子版大規模基盤モデルです。

研究グループは、Mouse-Geneformerを用いて、遺伝子発現データからのマウス細胞の細胞型分類や、細胞内の遺伝子発現変化の予測が高精度に可能であることを実証しました。従来手法と比較し、細胞型分類の精度が向上しました。また、in silico遺伝子摂動実験によって疾患に関連すると考えられる遺伝子を特定できることが示されました。さらに、研究グループは本モデルを異種間解析に応用する手法も提案しました。相同遺伝子(注3)変換を介してヒトのデータをMouse-Geneformerで解析すると、ヒト版Geneformerと同等の精度でヒトの細胞型分類が可能であることを確認しました。マウスの遺伝子発現データは、ヒトよりも多く収集・公開されており、また、ヒトでは技術的・倫理的に困難な実験のデータも取得可能です。このため、Mouse-Geneformerと異種間解析技術を組み合わせることによって、創薬や疾患研究の基盤情報として大きな貢献が期待されます。本研究成果は、3月19日付で、遺伝学の国際誌PLOS Geneticsに掲載されました。
 
fig1.jpg
図1:マウスの大規模単一細胞遺伝子発現データセット「Mouse-Genecorpus-20M」を構築する手順
 
 
fig2.jpg
図2:Mouse-Genecorpus-20MをTransformerアーキテクチャによって深層学習して「Mouse-Geneformer」を構築する概略図。