ヒト細胞内の遺伝子連携を可視化するAIモデル開発(Researchers Develop AI Model That Maps How Genes Work Together in Human Cells)

ad

2026-05-21 マウントサイナイ医療システム(MSHS)

米国のIcahn School of Medicine at Mount Sinaiの研究チームは、ヒト細胞内で遺伝子がどのように相互作用して機能するかを解析するAIモデルを開発した。研究では、大規模な遺伝子発現データや細胞情報を機械学習で統合解析し、遺伝子ネットワークや機能的関連性を高精度にマッピングすることに成功した。従来は個別に研究されることが多かった遺伝子機能を、細胞全体のシステムとして理解できる点が特徴であり、疾患メカニズム解明や創薬研究への応用が期待される。AIモデルは、特定遺伝子の変化が他の遺伝子群へ与える影響も予測可能で、がん、神経疾患、免疫疾患など複雑疾患研究の加速につながるとされる。研究者らは、細胞レベルでの「遺伝子協調地図」を構築することで、精密医療や個別化治療への新たな基盤を提供すると述べている。

<関連情報>

GSFM:多様な遺伝子セットの大規模コレクションで事前学習された遺伝子セット基盤モデル GSFM: A gene set foundation model pre-trained on a massive collection of diverse gene sets

Daniel J.B. Clarke ∙ Giacomo B. Marino ∙ Avi Ma’ayan
Patterns  Published:May 21, 2026
DOI:https://doi.org/10.1016/j.patter.2026.101565

ヒト細胞内の遺伝子連携を可視化するAIモデル開発(Researchers Develop AI Model That Maps How Genes Work Together in Human Cells)

Highlights

  • GSFM enables gene function prediction using any annotated gene set as input
  • The GSFM website serves gene pages with function predictions for all human genes
  • Simple model architecture was trained on a massive and diverse collection of gene sets
  • GSFM is also used to predict protein interactions and perform enrichment analysis

Summary

Trained on massive datasets, foundation models produce embeddings used for many applications. We created a gene set foundation model (GSFM) trained on a massive collection of unlabeled gene sets from Rummagene and RummaGEO. Rummagene extracts gene sets from supplemental materials of publications, and RummaGEO hosts gene sets computed from published transcriptomics studies. Several GSFM architectures were benchmarked for their ability to predict gene function, gene-disease associations, and protein-protein interactions as well as to perform gene set enrichment analysis. Gene function predictions were compared with other models and evaluated using labeled gene sets from the Gene Ontology and KEGG pathways, the GWAS Catalog, and ChEA. The best GSFM architecture is a denoising autoencoder trained on multi-hot-encoded gene sets. This GSFM model achieves better performance compared with the other models. Gene-focused landing pages were created to serve GSFM gene function predictions for all human genes. These landing pages are served on a dedicated platform that also provide GSFM gene set augmentation and GSFM gene set enrichment analysis.

細胞遺伝子工学
ad
ad
Follow
ad
タイトルとURLをコピーしました