隨著單細胞測序技術的發展,我們能夠在單個細胞水平上觀察基因表達,這就像是能夠聽到一個巨大合唱團中每個人的聲音,但是如何理解這些細胞之間的交流和合作卻是一個並不容易解決的問題。如在腫瘤生物學中,腫瘤細胞與其周圍的微環境中的細胞(如免疫細胞、纖維細胞和血管細胞)之間存在復雜的相互作用,這些相互作用對於腫瘤的生長、轉移和治療反應都至關重要。如果我們能夠研究清楚這些相互作用網絡,就可能找到新的治療方法,比如靶向微環境中的特定細胞或通訊通路的藥物分子。

數因智科創始人袁野博士發表於期刊PLoS Computational Biology的CINS模型就是為瞭解決這個問題(PLoS Computational Biology是計算生物學領域頂級期刊,IF 4.779)。現有的研究主要集中在單細胞RNA-Seq (scRNA-Seq) 數據之間的差異,如細胞類型的比例或差異表達的基因。而對於由細胞相互作用的變化驅動的差異,沒有空間信息很難推斷。CINS結合瞭貝葉斯網絡學習(用於推斷細胞類型-細胞類型相互作用)和約束回歸分析(用於推斷這種相互作用中涉及的特定蛋白質),來識別差異性的細胞類型相互作用及其背後的蛋白質。這個模型就像是一個超級偵探,它可以從大量的數據中找出細胞之間的交流信息。它不僅可以發現哪些細胞在交流,還可以找出它們交流的內容,這對於我們理解疾病的發展和尋找新的治療方法非常有幫助。

CINS模型的構建流程如上圖所示:

(A) 使用細胞類型註釋來提取每個樣本中的細胞類型比例,通過高斯混合模型(GMM)離散化。

(B) 對離散化的細胞豐度信息,基於貝葉斯網絡(BN)和Bootstrapping算法識別細胞類型之間的高評分差異性交互。

(C) 對於在有向自助法BN分析中識別的配對,學習構建配體-目標回歸LTR模型。在此模型中,我們使用出邊細胞類型中配體的表達變化來預測入邊細胞類型中目標基因的表達。

(D) 最後,使用LTR選擇作為BN中識別的細胞-細胞交互基礎的關鍵配體。

通過模擬分析,作者展示瞭在不同的噪聲水平下,CINS如何能夠準確地重建基礎的貝葉斯網絡。

為瞭進一步驗證模型效果,CINS被應用於一個肺部疾病的scRNA-Seq數據集。這個數據集包含瞭28名健康(對照組)和32名特發性肺纖維化(IPF)患者的scRNA-Seq數據。

通過使用CINS,作者探索瞭IPF和對照樣本之間的差異性細胞類型相互作用。結果顯示,CINS成功地揭示瞭健康個體和特發性肺纖維化(IPF)患者之間的差異性細胞類型相互作用。

此外,CINS模型還被應用於其他疾病和衰老的研究中,顯示瞭其強大的潛力。與其他方法相比,它還可以處理更大的數據集,同時還具有更高的計算效率。通過CINS模型,我們不僅可以更深入地探索細胞間的互動,還可以為未來的醫療健康和疾病治療提供更多的可能性。

袁野,上海交大副教授,研究方向為人工智能、高通量基因組學信息處理、因果關系推斷、復雜網絡分析。袁野博士創立的上海數因信科智能科技有限公司(簡稱“數因智科”),是一傢高通量數據與AI算法驅動的創新藥物研發公司,公司於業內首次提出“AI+多重高通量技術”的下一代靶向RNA的藥物研發范式。短時間、大規模的對潛在疾病靶點和先導分子、核酸序列進行高通量篩選,生成和構建瞭海量真實生物數據集,持續發現新的疾病潛在靶點和先導分子,目前已在上海、北京、深圳建立人工智能計算和制藥研發中心。

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部