SCDC是用於散裝RNA-Seq的反捲積方法,它利用來自多個SCRNA-SEQ參考數據集的細胞類型特定基因表達式。 SCDC採用了一種集成方法來整合來自不同實驗室和不同時間中產生的不同SCRNA-SEQ數據集的反捲積結果,並隱式地解決了批處理效應的混雜。
Meichen Dong,Aatish Thennavan,Eugene Urrutia,Yun Li,Charles M Perou,Fei Zou,Yuchao Jiang,SCDC:由多個單單細胞RNA測序參考,BBZ166,HTTPS的BioInformatics,BioInformant,BioInformants in Botuers單細胞RNA測序參考,散裝基因表達卷積。 org/10.1093/bib/bbz166
許可證:麻省理工學院
您可以使用以下方式從GitHub安裝已發布的SCDC版本
if(!quired(“ devtools”)){ install.packages(“ devtools”) } devtools :: install_github(“ meichendong/scdc”)
有關“ XBIOC”的依賴項問題問題可以通過:
install.packages(“遠程”)遠程:: install_github(“ renozao/xbioc”)
請參閱“小插圖”頁面。
SCDC論文在生物信息學的簡報上發表。
有關包裹的問題可以通過電子郵件發送至:[email protected]
當單元數據集中只有“一個主題/個人”時,請使用SCDC_qc_ONE()
, SCDC_prop_ONE()
函數。
可能影響反捲積結果的方面:
數據格式:批量和單細胞樣品是否都是原始計數 /相同格式?我們希望數據格式保持一致和可比性。
基因過濾:您是否過濾降低表達的基因 /核醣體基因 /線粒體基因?這些基因可能會影響下游分析。
單元格的大小和庫的大小因素:對於單個單元格,您認為所有基因計數(庫大小)的總和可以反映其實際細胞大小嗎?這是我們的假設之一:細胞類型之間的庫大小的比率可以反映細胞類型之間的真實細胞大小的比率。如果沒有,則可以在構造“基矩陣”時手動輸入單元格因子。
類似的細胞類型:是否存在可能混淆分析的細胞類型?例如,具有非常相似的曲線 /標記基因的細胞類型。
缺少主要的細胞類型 /技術問題:您是否期望測序程序在散裝和SC上會產生很大的影響,甚至技術是相同的?有時,單細胞參考數據可能會丟失某些單元類型的信息。例如,您的批量樣品中有脂肪細胞,但是以某種方式您沒有單細胞數據。
使用單個參考數據集進行反捲積:您是否嘗試使用一個參考數據集來測試結果一般是否有意義?我看到你嘗試了濃湯。您是否嘗試過諸如Cibersortx之類的其他方法?如果其他“單一引用”反捲積方法的結果更有意義,那麼您可以使用我們的合奏步驟直接輸入這些方法。