单细胞测序中的Doublet检测方法汇总(最后更新2020/03/20)
Doublet/Multiplet 的检测方法
Seurat
Seurat软件包是SingleCell的基本分析软件工具包。
该软件包利用一种特殊的处理方式(oligo-tagged antibodies against ubuquitously expressed surface proteins to place a “sample barcode” on each single cell)得到的结果,对同一个液滴存在多个细胞的情况进行demultiplex,具体方法请单击: vignette.
ps: 一般的scRNA-seq方式得到的结果无法使用该方法计算
DoubletFinder
DoubletFinder软件可以通过以下四个步骤推断Doublet:
- 从现有的scRNA数据中产生人工的doublet,方法是随机挑选细胞对的基因表达求平均(pN)
- 预处理合并后的真假混合数据
- 对混合数据计算PCA,利用pc计算每个细胞中包含doublet成分的比例
- 对细胞进行排序
(1) Generate artificial doublets from existing scRNA-seq data
(2) Pre-process merged real-artificial data
(3) Perform PCA and use the PC distance matrix to find each cell’s proportion of artificial k nearest neighbors (pANN)
(4) Rank order and threshold pANN values according to the expected number of doublets
使用方法:
经测试,该程序适用seurat2版本的object,因此需要先按照seurat2
1 | conda create -n doubletfinder r-seurat=2 r-modes=0.7.0 r-matrix=1.2.14 r-fields=9.6 r-devtools |
DoubletDetection
DoubletDetection 是一个使用Python3语言的scRNA-seq Doublet检测软件。
使用方法:
1 | #安装DoubletDetection,需事先准备好python3环境 |
DoubletDetection 运行代码:
1 | import doubletdetection |
以上代码可以再python3环境中一句句运行,也 可以写成一个py文件,python执行即可。