type
status
date
slug
summary
tags
category
icon
password
Seurat 是一个用于scRNA-seq数据分析的细胞数据质控、聚类、亚群鉴定和差异表达基因分析的R包。最初由纽约大学Rafael A.Irizarry和Satija等人于2015年开发。2024年5月发布了最新的5.1.0版本。本文章基于官方教程和相关说明进行单细胞数据分析的演示,以方便快速解析单细胞数据分析的参数和具体流程。

🧚 官方教程及参考资料


1.加载相应R包

 

2.批量读取文件并创建Seurat对象

2.1 标准格式的10x数据

notion image
 

2.2 稀疏矩阵格式数据

notion image
min.features:对细胞进行过滤;表达min.featuers个基因的细胞将得到保留;
min.cells:对基因进行过滤;表达min.cells个基因的细胞将得到保留;
 

3.批量计算线粒体和红细胞比例

object:Seurat对象;
pattern:用于匹配特征的正则表达式模式;
features:已定义的基因集,如果提供了pattern,将忽略该模式匹配。
计算后的线粒体和红细胞数据储存在"meta.data"中。
notion image
 

4.批量过滤细胞

“一般默认线粒体含量至少要小于20%,红细胞的数目要至少小于5%”;
过滤调整为较严格:
nFeature_RNA:每个细胞检测表达的基因数目大于300,小于7000;
nCount_RNA:每个细胞测序的UMI count含量大于1000,且剔除最大的前3%的细胞;
mt_percent:每个细胞的线粒体基因表达量占总体基因的比例小于10%;
HB_percent:每个细胞红细胞基因表达量占总体基因的比例小于3%。
 

5.合并Seurat对象

 

6.筛选高变基因与降维处理

数据归一化结果在下图红框"data"中,高变基因储存在黄框"var.features"中,PCA降维后的数据储存在蓝框“pca ”中。
notion image
 

7. 基于Harmony算法的数据整合

Harmony矫正结果:
notion image
 

8. 聚类

💁‍♂️后续都是基于Harmony矫正之后的数据,不是基因表达数据和直接的PCA降维数据。设置reduction = 'harmony',后续分析是基于Harmony矫正之后的数据。
 

9. UMAP/TSNE降维

notion image
 

10.保存单细胞降维后数据

SessionInfo

 
 
三代测序数据SV鉴定——cuteSV【毕业随想】-“太阳照常升起”
Loading...