type
status
date
slug
summary
tags
category
icon
password
Seurat
是一个用于scRNA-seq数据分析的细胞数据质控、聚类、亚群鉴定和差异表达基因分析的R包。最初由纽约大学Rafael A.Irizarry和Satija等人于2015年开发。2024年5月发布了最新的5.1.0版本。本文章基于官方教程和相关说明进行单细胞数据分析的演示,以方便快速解析单细胞数据分析的参数和具体流程。
🧚 官方教程及参考资料
1.加载相应R包
2.批量读取文件并创建Seurat对象
2.1 标准格式的10x数据
2.2 稀疏矩阵格式数据
min.features:
对细胞进行过滤;表达min.featuers个基因的细胞将得到保留;min.cells:
对基因进行过滤;表达min.cells个基因的细胞将得到保留;3.批量计算线粒体和红细胞比例
object
:Seurat对象;pattern
:用于匹配特征的正则表达式模式;features
:已定义的基因集,如果提供了pattern,将忽略该模式匹配。计算后的线粒体和红细胞数据储存在"
meta.data
"中。4.批量过滤细胞
“一般默认线粒体含量至少要小于20%,红细胞的数目要至少小于5%”;
过滤调整为较严格:
nFeature_RNA
:每个细胞检测表达的基因数目大于300,小于7000;nCount_RNA
:每个细胞测序的UMI count含量大于1000,且剔除最大的前3%的细胞;mt_percent
:每个细胞的线粒体基因表达量占总体基因的比例小于10%;HB_percent
:每个细胞红细胞基因表达量占总体基因的比例小于3%。5.合并Seurat对象
6.筛选高变基因与降维处理
数据归一化结果在下图红框"
data
"中,高变基因储存在黄框"var.features
"中,PCA降维后的数据储存在蓝框“pca
”中。
7. 基于Harmony算法的数据整合
Harmony
矫正结果:8. 聚类
💁♂️后续都是基于Harmony矫正之后的数据,不是基因表达数据和直接的PCA降维数据。设置
reduction = 'harmony'
,后续分析是基于Harmony矫正之后的数据。9. UMAP/TSNE降维
10.保存单细胞降维后数据
SessionInfo
- Author:BioinfoZMZ
- URL:www.bioinfozmz.top/article/93d2b318-d6fd-48a7-bedc-f8d7ace16981
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!