当前位置：首页 > news >正文

【单细胞-第三节多样本数据分析】

news 2026/5/15 21:14:04

文件在单细胞\5_GC_py\1_single_cell\1.GSE183904.Rmd
GSE183904
数据原文

1.获取临床信息

筛选样本可以参考临床信息

rm(list = ls())
library(tinyarray)
a = geo_download("GSE183904")$pd
head(a)
table(a$Characteristics_ch1) #统计各样本有多少

2.批量读取

学会如何读取特定的样本

if(!file.exists("f.Rdata")){#untar("GSE183904_RAW.tar",exdir = "GSE183904_RAW")fs = dir("GSE183904_RAW/")[c(2,7)] #dir("GSE183904_RAW/"),列出所有文件#为了省点内存只做2个样本，去掉[c(2,7)]即做全部样本f = lapply(paste0("GSE183904_RAW/",fs),read.csv,row.names = 1)#row.names = 1写在lapply的括号里，但是它是read.csv的参数fs = stringr::str_split_i(fs,"_",1)names(f) = fssave(f,file = "f.Rdata")
}
load("f.Rdata")
library(Seurat)
scelist = list()
for(i in 1:length(f)){scelist[[i]] <- CreateSeuratObject(counts = f[[i]], project = names(f)[[i]])print(dim(scelist[[i]]))
}
sce.all = merge(scelist[[1]],scelist[-1])
sce.all = JoinLayers(sce.all)  #连接数据head(sce.all@meta.data)
table(sce.all$orig.ident)

3.质控指标

sce.all[["percent.mt"]] <- PercentageFeatureSet(sce.all, pattern = "^MT-")
sce.all[["percent.rp"]] <- PercentageFeatureSet(sce.all, pattern = "^RP[SL]")
sce.all[["percent.hb"]] <- PercentageFeatureSet(sce.all, pattern = "^HB[^(P)]")head(sce.all@meta.data, 3)VlnPlot(sce.all, features = c("nFeature_RNA","nCount_RNA", "percent.mt","percent.rp","percent.hb"),ncol = 3,pt.size = 0, group.by = "orig.ident")

4.整合降维聚类分群

f = "obj.Rdata"
library(harmony)
if(!file.exists(f)){sce.all = sce.all %>% NormalizeData() %>%  FindVariableFeatures() %>%  ScaleData(features = rownames(.)) %>%  RunPCA(pc.genes = VariableFeatures(.))  %>%RunHarmony("orig.ident") %>% #RunHarmony 包，整合多个样本，处理多样本的必备步骤FindNeighbors(dims = 1:15, reduction = "harmony") %>% FindClusters(resolution = 0.5) %>% RunUMAP(dims = 1:15,reduction = "harmony") %>% #reduction = "harmony"必须写上RunTSNE(dims = 1:15,reduction = "harmony")save(sce.all,file = f)
}
load(f)
ElbowPlot(sce.all)
UMAPPlot(sce.all,label = T)
TSNEPlot(sce.all,label = T)

5.手动注释

markers = read.delim("GCmarker.txt",header = F,sep = ";")
library(tidyr)
markers = separate_rows(markers,V2,sep = ",") #拆分marker
markers = split(markers$V2,markers$V1)
DotPlot(sce.all,features = markers,cols = "RdYlBu")+RotatedAxis()
ggplot2::ggsave("dotplot.png",height = 10,width = 25)
writeLines(paste0(as.character(0:13),","))
names(markers)celltype = read.csv("celltype.csv",header = F) #自己照着DotPlot图填的
celltypenew.cluster.ids <- celltype$V2
names(new.cluster.ids) <- levels(sce.all)
seu.obj <- RenameIdents(sce.all, new.cluster.ids)
save(seu.obj,file = "seu.obj.Rdata")
p1 <- DimPlot(seu.obj, reduction = "tsne", label = TRUE, pt.size = 0.5) + NoLegend()
p1

6.自动注释

SingleR完成自主注释，不同的是scRNA = sce.all

library(celldex)
library(SingleR)
ls("package:celldex")
f = "ref_BlueprintEncode.RData"
if(!file.exists(f)){ref <- celldex::BlueprintEncodeData()save(ref,file = f)
}
ref <- get(load(f))
library(BiocParallel)
scRNA = sce.all
test = scRNA@assays$RNA@layers$data
rownames(test) = Features(scRNA)
colnames(test) = Cells(scRNA)
pred.scRNA <- SingleR(test = test, ref = ref,labels = ref$label.main, clusters = scRNA@active.ident)
pred.scRNA$pruned.labels
#查看注释准确性 
plotScoreHeatmap(pred.scRNA, clusters=pred.scRNA@rownames, fontsize.row = 9,show_colnames = T)
new.cluster.ids <- pred.scRNA$pruned.labels
names(new.cluster.ids) <- levels(scRNA)
levels(scRNA)
scRNA <- RenameIdents(scRNA,new.cluster.ids)
levels(scRNA)
p2 <- DimPlot(scRNA, reduction = "tsne",label = T,pt.size = 0.5) + NoLegend()
p1+p2

7.marker基因

找不同细胞类型间的差异基因

f = "markers.Rdata"
if(!file.exists(f)){allmarkers <- FindAllMarkers(seu.obj, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25)save(allmarkers,file = f)
}
load(f)
head(allmarkers)

如果想自行修改orig.ident:使用下边的代码：

sce.all@meta.data$orig.ident=rep(c("a","b"),times= c(ncol(scelist[[1]]),
ncol(scelistl[[2]])))

【单细胞-第三节多样本数据分析】

文件在单细胞\5_GC_py\1_single_cell\1.GSE183904.Rmd GSE183904 数据原文 1.获取临床信息筛选样本可以参考临床信息 rm(list ls()) library(tinyarray) a geo_download("GSE183904")$pd head(a) table(a$Characteristics_ch1) #统计各样本有多少2.批量读取学…...

编程日记 2025/1/31 20:28:17

(java) IO流

学习IO流之前，我们需要先认识file对象，帮助我们更好的使用IO流 1.1 file 作用：关联硬盘上的文件写法： File(String path); (推荐)File(String parent, String child); //由父级路径，再子级路径拼接而成File(File p…...

编程日记 2025/1/31 20:26:00

2025年1月个人工作生活总结

本文为 2025年1月工作生活总结。研发编码使用sqlite3命令行查询表数据可以直接使用sqlite3查询数据表，不需进入命令行模式。示例如下： sqlite3 database_name.db "SELECT * FROM table_name;"linux shell使用read超时一例先前有个编译…...

编程日记 2025/1/31 20:21:49

线性调整器——耗能型调整器

线性调整器又称线性电压调节器，以下是关于它的介绍： 基本工作原理线性调整器的基本电路如图1.1(a)所示,晶体管Q1(工作于线性状态,或非开关状态)构成一个连接直流源V和输出端V。的可调电气电阻,直流源V由60Hz隔离变压器（电气隔离和整流&#…...

编程日记 2025/1/31 20:19:47

【2025美赛D题】为更美好的城市绘制路线图建模｜建模过程+完整代码论文全解全析

你是否在寻找数学建模比赛的突破点？数学建模进阶思路！ 作为经验丰富的美赛O奖、国赛国一的数学建模团队，我们将为你带来本次数学建模竞赛的全面解析。这个解决方案包不仅包括完整的代码实现，还有详尽的建模过程和解析&#xff0c…...

编程日记 2025/1/31 20:15:31

【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.28 存储之道：跨平台数据持久化方案

好的，我将按照您的要求生成一篇高质量的Python NumPy文章。以下是第28篇《存储之道：跨平台数据持久化方案》的完整内容，包括目录、正文和参考文献。 1.28 存储之道：跨平台数据持久化方案目录 #mermaid-svg-n1z37AP8obEgptkD {f…...

编程日记 2025/1/31 20:12:12

拼车（1094）

1094. 拼车 - 力扣（LeetCode） 解法： class Solution { public:bool carPooling(vector<vector<int>>& trips, int capacity) {uint32_t passenger_cnt 0;//将原数据按照from排序auto func_0 [](vector<int> & …...

编程日记 2025/1/31 20:08:06

基于Python的人工智能患者风险评估预测模型构建与应用研究（下）

3.3 模型选择与训练 3.3.1 常见预测模型介绍在构建患者风险评估模型时，选择合适的预测模型至关重要。不同的模型具有各自的优缺点和适用场景，需要根据医疗数据的特点、风险评估的目标以及计算资源等因素进行综合考虑。以下详细介绍几种常见的预测模型。逻辑回归（Logisti…...

编程日记 2025/1/31 20:02:52

＜ OS 有关＞ Android 手机 SSH 客户端 app: connectBot

connectBot 开源且功能齐全的SSH客户端,界面简洁,支持证书密钥。下载量超 500万方便在 Android 手机上，连接 SSH 服务器，去运行命令。 Fail2ban 12小时内抓获的 IP ~ ~ ~ ~ rootjpn:~# sudo fail2ban-client status sshd Status for the jail: sshd …...

编程日记 2025/1/31 19:58:35

向量和矩阵算法笔记

向量和矩阵算法笔记 Ps:因为本人实力有限，有一部分可能不太详细，若有补充评论区回复，QWQ 向量向量的定义首先，因为我刚刚学到高中的向量，对向量的看法呢就是一条有长度和方向的线，不过这在数学上的定义其实是不对，甚至跟我看的差别其实有点大，真正的定义就是数域…...

编程日记 2025/1/31 19:57:31

uniapp使用uni.navigateBack返回页面时携带参数到上个页面

我们平时开发中也经常遇到这种场景，跳转一个页面会进行一些操作，操作完成后再返回上个页面同时要携带着一些参数其实也很简单，也来记录一下吧假设从A页面跳转到 B页面 A页面直接上完整代码了哈，很简单： <t…...

编程日记 2025/1/31 19:55:23

Python 梯度下降法（二）：RMSProp Optimize

文章目录 Python 梯度下降法（二）：RMSProp Optimize一、数学原理1.1 介绍1.2 公式二、代码实现2.1 函数代码2.2 总代码三、代码优化3.1 存在问题3.2 收敛判断3.3 函数代码3.4 总代码四、优缺点4.1 优点4.2 缺点 Python 梯度下降法&#xff…...

编程日记 2025/1/31 19:49:03

Android Studio 正式版 10 周年回顾，承载 Androider 的峥嵘十年

Android Studio 1.0 宣发于 2014 年 12 月，而现在时间来到 2025 ，不知不觉间 Android Studio 已经陪伴 Androider 走过十年历程。 Android Studio 10 周年，也代表着了我的职业生涯也超十年，现在回想起来依然觉得「唏嘘」&#xff…...

编程日记 2025/1/31 19:48:00

sem_wait的概念和使用案列

sem_wait 是 POSIX 标准中定义的一个用于同步的函数，它通常用于操作信号量（semaphore）。信号量是一个整数变量，可以用来控制对共享资源的访问。在多线程编程中，sem_wait 常用于实现线程间的同步。概念 sem_wait 的基…...

编程日记 2025/1/31 19:46:56

集合的奇妙世界：Python集合的经典、避坑与实战

集合的奇妙世界：Python集合的经典、避坑与实战内容简介本系列文章是为 Python3 学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由 5 个版块组成，内容层层递进&#x…...

编程日记 2025/1/31 19:43:51

专业视角深度解析：DeepSeek的核心优势何在？

杭州深度求索（DeepSeek）人工智能基础技术研究有限公司，是一家成立于2023年7月的中国人工智能初创企业，总部位于浙江省杭州市。该公司由量化对冲基金幻方量化（High-Flyer）的联合创始人梁文锋创立&#xff0c…...

编程日记 2025/1/31 19:38:45

MySQL 索引存储结构

索引是优化数据库查询最重要的方式之一，它是在 MySQL 的存储引擎层中实现的，所以每一种存储引擎对应的索引不一定相同。我们可以通过下面这张表格，看看不同的存储引擎分别支持哪种索引类型： BTree 索引和 Hash 索引是我们比较…...

编程日记 2025/1/31 19:35:39

【ComfyUI专栏】如何使用Git命令行安装非Manager收录节点

当前的ComfyUI的收录的自定义节点很多，但是有些节点属于新出来，或者他的应用没有那么广泛，Manager管理节点有可能没有收录到，这时候如果我们需要安装需要怎么办呢？这就涉及到我们自己安装这些节点了。例如下面的内容…...

编程日记 2025/1/31 19:33:35

python算法和数据结构刷题[1]：数组、矩阵、字符串

一画图二伪代码三写代码 LeetCode必刷100题：一份来自面试官的算法地图（题解持续更新中）-CSDN博客算法通关手册（LeetCode） | 算法通关手册（LeetCode） (itcharge.cn) 面试经典 150 题 - 学习计…...

编程日记 2025/1/31 19:30:26

数据分析系列--④RapidMiner进行关联分析(案例)

一、核心概念 1.项集（Itemset） 2.规则（Rule） 3.支持度（Support） 3.1 支持度的定义 3.2 支持度的意义 3.3 支持度的应用 3.4 支持度的示例 3.5 支持度的调整 3.6 支持度与其他指标的关系 4.置信度&#xff0…...

编程日记 2025/1/31 19:27:18

互斥锁如何避免数据竞争

互斥锁（Mutex， Mutual Exclusion Lock）是一种用于保护共享资源，确保在任意时刻只有一个线程可以访问该资源的同步原语。其核心目的是解决多线程环境下的**数据竞争（Data Race）**问题，防止因并发…...

编程新知 2026/5/15 19:54:40

Windows: 深入剖析pip install SSLError与SSL模块缺失的根源及系统级修复

1. Windows下pip install SSLError的典型表现最近在Windows系统上用pip安装Python包时，不少朋友都遇到了这样的报错信息："Cant connect to HTTPS URL because the SSL module is not available"。这个错误通常会出现在使用清华源、阿里云源等…...

编程新知 2026/5/15 18:15:13

现代安全监控系统构建指南：从IPVS架构到智能分析实战

1. 项目概述：从“想要”到“拥有”，安全监控系统的核心价值“安华高科技给你想要的安全监控系统！”——这个标题听起来像是一句承诺，但背后其实是一个复杂的系统工程。作为一名在安防行业摸爬滚打了十几年的从业者，我见…...

编程新知 2026/5/15 18:02:29

stm32开发者如何快速接入大模型api实现智能对话功能

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度 STM32开发者如何快速接入大模型API实现智能对话功能为嵌入式设备增加自然语言交互能力，是许多STM32开发者希望实现的功…...

编程新知 2026/5/15 16:53:56

MATLAB 2024 升级指南：彻底卸载旧版，高效部署新版

1. 为什么需要彻底卸载旧版MATLAB？ 每次MATLAB大版本更新都会带来新功能和性能优化，但很多用户直接覆盖安装后常遇到各种奇怪问题。我去年帮实验室处理过几十台电脑的升级故障，90%的问题都源于旧版残留文件。比如有位同学复现图像处理代码时&…...

编程新知 2026/5/15 15:06:30

从SRResNet到实战：基于Pytorch的图像超分辨率重建全流程解析

1. 图像超分辨率重建基础入门第一次接触图像超分辨率技术时，我被它的魔法般的效果震撼到了。简单来说，这项技术就是让模糊的老照片变清晰，让低分辨率的监控画面呈现更多细节。在实际项目中，我经常遇到客户拿着十几年前的老照片希…...

编程新知 2026/5/15 11:36:22

用HFSS仿真一个简单的波导：不只是S参数，教你如何动态可视化电场分布（Animate功能详解）

HFSS波导仿真进阶：从S参数到电场动态可视化的深度解析 1. 理解波导仿真中的场可视化价值在微波工程领域，仿真工具的价值不仅在于获取S参数这样的量化指标，更在于揭示电磁场在结构中的真实分布与动态行为。HFSS作为行业标准的全波电磁仿真软件…...

编程新知 2026/5/15 11:04:49

SignatureTools安卓APK签名工具：5分钟告别复杂命令行，轻松完成专业签名

SignatureTools安卓APK签名工具：5分钟告别复杂命令行，轻松完成专业签名【免费下载链接】SignatureTools 🎡使用JavaFx编写的安卓Apk签名&渠道写入工具，方便快速进行v1&v2签名。项目地址: https://gitcode.com/gh_mirr…...

编程新知 2026/5/15 11:02:31

GridTravel：当地人定制旅行指南，开启真实步行探索之旅！

当地人为您量身定制旅行指南GridTravel能将您的旅行变成一段精彩故事。从隐秘小巷中的美食到令人惊叹的美景，它为您规划路线，助您探寻城市的灵魂。还能在App Store下载。由当地人带领，领略城市风情GridTravel是一个由当地人组成的社区&#x…...

编程新知 2026/5/15 10:29:02

Python小说爬虫框架NovelClaw：模块化设计与规则驱动实践

1. 项目概述：一个为小说爱好者打造的智能采集与整理工具如果你和我一样，是个重度小说爱好者，同时又有点技术背景，那你肯定遇到过这样的烦恼：追更的小说散落在十几个不同的网站，更新提醒全靠缘分&#xff1b…...

编程新知 2026/5/15 10:14:09