生物笔记——暑期学习笔记(三)
生物笔记——暑期学习笔记(三)
文章目录
- 前言
- 一、R篇
- 1. 数据筛选
- 2. 字符串处理
- 3. 练习
- 二、生信篇
- 1. blast 基因家族鉴定
- 2. hmm鉴定
- 3. 理化性质与亚细胞定位
- 4. 基因重复类型分析
- 5. 家族成员染色体位置分析
- 6. 基因组共线性分析
- 7. 多序列比对,构树
- 8. Ka/Ks分析
- 9. GO、KEGG富集分析
- 10. 基因家族Motif 分析
- 总结
前言
这一系列文章主要是对于在暑期,老师每周教导的生信方面的课程的课后学习笔记的总结,希望用此方法来巩固我的所学。
一、R篇
1. 数据筛选
情景:
假设有一个基因表达矩阵x
目标:
- 筛选出在样本A中基因表达值大于10、在样本B中小于8、在样本C中与样本D中表达值相差超过或等于2的基因,并返回基因ID。
- 筛选出所有基因表达量都为0的基因
x <- data.frame(A =c(7:15,0),B = c(2:10,0), C = c(3:11,0),D = c(0:8,0),row.names = paste("gene",seq(1,10),sep = "_"))
> xA B C D
gene_1 7 2 3 0
gene_2 8 3 4 1
gene_3 9 4 5 2
gene_4 10 5 6 3
gene_5 11 6 7 4
gene_6 12 7 8 5
gene_7 13 8 9 6
gene_8 14 9 10 7
gene_9 15 10 11 8
gene_10 0 0 0 0#str(x)tiaojian <- x["A"]>10 & x["B"]<8 & abs((x["C"]-x["D"]))>=2
x1 <- x[tiaojian,]> x1A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#返回满足条件的基因ID
> row.names(x1)
[1] "gene_5" "gene_6"#或者直接用which返回索引,再根据索引返回满足条件的基因
> which(tiaojian)
[1] 5 6
> x[which(tiaojian),]A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#筛选出所有基因表达量都为0的基因
tiaojian <- rowSums(x==0) == ncol(x)
x2 <- x[tiaojian,]
> row.names(x2)
[1] "gene_10"
#或者
tiaojian <- x$A ==0 & x$B == 0 & x$C==0 & x$D ==0
x2 <- x[which(tiaojian),]
rownames(x2)
2. 字符串处理
#paste函数
> paste("x",c(1:3),sep="*")
[1] "x*1" "x*2" "x*3#nchar函数
> nchar("星石传说")
[1] 4
> nchar("sjfakjfa")
[1] 8
> paste(c("星", "石","传","说"), collapse = "")
[1] "星石传说"#字符串替换
x <- "1,3;5,6,7;8,9"
> gsub(";",",",x,fixed = TRUE)
[1] "1,3,5,6,7,8,9"
> sub(";",",",x,fixed = TRUE)
[1] "1,3,5,6,7;8,9"
> chartr("asx","xwb","xingshichuangshuo")
[1] "bingwhichuxngwhuo"#正则表达式
> gsub("[[:space:]]+"," ", "a cat in a box",perl = TRUE)
[1] "a cat in a box"
text <- "hello world"
is_match <- grepl("[A-Z]", text) #匹配text中是否包含大写字母
> is_match
[1] FALSE
3. 练习
情景:
假设有一个包含DNA序列的字符向量dan_seq
目标:
将序列转为大写字母,且进行碱基互补,再将所有序列按字典顺序排列,最后合并为一段长序列。
dan_seq <- c("atgcgta","cgtacg","ttgga","gcat")
dan_seq <- toupper(dan_seq)
> dan_seq
[1] "ATGCGTA" "CGTACG" "TTGGA" "GCAT" chartr("TAGC", "ATCG", dan_seq)
> dan_seq
[1] "TACGCAT" "GCATGC" "AACCT" "CGTA" dan_seq <- sort(dan_seq)
> dan_seq
[1] "AACCT" "CGTA" "GCATGC" "TACGCAT"new_seq<- paste(dan_seq,collapse = "")
> new_seq
[1] "AACCTCGTAGCATGCTACGCAT"
二、生信篇
1. blast 基因家族鉴定
基因家族成员鉴定(一)
2. hmm鉴定
生物笔记——暑期学习笔记(四)
3. 理化性质与亚细胞定位
理化性质与亚细胞定位
亚细胞定位
pyhton爬虫学习一
4. 基因重复类型分析
鉴定不同基因的重复模式
5. 家族成员染色体位置分析
家族成员染色体位置分析
6. 基因组共线性分析
基因组共线性分析
7. 多序列比对,构树
多序列比对,构树
8. Ka/Ks分析
Ka/Ks分析
9. GO、KEGG富集分析
10. 基因家族Motif 分析
基因家族Motif分析
总结
本文的R篇主要讲述了使用which()返回索引来进行数据筛选,以及一些字符串处理函数: paste() 、nchar() 、gsub() 、chartr() 等 。 而生信篇则主要讲述了在基因家族分析中的一些分析。
山一程,水一程,身向榆关那畔行,夜深千帐灯。
–2023-8-28 笔记篇
相关文章:
生物笔记——暑期学习笔记(三)
生物笔记——暑期学习笔记(三) 文章目录 前言一、R篇1. 数据筛选2. 字符串处理3. 练习 二、生信篇1. blast 基因家族鉴定2. hmm鉴定3. 理化性质与亚细胞定位4. 基因重复类型分析5. 家族成员染色体位置分析6. 基因组共线性分析7. 多序列比对,构…...
EPICS自定义设备支持--longin记录的设备支持编写
以下详细描述了一个longin记录设备支持模块编写过程以及用于测试这个模块的IOC的操作步骤: 1)创建一个目录lidriver用于保存这个IOC目录结构: orangepiorangepi4-lts:~/epics$ mkdir lidriver orangepiorangepi4-lts:~/epics$ ls example …...

SpringCloud(十)——ElasticSearch简单了解(二)DSL查询语句及RestClient查询文档
文章目录 1. DSL查询文档1.1 DSL查询分类1.2 全文检索查询1.3 精确查询1.4 地理查询1.5 查询算分1.6 布尔查询1.7 结果排序1.8 分页查询1.9 高亮显示 2. RestClient查询文档2.1 查询全部2.2 其他查询语句2.3 排序和分页2.4 高亮显示 1. DSL查询文档 1.1 DSL查询分类 查询所有…...
Python Flask Web开发一:环境搭建
一、创建环境 创建一个项目文件夹和一个.venv文件夹 $ mkdir myproject $ cd myproject $ python3 -m venv .venv 二、激活环境 在开始项目之前,请激活相应的环境 激活成功的话会在开发工具自带的终端那里看到以(.venv)开头的 $ . .venv…...

DataTable扩展 列转行方法(2*2矩阵转换)
源数据 如图所示 // <summary>/// DataTable扩展 列转行方法(2*2矩阵转换)/// </summary>/// <param name"dtSource">数据源</param>/// <param name"columnFilter">逗号分隔 如SDateTime,PM25,PM10…...
Decomposed Prompting: A MODULAR APPROACH FOR SOLVING COMPLEX TASKS
本文是LLM系列文章,针对《Decomposed Prompting: A MODULAR APPROACH FOR SOLVING COMPLEX TASKS》的翻译。 分解提示:一种求解复杂任务的模块化方法 摘要1 引言2 相关工作3 分解提示4 案例5 结论 摘要 小样本提示是一种使用大型语言模型(L…...

无需测试环境!如何利用测试脚手架隔离微服务,实现功能自动化
想在不建立完整测试环境的情况下测试微服务? 想在将变更推送到主线分支之前完成测试? 这是我们在进行项目交付时经常遇到的难题。最近,当我们开始一个新的项目,为客户构建一个新的聚合平台时,我们希望将尽可能多的测…...
HOperatorSet.Connection 有内存泄漏或缓存
开发环境 Win7 VS2002 halcon12, 直接运行Debug的exe 宽高5000,单格1*1的棋盘占用内存 手动释放region regionConnect private void butTemp_Click(object sender, EventArgs e) { butTemp.Enabled false; HOperatorS…...

力扣2. 两数相加
2. 两数相加 给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一个表示和的链表。 你可以假设除了数字 0 之外,这两个…...

无涯教程-Android Intent Standard Extra Data函数
下表列出了各种重要的Android Intent Standard Extra Data。您可以查看Android官方文档以获取额外数据的完整列表- Sr.NoExtra Data & Description1 EXTRA_ALARM_COUNT 用作AlarmManager intents(意图)中的int Extra字段,以告诉正在调用的应用程序intents(意图)释放了多少…...

STM32 CAN 波特率计算分析
这里写目录标题 前言时钟分析时钟元到BIT 前言 CubeMX中配置CAN波特率的这个界面刚用的时候觉得非常难用,怎么都配置不到想要的波特率。接下来为大家做一下简单的分析。 时钟分析 STM32F4的CAN时钟来自APB1 在如下界面配置,最好配置为1个整一点的数。…...
每日后端面试5题 第十天
一、说出Spring的9种设计模式 1.简单工厂 2.工厂方法(Factory Method) 3.单例(Singleton) 4.适配器(Adapter) 5.包装器(Decorator) 6.代理(Proxy) 7.观…...
荷兰国旗问题之快速分组
朋友们,现在我出一个非常简单的问题,给你一个数组,把它进行处理,变成左边小,中间相等,右边大的一个数组,如何解决呢,这里涉及到一个基本方法叫分组,今天咱们不解决这个问…...
只允许程序单实例运行
有时候,我们只能允许程序单实例运行,以免程序运行出错。可以通过使用App.PrevInstance和系统级的Mutex等多种办法来实现。 代码如下: 用户昵称: 留下些什么 个人简介: 一个会做软件的货代 CSDN网址:https://blog.csdn.net/zezes…...

巨人互动|Facebook海外户Facebook游戏全球发布实用策略
Facebook是全球最大的社交媒体平台之一,拥有庞大的用户基数和广阔的市场。对于游戏开发商而言,利用Facebook进行全球发布是一项重要的策略。下面小编将介绍一些实用的策略帮助开发商在Facebook上进行游戏全球发布。 巨人互动|Facebook海外户&Faceboo…...

【Java架构-版本控制】-Git进阶
本文摘要 Git作为版本控制工具,使用非常广泛,在此咱们由浅入深,分三篇文章(Git基础、Git进阶、Gitlab搭那家)来深入学习Git 文章目录 本文摘要1. Git分支管理2. Git分支本质2.1 分支流转流程(只新增文件)2.2 分支流转流…...

业务需要咨询?开发遇到 bug 想反馈?开发者在线提单功能上线!
大家是否遇到过下列问题—— 在开发的时候,遇到 bug 需要反馈… 有合作意向的时候,想更多了解业务和相关产品… 在接入的时候,需要得到专业技术支持… 别急,荣耀开发者服务平台在线提单功能上线了~ 处理问题分类说明࿱…...

MybatisPlus插件篇—逻辑删除+p6spy
文章目录 一、前言二、插件1、逻辑删除1.1、官方说明:1.2、配置依赖1.3、配置全局配置1.4、实体类字段上添加TableLogic注解1.5、验证是否成功 2、执行SQL分析打印2.1、配置依赖2.2、数据库驱动配置2.3、spy配置文件配置2.4、注意事项 三、总结提升 一、前言 本文将…...
Android studio中EditText设置默认值
如果想对EditText设置默认值,在java代码中使用setText函数是不行的,需要在layout文件中设置“text变量”,如下所示设置默认值为“192.168.1.1”: <EditTextandroid:id"id/car1_ip_edit"android:layout_width"1…...
《Java面向对象程序设计》学习笔记——第 13 章 泛型与集合框架
笔记汇总:《Java面向对象程序设计》学习笔记 # 第 13 章 泛型与集合框架 Java 提供了实现常见数据结构的类,这些实现数据结构的类通称为 Java 集合框架。 在 JDK1.5 后, Java 集合框架开始支持泛型,本章首先介绍泛型&#…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...
五年级数学知识边界总结思考-下册
目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...

linux arm系统烧录
1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...
python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...
MySQL账号权限管理指南:安全创建账户与精细授权技巧
在MySQL数据库管理中,合理创建用户账号并分配精确权限是保障数据安全的核心环节。直接使用root账号进行所有操作不仅危险且难以审计操作行为。今天我们来全面解析MySQL账号创建与权限分配的专业方法。 一、为何需要创建独立账号? 最小权限原则…...

MySQL 知识小结(一)
一、my.cnf配置详解 我们知道安装MySQL有两种方式来安装咱们的MySQL数据库,分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷,但是文件存放起来数据比较冗余,用二进制能够更好管理咱们M…...
08. C#入门系列【类的基本概念】:开启编程世界的奇妙冒险
C#入门系列【类的基本概念】:开启编程世界的奇妙冒险 嘿,各位编程小白探险家!欢迎来到 C# 的奇幻大陆!今天咱们要深入探索这片大陆上至关重要的 “建筑”—— 类!别害怕,跟着我,保准让你轻松搞…...
k8s从入门到放弃之HPA控制器
k8s从入门到放弃之HPA控制器 Kubernetes中的Horizontal Pod Autoscaler (HPA)控制器是一种用于自动扩展部署、副本集或复制控制器中Pod数量的机制。它可以根据观察到的CPU利用率(或其他自定义指标)来调整这些对象的规模,从而帮助应用程序在负…...

【Post-process】【VBA】ETABS VBA FrameObj.GetNameList and write to EXCEL
ETABS API实战:导出框架元素数据到Excel 在结构工程师的日常工作中,经常需要从ETABS模型中提取框架元素信息进行后续分析。手动复制粘贴不仅耗时,还容易出错。今天我们来用简单的VBA代码实现自动化导出。 🎯 我们要实现什么? 一键点击,就能将ETABS中所有框架元素的基…...