当前位置：首页 > news >正文

python之函数返回数据框

news 2026/2/11 4:05:15

1.原始文件

##gff-version 3
Chr1A   IWGSC_v2.1      gene    40098   70338   33      -       .       ID=TraesCS1A03G0000200;previous_id=TraesCS1A02G000100;primconf=HC;Name=TraesCS1A03G0000200;cds=CDS_OK;mapping=fullMatchWithMissmatches
Chr1A   IWGSC_v2.1      mRNA    40098   70338   .       -       .       ID=TraesCS1A03G0000200.1;Parent=TraesCS1A03G0000200;Note=TraesCS1A01G000100;primconf=HC;Name=TraesCS1A03G0000200.1;secconf=HC2;cds=CDS_OK;mapping=fullMatchWithMissmatches;previous_id=TraesCS1A02G000100.1
Chr1A   IWGSC_v2.1      three_prime_UTR 40098   40731   .       -       .       ID=TraesCS1A03G0000200.1.utr3p1;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      exon    40098   40731   .       -       .       ID=TraesCS1A03G0000200.1.exon1;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      three_prime_UTR 58474   58507   .       -       .       ID=TraesCS1A03G0000200.1.utr3p2;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      exon    58474   58897   .       -       .       ID=TraesCS1A03G0000200.1.exon2;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      CDS     58508   58768   .       -       0       ID=TraesCS1A03G0000200.1.CDS1;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      five_prime_UTR  58769   58897   .       -       .       ID=TraesCS1A03G0000200.1.utr5p1;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      exon    70089   70338   .       -       .       ID=TraesCS1A03G0000200.1.exon3;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      five_prime_UTR  70089   70338   .       -       .       ID=TraesCS1A03G0000200.1.utr5p2;Parent=TraesCS1A03G0000200.1
Chr1A   IWGSC_v2.1      gene    70239   89245   35      +       .       ID=TraesCS1A03G0000400;previous_id=TraesCS1A02G000200;primconf=HC;Name=TraesCS1A03G0000400;cds=CDS_OK;mapping=fullPerfectMatch
Chr1A   IWGSC_v2.1      mRNA    70239   89245   .       +       .       ID=TraesCS1A03G0000400.1;Parent=TraesCS1A03G0000400;Note=TraesCS1A01G000200;primconf=HC;Name=TraesCS1A03G0000400.1;secconf=HC2;cds=CDS_OK;mapping=fullPerfectMatch;previous_id=TraesCS1A02G000200.1

2.目的文件：

TraesCS1A02G002100      bad
TraesCS1A02G002200      bad
TraesCS1A02G002900      bad
TraesCS1A02G003200      bad
TraesCS1A02G003300      bad
TraesCS1A02G003700      good
TraesCS1A02G003900      bad
TraesCS1A02G004100      bad
TraesCS1A02G004300      bad
TraesCS1A02G004700      bad
TraesCS1A02G004800      bad
TraesCS1A02G004900      good
TraesCS1A02G005700      good

3.代码：

# lin_whether_1st_intron_longest.py
#! /usr/bin/env python
#统计第一个内含子是否是最长的，如果是输出good,否则输出bad
#usage: python lin_whether_1st_intron_longest.py Ta_genomeplus.gff5-1 > Ta_genomeplus.gff5-120824
#usage: python lin_whether_1st_intron_longest.py Ta_genomeminus.gff5-1 > Ta_genomeminus.gff5-120824
import pandas as pddef outputlist1(f1):list1 = []list2 = []list21 = []df1=pd.read_table(f1,index_col=0)df1["id1"]=df1.indexdf1["id1_start_end"]=df1["id1"]+","+df1["start"].astype(str)+","+df1["end"].astype(str)df2=df1.iloc[:,[3]]df3 = df2.groupby("id").apply(lambda x: x["id1_start_end"].tolist())for i in range(len(df3)):list1.append(",".join(df3[i]))# print(list1)for i in list1:i=i.strip().split(",")# " ".join(i)if len(i)>=9:for j in range(2,len(i)-1,3):list2.append(i[0])list2.append(str(int(i[j+2])-int(i[j])-1))else:continue# print(list2)# b=open("47out2.txt","w")# def output_length(list02):# b.write("id" + "\t" + "length"+"\n")for i in range(len(list2)):# list2[i]=list2[i].strip().split()# print(list2[i])if i % 2 == 0:#         # b.write(str(list2[i])+"\t"+str(list2[i+1])+"\t"+str(list2[i+2])+"\n")#         # print(str(list2[i+1])+"\t"+str(list2[i+2])+"\t"+str(list2[i]))#         b.write(str(list2[i])+"\t"+str(list2[i+1])+"\n")list21.append(list2[i:i+2])return list21def outputlist2(f2):list31 = []list32 = []list4 = []list41=[]df21 = pd.DataFrame(f2)# df21=pd.read_table(df21)df21.columns = ['id', 'length']df21=df21.set_index("id")# df21=f2df21["id1"]=df21.indexdf21["length1"]=df21["length"].astype(str)df21["id1_length"]=df21["id1"]+","+df21["length"].astype(str)df22=df21.iloc[:,[2]]df23 = df22.groupby("id").apply(lambda x: x["length1"].tolist())for i in range(len(df23)):list31.append(",".join(df23[i]))#新的数据框2df32=df21.iloc[:,[3]]df33 = df32.groupby("id").apply(lambda x: x["id1_length"].tolist())# print(df23)for i in range(len(df33)):list32.append(",".join(df33[i]))# list3=[int(i) for i in list3]# print(list32)# print(list3[1])# print(max(list3[1]))for i in range(len(list31)):list32[i] = list32[i].strip().split(",")list31[i]=list31[i].strip().split(",")list31[i]=[int(k) for k in list31[i]]# print(max(list3[i]))# for j in range(len(list3[i])):if list31[i][0]==max((list31[i])):list4.append(list32[i][0])list4.append("good")else:list4.append(list32[i][0])list4.append("bad")for i in range(len(list4)):if i % 2==0:print(str(list4[i])+"\t"+str(list4[i+1]))def outputlist3(f2):list31 = []list32 = []list4 = []list41=[]df21 = pd.DataFrame(f2)# df21=pd.read_table(df21)df21.columns = ['id', 'length']df21=df21.set_index("id")# df21=f2df21["id1"]=df21.indexdf21["length1"]=df21["length"].astype(str)df21["id1_length"]=df21["id1"]+","+df21["length"].astype(str)df22=df21.iloc[:,[2]]df23 = df22.groupby("id").apply(lambda x: x["length1"].tolist())for i in range(len(df23)):list31.append(",".join(df23[i]))#新的数据框2df32=df21.iloc[:,[3]]df33 = df32.groupby("id").apply(lambda x: x["id1_length"].tolist())# print(df23)for i in range(len(df33)):list32.append(",".join(df33[i]))# list3=[int(i) for i in list3]# print(list32)# print(list3[1])# print(max(list3[1]))for i in range(len(list31)):list32[i] = list32[i].strip().split(",")list31[i]=list31[i].strip().split(",")list31[i]=[int(k) for k in list31[i]]# print(max(list3[i]))# for j in range(len(list3[i])):if list31[i][0]==max((list31[i])):list4.append(list32[i][0])list4.append("good")else:list4.append(list32[i][0])list4.append("bad")for i in range(len(list4)):if i % 2==0:print(str(list4[i])+"\t"+str(list4[i+1]))
import argparse
import os
parser = argparse.ArgumentParser(description="Advanced screening always by hash")
parser.add_argument("-f1","--file1",help="the original file,tabulated,make sure do not contain blank line")
args = parser.parse_args()
with open (args.file1,"r") as f1:if "plus" in args.file1:df01=outputlist1(args.file1)outputlist2(df01)else:df01=outputlist1(args.file1)outputlist3(df01)

python之函数返回数据框

1.原始文件 ##gff-version 3 Chr1A IWGSC_v2.1 gene 40098 70338 33 - . IDTraesCS1A03G0000200;previous_idTraesCS1A02G000100;primconfHC;NameTraesCS1A03G0000200;cdsCDS_OK;mappingfullMatchWithMissmatches Chr1A IWGSC_v2.1 mRN…...

编程日记 2023/8/27 19:10:58

电子商务安全体系架构技术方面

技术方面是本文所要阐述的主要方面，因为它能够依靠企业自身的努力来达到令人满意的安全保障效果。目前，关于电子商务安全体系的研究比较多，有基于层次的体系，也有基于对象的体系，还有基于风险管理的体系&#xff0…...

编程日记 2023/8/27 19:09:57

新安装IDEA 常用插件、设置

新安装IDEA 常用插件、设置 mybatiscodeHelperProRestfulToolkit-fixJrebelmybatis log freepojo to jsonGrep ConsoleMaven HelperCamelCaseCamelCase常用设置 mybatiscodeHelperPro mapper.xml 编码校验 sql 生成，代码生成 RestfulToolkit-fix URI 跳转到对应的…...

编程日记 2023/8/27 19:08:55

ChromeOS 的 Linux 操作系统和 Chrome 浏览器分离

导读科技媒体 Ars Technica 报道称，谷歌正在将 ChromeOS 的浏览器从操作系统中分离出来 —— 让它变得更像 Linux。虽然目前还没有任何官方消息，但这项变化可能会在本月的版本更新中推出。据介绍，谷歌将该项目命名为 "Lacros"——…...

编程日记 2023/8/27 19:07:54

哔哩哔哩 B站 bilibili 视频倍速设置视频倍速可自定义

目录一、复制如下代码二、在B站视频播放页面进入控制台三、将复制的代码粘贴到下方输入框，并回车Enter 即可四、然后就可以了一、复制如下代码 （该代码用于设置倍速为3，最后的数值是多少就是多少倍速，可以带小数点&#…...

编程日记 2023/8/27 19:06:53

Lazada商品详情接口获取Lazada商品详情数据 Lazada商品价格接

一、引言随着电子商务的迅速发展和普及，电商平台之间的竞争也日趋激烈。为了提供更好的用户体验和更高效的后端管理，Lazada作为东南亚最大的电商平台之一，开发了一种商品详情接口（Product Detail API）。该接口允许第…...

编程日记 2023/8/27 19:05:52

路由攻击(ospf attack)及C/C++代码实现

开放式最短路径优先（OSPF）是应用最广泛的域内路由协议之一。不幸的是，它有许多严重的安全问题。OSPF上的伪造是可能导致路由循环和黑洞的最关键的漏洞之一。大多数已知的OSPF攻击基于伪造攻击者控制的路由器的链路状态通告（LSA&…...

编程日记 2023/8/27 19:04:51

nginx配置站点强制开启https

当站点域名配置完SSL证书后，如果要强制开启HTTPS，可以在站点配置文件中加上： #HTTP_TO_HTTPS_START if ($server_port !~ 443){rewrite ^(/.*)$ https://$host$1 permanent; } #HTTP_TO_HTTPS_END 附上完整的配置完SSL证书，强制…...

编程日记 2023/8/27 19:03:49

Jacoco XML 解析

1 XML解析器对比 1. DOM解析器： ○ 优点：易于使用，提供完整的文档树，可以方便地修改和遍历XML文档。 ○ 缺点：对大型文档消耗内存较多，加载整个文档可能会变慢。 ○ 适用场景：适合小型XML文档…...

编程日记 2023/8/27 19:02:48

【面试题】JDK（工具包）、JRE（运行环境和基础库）、JVM（java虚拟机）之间的关系？

【面试题】JDK、JRE、JVM之间的关系？ JDK(Java Development Kit):Java开发工具包，提供给Java程序员使用，包含了JRE，同时还包含了编译器javac与自带的调试工具Jconsole、jstack等。 JRE(Java Runtime Environment):Java运行时环境&…...

编程日记 2023/8/27 19:01:47

软件设计师学习笔记7-输入输出技术+总线+可靠性+性能指标

目录 1.输入输出技术 1.1数据传输控制方式 1.2中断处理过程 2.总线 3.可靠性 3.1可靠性指标 3.2串联系统与并联系统 3.3混合模型 4.性能指标 1.输入输出技术即CPU控制主存与外设交互的过程 1.1数据传输控制方式 (1)程序控制（查询）方式&…...

编程日记 2023/8/27 19:00:46

Windows下MATLAB调用Python函数操作说明

MATLAB与Python版本的兼容具体可参看MATLAB与Python版本的兼容操作说明操作说明请参看下面两个链接： 操作指南简单说明： 我安装的是MATLAB2022a和Python3.8.6（安装时请勾选所有可以勾选的，包括路径）。对应版本安…...

编程日记 2023/8/27 18:59:44

【android12-linux-5.1】【ST芯片】驱动与HAL移植后数据方向异常

ST的传感器驱动与HAL一直成功后，能拿到数据了，但是设备是横屏，系统默认是竖屏。就会出现屏幕自动转动时方向是错的的情况，设备横立展示的是竖屏，设备竖立展示的是横屏。这个是PCB上设计的传感器贴片方向和横屏不一致…...

编程日记 2023/8/27 18:58:43

JavaScript Es6_3笔记

JavaScript 进阶文章目录 JavaScript 进阶编程思想面向过程面向对象构造函数原型对象constructor 属性对象原型原型继承原型链了解构造函数原型对象的语法特征，掌握 JavaScript 中面向对象编程的实现方式，基于面向对象编程思想实现 DOM 操作的封装。 …...

编程日记 2023/8/27 18:57:41

Qt产生随机数

Qt产生随机数提问：注意：实现： 提问： 有没有小伙伴遇到这么一种情况，使用rand()和qrand()函数生成的随机数好像不是那么随机，每次都一样。那这种就叫做“伪随机”，因为没有种随机数种子&#x…...

编程日记 2023/8/27 18:56:41

postgresql常用函数-数学函数

postgresql常用函数简介数学函数算术运算符绝对值取整函数乘方与开方指数与对数整数商和余数弧度与角度常量 π符号函数生成随机数简介函数（function）是一些预定义好的代码模块，可以将输入进行计算和处理，最终输出一个结果值…...

编程日记 2023/8/27 18:55:36

【排序】快速排序（前后指针法）—— 考的最少的一种算法

以从小到大的顺序进行说明。前后指针法是指对于一个数组，定义前后各一个指针（prev 和 cur） prev用于卡一个比基准值大的值进行交换cur用于向前遍历出比基准值小的，和prev进行交换图解初始化选出基准值4 如果cur 所在的值…...

编程日记 2023/8/27 18:54:35

软考：中级软件设计师:关系代数：中级软件设计师:关系代数，规范化理论函数依赖，它的价值和用途，键，范式，模式分解

软考：中级软件设计师:关系代数提示：系列被面试官问的问题，我自己当时不会，所以下来自己复盘一下，认真学习和总结，以应对未来更多的可能性关于互联网大厂的笔试面试，都是需要细心准备的 &…...

编程日记 2023/8/27 18:53:34

openCV实战-系列教程2：阈值与平滑处理（图像阈值/图像平滑处理/高斯/中值滤波）、源码解读

1、图像阈值 t图像阈值函数，就是需要判断一下像素值大于一个数应该怎么处理，小于一个数应该怎么处理 ret, dst cv2.threshold(src, thresh, maxval, type) 参数解析： src： 原始输入图，只能输入单通道图像&#…...

编程日记 2023/8/27 18:52:32

C语言第五章-循环结构练习

1、设计一个小型模拟彩票中奖机，已知彩票中奖号码是一个固定的3位数（原始号码）。对任意一个3位数，取出它的每位数字和原始号码的每位数字比较，有1位数相同中三等奖，有2位数相同中二等奖，有3位数…...

编程日记 2023/8/27 18:51:30

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook，用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途，下面我将全面详细地介绍它的特性和用法。基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

编程新知 2025/6/11 15:21:26

Linux相关概念和易错知识点（42）（TCP的连接管理、可靠性、面临复杂网络的处理）

目录 1.TCP的连接管理机制（1）三次握手①握手过程②对握手过程的理解 （2）四次挥手（3）握手和挥手的触发（4）状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

编程新知 2026/1/30 0:09:51

页面渲染流程与性能优化

页面渲染流程与性能优化详解（完整版） 一、现代浏览器渲染流程（详细说明） 1. 构建DOM树浏览器接收到HTML文档后，会逐步解析并构建DOM（Document Object Model）树。具体过程如下： (…...

编程新知 2026/1/31 11:58:35

Spring Boot面试题精选汇总

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

编程新知 2025/9/24 23:08:17

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测；从基础到高级，涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等

🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术，可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势，还能有效评价重大生态工程…...

编程新知 2025/9/12 15:10:44

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/9/13 16:17:01

基于Java Swing的电子通讯录设计与实现：附系统托盘功能代码详解

JAVASQL电子通讯录带系统托盘一、系统概述本电子通讯录系统采用Java Swing开发桌面应用，结合SQLite数据库实现联系人管理功能，并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能，同时可以最小化到系统…...

编程新知 2025/10/4 20:58:43

【学习笔记】erase 删除顺序迭代器后迭代器失效的解决方案

目录使用 erase 返回值继续迭代使用索引进行遍历我们知道类似 vector 的顺序迭代器被删除后，迭代器会失效，因为顺序迭代器在内存中是连续存储的，元素删除后，后续元素会前移。但一些场景中，我们又需要在执行删除操作…...

编程新知 2025/9/30 8:10:20

《Docker》架构

文章目录架构模式单机架构应用数据分离架构应用服务器集群架构读写分离/主从分离架构冷热分离架构垂直分库架构微服务架构容器编排架构什么是容器，docker，镜像，k8s 架构模式单机架构单机架构其实就是应用服务器和单机服务器都部署在同一…...

编程新知 2026/2/4 16:31:26

CSS3相关知识点

CSS3相关知识点 CSS3私有前缀私有前缀私有前缀存在的意义常见浏览器的私有前缀 CSS3基本语法CSS3 新增长度单位CSS3 新增颜色设置方式CSS3 新增选择器CSS3 新增盒模型相关属性box-sizing 怪异盒模型resize调整盒子大小box-shadow 盒子阴影opacity 不透明度 CSS3 新增背景属性ba…...

编程新知 2026/2/5 1:50:16

相关文章：