当前位置: 首页 > news >正文

查找Excel包含关键字的行(の几种简单快速方法)

需求:数据在后缀为xlsx的Excel的sheet1中且量比较大,比如几十万行几百列;想查找一个关键字所在的行,比如"全网首发"

情况①知道关键字在哪一列

情况②不确定在哪一列,很多列相似又不同,本文演示遍历所有数据,但做点优化避免浪费时间性能;

关键字可能是一串数字,日志的部分内容,加密的某一段等

Excel实现和python实现;

数据大概这样子,这纯粹是我瞎编的简单演示数据,假设关键字为中文,商品全称、简称、特点列会造成查找重复:

1.知道关键字在哪一列

比如关键字在 商品简称 这一列!

1.1excel实现

①直接用筛选,包含,推荐!

超级表ctrl+T,小数据可以这样,数据多不推荐,就是将表本身的数据变成了插入的表格,超级表的筛选功能貌似更强,但数据一多,超级表会很卡;

③用Excel本身的函数:不推荐,麻烦不好用,比如关键字是  猛火

函数嵌套大致这样:

先在sheet2中,弄一个辅助列(本文是演示,其实可以将辅助列的结果包在函数中),用函数判断,这对锁行、列号和excel的公式功底有一定的要求;

find("查找关键字","哪个单元格")-->找到返回起始位置,没有返回错误;

辅助列中,找商品简称列,有没有包含猛火;可以看到辅助列,3和4就是sheet1中商品简称那一列有;

再叠加if,如果辅助列不是错误,就用index返回sheet1中对应数据,都需要往右边推一列,因为辅助列占了一个位置,或者其他函数,大概就是先这样,再那样,就行啦。

然后定位,错误,删掉,但我们的数据是很大的,而且excel的函数但凡写多点就令人窒息。

④power query、VBA、数据透视表,一般用这些稍微复杂点的方法,那肯定是经常做这些方面的工作,基本懂的都会用,本文主讲临时需求,简单高效干完就擦屁股完事。

1.2python实现

读写文件用pandas库为例

例如,我们知道这个关键字,必然在“商品简称”之中:

import pandas as pd
path = "d:/test.xlsx"
df = pd.read_excel(path)row_list= [] # 存符合条件的行号
for index_num in df.index:data = df.loc[index_num,"商品简称"]if data.find("家用")!=-1:print(data)row_list.append(index_num)
print(row_list)     

 find方法,找到了返回关键字在str中起始位置,找不到返回-1;

别用str.contains方法,因为你会遇到很讨厌的错误!同时避免了正则,运行效率upupup。

2.假如列很多,根本就不知道关键字在哪一列

此时excel就很蛋疼了,感觉应该可以,但是并不想去弄。

python实现:

此时基本上是遍历数据硬来了,可以自写方法,iloc或者loc,根据数据类型从行、列df.index,df.columns遍历都行;

不过推荐使用一个函数iterrows(),返回df的行索引和df每一个行数据,注意是行数据series类型;

row_list= []
for row_index,row_data in df.iterrows():try:for col in df.columns:cell_data = df.loc[row_index,col]#         if str(row_data[col]).find("猛火")!=-1:if str(cell_data).find("猛火")!=-1:row_list.append(row_index)raise ValueError("已找到条件")except:passprint(row_list)

①为什么要用try,except?

因为我们要的数据是整个行,只要其中某一列符合条件,整行都要。但凡哪一列找到了关键字,结果存到list中,直接报个错,避免了往后面的列遍历的无用功,比set去重好;

②注意要str(cell_data),因为时间列这种东西,总会出点小问题;

相关文章:

查找Excel包含关键字的行(の几种简单快速方法)

需求:数据在后缀为xlsx的Excel的sheet1中且量比较大,比如几十万行几百列;想查找一个关键字所在的行,比如"全网首发"; 情况①知道关键字在哪一列 情况②不确定在哪一列,很多列相似又不同,本文演…...

性能测试分析和调优

步骤 性能调优的步骤 性能调优的步骤: 1.确定问题:根据性能测试的结果来分析确定bug。–测试人员职责 2.分析原因:分析问题产生的原因。----开发人员职责 3.给出解决方案:可以是修改软件配置、增加硬件资源配置、修改代码等----…...

(视频教程)Compass代谢分析详细流程及python版-R语言版下游分析和可视化

不想做太多的前情解说了,有点累了,做了很久的内容,包括整个分析,从软件安装和报错解决到后期下游python版-R语言版下游分析和可视化!单细胞代谢分析我们写过很多了,唯独少了最“高级”的compass&#xff0c…...

【SQL】MySQL中的字符串处理函数:concat 函数拼接字符串,COALESCE函数处理NULL字符串

MySQL中的字符串处理函数:concat 函数 一、concat ()函数 1.1、基本语法1.2、示例1.3、特殊用途 二、COALESCE()函数 2.1、基本语法2.2、示例2.3、用途 三、进阶练习 3.1 条件和 SQL 语句3.2、解释 一、concat &…...

c++中深拷贝和浅拷贝的联系和区别

在 C 编程里,深拷贝和浅拷贝是两种不同的对象复制方式,它们在实现方式、资源管理和适用场景等方面存在显著差异。下面为你详细介绍它们的区别。 1. 基本概念 浅拷贝:浅拷贝仅仅复制对象的成员变量值。对于基本数据类型(如 int、d…...

Autotestplat 在多个平台和公司推荐使用!

1、 51Testing软件测试网 开源好用!推荐一款更轻量化的自动化测试平台! 2、程序员杨叔 从繁琐到简单!Autotestplat自动化测试平台搭建使用 3、一飞开源 [开源]一站式自动化测试平台及解决方案,支持接口、性能、UI测试 4、github h…...

字符串最后一个单词的长度

一&#xff1a;题目 二&#xff1a;思路 用rfind()函数倒着找第一个空格&#xff0c;返回的值为pos&#xff0c;然后打印size()-(pos1)&#xff0c;posnpos就代表只有一个单词&#xff0c;则直接返回size #include <iostream> using namespace std; int main() {strin…...

【Linux】learning notes(3)make、copy、move、remove

文章目录 1、mkdir &#xff08;make directory&#xff09;2、rmdir &#xff08;remove directory&#xff09;3、rm&#xff08;remove&#xff09;4、>5、touch 新建文件6、mv&#xff08;move&#xff09;7、cp&#xff08;copy&#xff09; 1、mkdir &#xff08;make…...

一、图像图像的基本概念

文章目录 一、分辨率概念二、图形图像的区别三、位图和矢量图的区别 一、分辨率概念 图形显示计数中的分辨率概念有三种&#xff0c;即屏幕分辨率、显示分辨率和显卡分辨率。它们既有区别又有着密切的联系&#xff0c;对图形显示的处理有极大的影响。 1.屏幕分辨率 显示器分辨…...

两道算法练习

力扣322零钱兑换 给你一个整数数组 coins &#xff0c;表示不同面额的硬币&#xff1b;以及一个整数 amount &#xff0c;表示总金额。 计算并返回可以凑成总金额所需的 最少的硬币个数 。如果没有任何一种硬币组合能组成总金额&#xff0c;返回 -1 。 你可以认为每种硬币的…...

利用 Python 爬虫进行跨境电商数据采集

1 引言2 代理IP的优势3 获取代理IP账号4 爬取实战案例---&#xff08;某电商网站爬取&#xff09;4.1 网站分析4.2 编写代码4.3 优化代码 5 总结 1 引言 在数字化时代&#xff0c;数据作为核心资源蕴含重要价值&#xff0c;网络爬虫成为企业洞察市场趋势、学术研究探索未知领域…...

设计模式--spring中用到的设计模式

一、单例模式&#xff08;Singleton Pattern&#xff09; 定义&#xff1a;确保一个类只有一个实例&#xff0c;并提供全局访问点 Spring中的应用&#xff1a;Spring默认将Bean配置为单例模式 案例&#xff1a; Component public class MySingletonBean {// Spring 默认将其…...

Qt控件中函数指针使用的最终版本,使用std::function

代码&#xff1a; class MyWidget : public QWidget { public:std::function<void(QResizeEvent* event)> pf_resizeEvent 0; protected:inline void resizeEvent(QResizeEvent* event) override {if (pf_resizeEvent ! 0)pf_resizeEvent(event);} };int main(int arg…...

Java中的泛型类 --为集合的学习做准备

学习目标 ● 掌握在集合中正确使用泛型 ● 了解泛型类、泛型接口、泛型方法 ● 了解泛型上下限 ● 了解基本的使用场景 1.有关泛型 1.1泛型的概念 泛型&#xff08;Generics&#xff09;是Java中引入的参数化类型机制&#xff0c;允许在定义类、接口或方法时使用类型参数&a…...

6.6.6 嵌入式SQL

文章目录 2个核心问题识别SQL语句主语言和SQL通信完整导图 2个核心问题 SQL语句嵌入高级语言需要解决的2个核心问题是&#xff1a;如何识别嵌入语句&#xff1f;如何让主语言&#xff08;比如C,C语言&#xff09;和SQL通信&#xff1f; 识别SQL语句 为了识别主语言中嵌入的SQL…...

基于C#的CANoe CLR Adapter开发指南

一、引言 CANoe 是一款广泛应用于汽车电子开发和测试的工具&#xff0c;它支持多种编程接口&#xff0c;方便开发者进行自定义扩展。CANoe CLR Adapter 允许我们使用 C# 语言与 CANoe 进行交互&#xff0c;充分利用 C# 的强大功能和丰富的类库。本文将详细介绍如何基于 C# 进行…...

【Qt】MVC设计模式

目录 一、搭建MVC框架 二、创建数据库连接单例类SingleDB 三、数据库业务操作类model设计 四、control层&#xff0c;关于model管理类设计 五、view层即为窗口UI类 一、搭建MVC框架 里面的bin、lib、database文件夹以及sqlite3.h与工程后缀为.pro文件的配置与上次发的文章…...

【手撕算法】支持向量机(SVM)从入门到实战:数学推导与核技巧揭秘

摘要 支持向量机&#xff08;SVM&#xff09;是机器学习中的经典算法&#xff01;本文将深入解析最大间隔分类原理&#xff0c;手撕对偶问题推导过程&#xff0c;并实战实现非线性分类与图像识别。文中附《统计学习公式手册》及SVM调参指南&#xff0c;助力你掌握这一核心算法…...

JAVA面试常见题_基础部分_Dubbo面试题(上)

Dubbo 支持哪些协议&#xff0c;每种协议的应用场景&#xff0c;优缺点&#xff1f; • dubbo&#xff1a; 单一长连接和 NIO 异步通讯&#xff0c;适合大并发小数据量的服务调用&#xff0c;以及消费者远大于提供者。传输协议 TCP&#xff0c;异步&#xff0c;Hessian 序列化…...

CSS—隐藏元素:1分钟掌握与使用隐藏元素的方法

个人博客&#xff1a;haichenyi.com。感谢关注 1. 目录 1–目录2–display:none3–visibility: hidden4–opacity: 05–position: absolute;与 left: -9999px;6–z-index 和 position7–clip-path: circle(0%) 2. display:none 标签会挂载在html中&#xff0c;但是不会在页面上…...

5步解决魔兽争霸3兼容性难题:从卡顿到流畅的完美蜕变

5步解决魔兽争霸3兼容性难题&#xff1a;从卡顿到流畅的完美蜕变 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 如何判断你的魔兽争霸3需要优化&…...

OpenSpeedy游戏变速工具全攻略:突破帧率限制的开源解决方案

OpenSpeedy游戏变速工具全攻略&#xff1a;突破帧率限制的开源解决方案 【免费下载链接】OpenSpeedy &#x1f3ae; An open-source game speed modifier. 项目地址: https://gitcode.com/gh_mirrors/op/OpenSpeedy 在游戏世界中&#xff0c;你是否曾因帧率不稳定、加载…...

嵌入式FOC实战:从STM32到FPGA的电机控制精髓

1. 为什么需要FOC电机控制技术 第一次接触电机控制时&#xff0c;我被各种专业术语搞得晕头转向。直到亲手用STM32驱动一台伺服电机&#xff0c;才真正理解FOC&#xff08;磁场定向控制&#xff09;的价值。想象一下骑自行车&#xff1a;普通方波控制就像不断猛踩刹车和油门&a…...

腾讯混元HY-MT1.5-1.8B翻译模型:开箱即用的本地化部署方案

腾讯混元HY-MT1.5-1.8B翻译模型&#xff1a;开箱即用的本地化部署方案 1. 引言&#xff1a;为什么选择本地化翻译模型 在当今全球化的商业环境中&#xff0c;跨语言沟通已成为日常工作的重要组成部分。传统云端翻译服务虽然方便&#xff0c;但在数据安全、网络依赖和响应速度…...

Stable Yogi Leather-Dress-Collection 真实商业案例:独立设计师品牌系列生成

Stable Yogi Leather-Dress-Collection 真实商业案例&#xff1a;独立设计师品牌系列生成 最近和一个做独立设计师品牌的朋友聊天&#xff0c;他跟我大倒苦水&#xff0c;说新季度系列的设计灵感枯竭&#xff0c;从构思到出草图&#xff0c;磨了快一个月&#xff0c;进度还不到…...

页面置换算法-存储器管理

页面置换算法详解(存储器管理) 在操作系统存储器管理中,页面置换算法是虚拟存储系统的核心机制。当内存已满,需要调入新页面时,系统必须选择内存中的哪个页面被换出。页面置换算法的优劣直接影响到系统的缺页率和有效访问时间。系统分析师需要掌握经典置换算法的原理、优…...

信号处理必看!CTFT/DTFT/DFT的三角关系图解与常见误区

信号处理必看&#xff01;CTFT/DTFT/DFT的三角关系图解与常见误区 引言&#xff1a;为什么我们需要理解这三种变换的关系&#xff1f; 在数字信号处理的世界里&#xff0c;傅里叶变换家族就像是一把瑞士军刀&#xff0c;而CTFT&#xff08;连续时间傅里叶变换&#xff09;、DTF…...

GLM-4.7-Flash效果展示:自动生成极客日报风格技术文章

GLM-4.7-Flash效果展示&#xff1a;自动生成极客日报风格技术文章 1. 引言&#xff1a;当AI遇见技术写作 技术写作从来都不是件容易的事。你需要深入理解技术细节&#xff0c;又要能用通俗易懂的语言表达出来&#xff0c;还得保持文章的趣味性和可读性。这就像要求一个厨师既…...

Ostrakon-VL终端基础教程:Streamlit Session State管理多轮扫描会话

Ostrakon-VL终端基础教程&#xff1a;Streamlit Session State管理多轮扫描会话 1. 像素特工终端简介 Ostrakon-VL扫描终端是一款专为零售与餐饮场景设计的交互式图像识别工具。它基于Ostrakon-VL-8B多模态大模型构建&#xff0c;采用独特的8-bit像素艺术风格界面&#xff0c…...

OpenClaw隐私保护方案:Qwen3-14b_int4_awq本地化数据处理优势

OpenClaw隐私保护方案&#xff1a;Qwen3-14b_int4_awq本地化数据处理优势 1. 为什么我们需要关注AI自动化中的隐私问题 去年我帮朋友的公司评估一个自动化方案时&#xff0c;遇到一个典型场景&#xff1a;他们需要处理大量客户合同&#xff0c;但担心使用云端AI服务会导致敏感…...