Excel通过VBA脚本去除重复数据行并保存
一、方法1:使用字典动态去重并保存
适用场景:需要灵活控制去重逻辑(如保留最后一次出现的重复项)时
Sub 动态去重保存到新表()Dim srcSheet As Worksheet, destSheet As WorksheetDim dict As Object, lastRow As Long, i As LongDim key As Variant ' ? 声明为VariantSet dict = CreateObject("Scripting.Dictionary")Set srcSheet = ThisWorkbook.Sheets("Sheet1") ' 替换为源表名称Set destSheet = ThisWorkbook.Sheets.Add(After:=Sheets(Sheets.Count))' 读取数据并去重(假设数据从第2行开始)lastRow = srcSheet.Cells(Rows.Count, 1).End(xlUp).RowFor i = 2 To lastRowDim combinedKey As StringcombinedKey = srcSheet.Cells(i, 1).Value & "|" & srcSheet.Cells(i, 2).Valuedict(combinedKey) = i ' 记录最后一次出现的行号Next i' 将去重后的数据写入新表destSheet.Range("A1:B1").Value = Array("产品", "二进制编码") ' 标题行Dim rowIndex As Long: rowIndex = 2For Each key In dict.Keys ' ? key已声明为VariantDim originalRow As Long: originalRow = dict(key)destSheet.Cells(rowIndex, 1).Value = srcSheet.Cells(originalRow, 1).ValuedestSheet.Cells(rowIndex, 2).Value = srcSheet.Cells(originalRow, 2).ValuerowIndex = rowIndex + 1Next keyMsgBox "数据已保存到新表:" & destSheet.Name
End Sub
可能的错误点:提示for each控件变量必须为变体或对象
- 遍历字典Keys时,循环变量声明为String而非Variant。
- 遍历工作表或区域时,循环变量声明不正确。
- 在处理对象集合时未使用正确的对象类型声明变量。
关键点总结
-
变量声明匹配集合类型
- 遍历对象集合(如工作表、单元格)时,用
Object或具体对象类型(如Worksheet)。 - 遍历字典键、数组等非对象集合时,用
Variant。
- 遍历对象集合(如工作表、单元格)时,用
-
避免隐式类型声明 永远不要省略变量类型声明(如直接写
Dim key),这会导致VBA默认使用Variant,但显式声明更安全。 -
字典的特殊性
Scripting.Dictionary的Keys和Items返回的是Variant数组,必须用Variant类型接收。
二、方法二:复制筛选数据到新表后去重
适用场景:先筛选数据再复制到新工作表,最后在新表中去重。
Sub 筛选去重保存到新表()Dim srcSheet As Worksheet, destSheet As WorksheetSet srcSheet = ThisWorkbook.Sheets("原始数据") ' 替换为源表名称Set destSheet = ThisWorkbook.Sheets.Add(After:=Sheets(Sheets.Count)) ' 创建新工作表' 应用筛选(假设筛选第3列值为"完成")srcSheet.Range("A1:D100").AutoFilter Field:=3, Criteria1:="完成"' 复制可见单元格到新表srcSheet.AutoFilter.Range.CopydestSheet.Range("A1").PasteSpecial xlPasteValues' 在新表中去重(假设按第1列和第2列组合去重)destSheet.Range("A1:D" & destSheet.Cells(Rows.Count, 1).End(xlUp).Row).RemoveDuplicates Columns:=Array(1, 2), Header:=xlYes' 清除筛选状态srcSheet.AutoFilterMode = FalseApplication.CutCopyMode = FalseMsgBox "数据已保存到新表:" & destSheet.Name
End Sub
如果不需要筛选?
Sub 筛选去重保存到新表()Dim srcSheet As Worksheet, destSheet As WorksheetDim srcDataRange As Range, lastRow As Long' 设置源表和目标表Set srcSheet = ThisWorkbook.Sheets("Sheet1") ' 替换为你的源表名称Set destSheet = ThisWorkbook.Sheets.Add(After:=Sheets(Sheets.Count)) ' 创建新表' 动态获取源表数据范围(假设数据从A1开始,列数为4列:A-D)lastRow = srcSheet.Cells(srcSheet.Rows.Count, 1).End(xlUp).RowSet srcDataRange = srcSheet.Range("A1:D" & lastRow) ' A-D列' 直接复制全部数据到新表(无需筛选)srcDataRange.CopydestSheet.Range("A1").PasteSpecial xlPasteValues' 在新表中按第1、2列去重Dim destLastRow As LongdestLastRow = destSheet.Cells(destSheet.Rows.Count, 1).End(xlUp).RowIf destLastRow > 1 ThendestSheet.Range("A1:D" & destLastRow).RemoveDuplicates Columns:=Array(1, 2), Header:=xlYesElseMsgBox "警告:未复制到有效数据!"End If' 清理剪贴板并提示完成Application.CutCopyMode = FalseMsgBox "数据已保存到新表:" & destSheet.Name
End Sub
参数逐条解析
-
Range("A1:D100")- 表示要筛选的数据区域(从A1到D100的矩形范围)。
-
AutoFilter方法- Excel VBA 中用于启用自动筛选的方法,类似于手动点击Excel菜单的 “数据” → “筛选”。
-
Field:=3- 指定筛选的列号。
- 这里的
Field参数代表第几列(从数据区域的左起第1列开始计数)。 - 例如,
A1:D100区域的第1列是A列,第3列是C列。
-
Criteria1:="完成"- 设置筛选条件为“等于‘完成’”。
Criteria1是筛选条件的关键字,支持通配符(如"*完成*"表示包含“完成”的文本)。
相关文章:
Excel通过VBA脚本去除重复数据行并保存
一、方法1:使用字典动态去重并保存 适用场景:需要灵活控制去重逻辑(如保留最后一次出现的重复项)时 Sub 动态去重保存到新表()Dim srcSheet As Worksheet, destSheet As WorksheetDim dict As Object, lastRow As Long, i As LongDim key A…...
大模型Prompt提示词越狱相关知识
大模型Prompt提示词越狱相关知识 一、什么是Prompt提示词越狱? 什么是Prompt提示词 Prompt是指你向AI输入的内容,它直接指示AI该做什么任务或生成什么样的输出,简而言之, Prompt就是你与AI之间的“对话内容”,可…...
3DMAX笔记-UV知识点和烘焙步骤
1. 在展UV时,如何点击模型,就能选中所有这个模型的uv 2. 分多张UV时,不同的UV的可以设置为不同的颜色,然后可以通过颜色进行筛选。 3. 烘焙步骤 摆放完UV后,要另存为一份文件,留作备份 将模型部件全部分成…...
【新人系列】Golang 入门(十三):结构体 - 下
✍ 个人博客:https://blog.csdn.net/Newin2020?typeblog 📝 专栏地址:https://blog.csdn.net/newin2020/category_12898955.html 📣 专栏定位:为 0 基础刚入门 Golang 的小伙伴提供详细的讲解,也欢迎大佬们…...
Spring Boot 自定义商标(Logo)的完整示例及配置说明( banner.txt 文件和配置文件属性信息)
Spring Boot 自定义商标(Logo)的完整示例及配置说明 1. Spring Boot 商标(Banner)功能概述 Spring Boot 在启动时会显示一个 ASCII 艺术的商标 LOGO(默认为 Spring 的标志)。开发者可通过以下方式自定义&a…...
Ubuntu虚拟机Linux系统入门
目录 一、安装 Ubuntu Linux 20.04系统 1.1 安装前准备工作 1.1.1 镜像下载 1.1.2 创建新的虚拟机 二、编译内核源码 2.1 下载源码 2.2 指定编译工具 2.3 将根文件系统放到源码根目录 2.4 配置生成.config 2.5 编译 三、安装aarch64交叉编译工具 四、安装QEMU 五、…...
【蓝桥杯】2025省赛PythonB组复盘
前言 昨天蓝桥杯python省赛B组比完,今天在洛谷上估了下分,省一没有意外的话应该是稳了。这篇博文是对省赛试题的复盘,所给代码是省赛提交的代码。PB省赛洛谷题单 试题 A: 攻击次数 思路 这题目前有歧义,一个回合到底是只有一个…...
深入解析区块链技术:原理、应用与未来展望
1 区块链技术原理 1.1 基本概念 区块链本质上是一个分布式账本,它由一系列按照时间顺序排列的数据块组成,每个数据块包含了一定时间内的交易信息。这些数据块通过密码学技术相互链接,形成一个不可篡改的链条。其核心特点包括去中心化、不可篡…...
Linux进程替换与自定义shell详解
引言 进程替换和shell编程是Linux系统中极其重要的概念,它们不仅是系统内部工作的基础机制,也是系统管理员和开发者必备的技能。本文将深入探讨Linux中的进程替换原理、系统调用实现以及如何创建自定义shell,帮助你全面理解这些重要概念并掌…...
【数据结构_4下篇】链表
一、链表的概念 链表,不要求在连续的内存空间,链表是一个离散的结构。 链表的元素和元素之间,内存是不连续的,而且这些元素的空间之间也没有什么规律: 1.顺序上没有规律 2.内存空间上也没有规律 *如何知道链表中包…...
Mybatis的简单介绍
文章目录 MyBatis 简介 1. MyBatis 核心特点2. MyBatis 核心组件3. MyBatis 基本使用示例(1) 依赖引入(Maven)(2) 定义 Mapper 接口(3) 定义实体类(4) 在 Service 层调用 4. MyBatis 与 JPA/Hibernate 对比 MyBatis 简介 MyBatis 是一款优秀的 持久层框…...
JavaScript 性能优化实战:深入探讨 JavaScript 性能瓶颈,分享优化技巧与最佳实践
在当今 Web 应用日益复杂的时代,JavaScript 性能对于用户体验起着决定性作用。缓慢的脚本执行会导致页面加载延迟、交互卡顿,严重影响用户留存率。本文将深入剖析 JavaScript 性能瓶颈,并分享一系列实用的优化技巧与最佳实践,助你…...
1g内存电脑sqlite能支持多少并发
1. SQLite的并发机制 写操作:默认使用串行锁,同一时间仅允许一个写操作(其他写/读需等待)。读操作:支持多并发读取,但受内存、磁盘I/O和配置限制。 2. 关键限制因素 (1)内存资源 …...
jetpack之jetpack的概括和其中组件的简单使用
注意⚠:此篇文章由deepseek大力支持!!!(╹ڡ╹ ) 主要是对不知道学什么,对各个组件一头雾水的jetpack新手准备的文章 不知道jetpack学什么,就看这篇文章!! 1. DataBindingÿ…...
音视频 五 看书的笔记 MediaCodec
MediaCodec 用于访问底层媒体编解码器框架,编解码组件。通常与MediaExtractor(解封装,例如Mp4文件分解成 video和audio)、MediaSync、MediaMuxer(封装 例如音视频合成Mp4文件)、MediaCrypto、Image(cameraX 回调的ImageReader对象可以获取到Image帧图像,可转换成YU…...
物联网|无人自助台球厅源码|哪些框架支持多设备连接?
在无人自助台球厅的智能化管理中,物联网(IoT)技术是核心支撑。如何实现不同设备(如智能门锁、环境传感器、支付终端、灯光控制系统等)的高效连接与协同工作,是系统开发的关键挑战。本文将带大家探讨支持多设…...
Python中NumPy的统计运算
在数据分析和科学计算领域,Python凭借其丰富的库生态系统成为首选工具之一,而NumPy作为Python数值计算的核心库,凭借其高效的数组操作和强大的统计运算功能,广泛应用于机器学习、信号处理、统计分析等场景。本文将系统介绍NumPy在…...
uniapp实现H5页面麦克风权限获取与录音功能
1.权限配置 在uni-app开发H5页面时,需要在manifest.json文件中添加录音权限的配置。具体如下: {"h5": {"permissions": {"scope.record": {"desc": "请授权使用录音功能"}}} }这段配置代码是用于向…...
两个树莓派如何通过wifi direct传输视频并显示
这里写自定义目录标题 在两台设备上安装必要软件Wi-Fi Direct接收端IP(自动发现或静态设置)设置摄像头参数显示初始化网络设置 系统架构概述 发送端树莓派:捕获视频(摄像头或视频文件)→ 编码 → 通过Wi-Fi Direct传输…...
ubuntu 系统安装Mysql
安装 mysql sudo apt update sudo apt install mysql-server 启动服务 sudo systemctl start mysql 设置为开机自启 sudo systemctl enable mysql 查看服务状态 (看到类似“active (running)”的状态信息代表成功) sudo systemctl status mysql …...
selenium快速入门
一、操作浏览器 from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By# 设置选项 q1 Options() q1.add_argument("--no-sandbo…...
Redis:线程模型
单线程模型 Redis 自诞生以来,一直以高性能著称。很多人好奇,Redis 为什么早期采用单线程模型,它真的比多线程还快吗? 其实,Redis 的“快”并不在于并发线程,而在于其整体架构设计极致简单高效,…...
Transformer模型解析与实例:搭建一个自己的预测语言模型
目录 1. 前言 2. Transformer 的核心结构 2.1 编码器(Encoder) 2.2 解码器(Decoder) 2.3 位置编码(Positional Encoding) 3. 使用 PyTorch 构建 Transformer 3.1 导入所需的模块: 3.2 定…...
Java常用安全编码的规范整理及工具
对Java安全编码的主要规范及要求的一些整理: 一、输入验证与数据校验 外部输入校验 对所有外部输入(如用户输入、文件、网络数据)进行合法性校验,采用白名单机制限制输入内容范围 。校验前对输入数据做归一化处理ÿ…...
重返JAVA之路——面向对象
目录 面向对象 1.什么是面向对象? 2.面向对象的特点有哪些? 3.什么是对象? 4.什么是类? 5.什么是构造方法? 6.构造方法的特性有哪些? 封装 1.什么是封装? 2.封装有哪些特点? 数据隐…...
Java设计模式全解析(共 23 种)
一、设计模式全解: Java 中的设计模式是为了解决在软件开发中常见问题的一些“最佳实践”总结。设计模式分为三大类,共 23 种经典模式: 1. 创建型模式(5 种) 用于对象的创建,解决对象实例化过程中的问题。…...
Python10天突击--Day 2: 实现观察者模式
以下是 Python 实现观察者模式的完整方案,包含同步/异步支持、类型注解、线程安全等特性: 1. 经典观察者模式实现 from abc import ABC, abstractmethod from typing import List, Anyclass Observer(ABC):"""观察者抽象基类""…...
springboot框架集成websocket依赖实现物联网设备、前端网页实时通信!
需求: 最近在对接一个物联网里设备,他的通信方式是 websocket 。所以我需要在 springboot框架中集成websocket 依赖,从而实现与设备实时通信! 框架:springboot2.7 java版本:java8 好了,还是直接…...
【玩泰山派】5、点灯,驱动led-(2)ubuntu18.04 升级python3.6到python3.7,安装pip3
文章目录 前言升级python3.71、安装 software-properties-common 包2、添加 deadsnakes PPA 源3、安装 Python 3.71. 安装 Python 3.72. 安装 Python 3.7 的开发包和虚拟环境支持(可选但推荐)3. 设置 Python 3.7 为默认版本4. 验证 Python 版本注意事项 …...
ES6学习03-字符串扩展(unicode、for...of、字符串模板)和新方法()
一、字符串扩展 1. eg: 2.for...of eg: 3. eg: 二。字符串新增方法 1. 2. 3. 4. 5....
