当前位置: 首页 > article >正文

使用C# 快速删除Excel表格中的重复行数据-详解

目录

简介 

使用工具

C# 删除Excel工作表中的重复行

C# 删除指定Excel单元格区域中的重复行

C# 基于特定列删除重复行

RemoveDuplicates 方法快速比较


简介 

重复行是指在Excel表格中完全相同的多行数据。这些冗余行的存在可能源于多种原因,例如:

  • 数据输入错误:用户在手动输入数据时,可能不小心多次输入相同的信息。
  • 数据导入:从其他系统或文件导入数据时,可能会出现重复记录,尤其是在合并多个数据源时。
  • 复制粘贴:在处理数据时,复制粘贴操作可能导致无意中创建重复行。

删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论。通过清理重复数据,可以提高数据的准确性和整洁性,从而使后续的分析工作更加高效。这篇文章将探讨如何使用C# 实现快速删除Excel表格中的重复行,主要涵盖内容如下:

  • C# 删除Excel工作表中的重复行
  • C# 删除指定Excel单元格区域中的重复行
  • C# 基于特定列删除重复行

使用工具

要使用 C# 从 Excel 表格中删除重复数据,需要使用合适的Excel文档处理库。本文所使用的库是 Spire.XLS for .NET,它支持在.NET应用程序中创建和操作Excel 文件,无需安装Microsoft Excel。

安装Spire.XLS for .NET

在开始之前,在Package Manager Console中运行以下命令从NuGet 安装 Spire.XLS 库:

Install-Package Spire.XLS

C# 删除Excel工作表中的重复行

重复行可能会导致工作表结构混乱,影响数据的完整性。Spire.XLS 提供了一种简单的方法来检测和删除工作表中的重复行。

语法

sheet.RemoveDuplicates();

工作原理

该方法会检查工作表中的每一行,并比较每行内的所有单元格。只有当所有单元格的值与另一行完全一致时,该行才会被视为重复。第一次出现的行将被保留,而后续的重复行将被删除。

实现代码

using Spire.Xls;namespace RemoveDuplicatesFromWorksheet
{internal class Program{static void Main(string[] args){// 打开 Excel 文件Workbook workbook = new Workbook();workbook.LoadFromFile("测试.xlsx");// 获取所需的工作表(索引从0开始)Worksheet sheet = workbook.Worksheets[0];// 从工作表中删除重复行sheet.RemoveDuplicates();// 保存修改后的文件workbook.SaveToFile("删除工作表内重复行.xlsx", ExcelVersion.Version2016);workbook.Dispose();}}
}

C#删除Excel工作表重复行数据

C# 删除指定Excel单元格区域中的重复行

有时,你可能只想清除工作表特定单元格区域中的重复行数据,而不影响其他部分。Spire.XLS 支持指定要删除重复项的单元格范围。

语法

sheet.RemoveDuplicates(int startRow, int startColumn, int endRow, int endColumn);

参数

startRow, startColumn, endRow, endColumn: 定义要检查重复项的单元格区域(行列索引从1开始)。

工作原理

该方法会比较指定单元格区域内的所有行,如果有两行或多行的每一列的值都完全相同,那么这些行就被认为是重复的,只保留第一次出现的那一行。区域外的行不会受到影响,仍然保持原样。

实现代码

using Spire.Xls;namespace RemoveDuplicateRowsFromCellRange
{internal class Program{static void Main(string[] args){// 打开 Excel 文件Workbook workbook = new Workbook();workbook.LoadFromFile("测试.xlsx");// 获取所需的工作表(索引从0开始)Worksheet sheet = workbook.Worksheets[0];// 从特定单元格区域中删除重复行sheet.RemoveDuplicates(2, 1, 9, 4);// 保存修改后的文件workbook.SaveToFile("删除单元格区域内重复行.xlsx", ExcelVersion.Version2016);workbook.Dispose();}}
}

C# 基于特定列删除重复行

在处理某些特定数据集时,您可能只希望根据特定的关键列来删除重复项,而忽略其他列的值。

Spire.XLS 提供了另一种 RemoveDuplicates() 方法重载,以支持这种需求。使用此方法,你可以:

  • 指定要操作的单元格区域
  • 指明该区域是否包含标题行
  • 选择用于比较重复的列

语法

sheet.RemoveDuplicates(int startRow, int startColumn, int endRow, int endColumn, bool hasHeaders, int[] columnOffsets);

参数

  • startRow, startColumn, endRow, endColumn: 定义要检查重复数据的单元格区域(行列索引从1开始)。
  • hasHeaders: 判定第一行是否为标题行。如果为 true,则第一行将不参与比较。
  • columnOffsets: 相对于 startColumn 的偏移数组,指定用于比较的列,例如0表示指定区域中的第一列。

工作原理

该方法在删除重复行时,仅考虑用户指定的某些列。如果多行在这些指定列中的值完全相同,则只保留第一行,其他重复的行将被删除。这种做法尤其适用于需要根据特定标识(如客户 ID 或电子邮件)来确保数据唯一性的场景。

实现代码

using Spire.Xls;namespace RemoveDuplicateRows
{internal class Program{static void Main(string[] args){// 打开 Excel 文件Workbook workbook = new Workbook();workbook.LoadFromFile("测试.xlsx");// 获取所需的工作表(索引从0开始)Worksheet sheet = workbook.Worksheets[0];// 定义要检查重复行的区域int startRow = 2;int startColumn = 1;int endRow = 9;int endColumn = 4;// 判定区域内的第一行是否是标题行bool hasHeaders = false;// 指定用于比较重复的列int[] columnsToCompare = { 1, 2 };// 在定义的区域内基于指定列删除重复行sheet.RemoveDuplicates(startRow, startColumn, endRow, endColumn, hasHeaders, columnsToCompare);// 保存修改后的文件workbook.SaveToFile("基于特定列删除重复行.xlsx", ExcelVersion.Version2016);workbook.Dispose();            }}
}

RemoveDuplicates 方法快速比较

以下是RemoveDuplicates 几种方法的快速比较,你可以根据自己的需求选择最合适的方法:

方法

适用范围

RemoveDuplicates()

整个工作表

RemoveDuplicates(int startRow, int startColumn, int endRow, int endColumn)

指定单元格区域

RemoveDuplicates(int startRow, int startColumn, int endRow, int endColumn, bool hasHeaders, int[] columnOffsets)

基于特定列

以上就是使用C#实现快速删除Excel工作表中重复行数据的全部内容。感谢阅读!

相关文章:

使用C# 快速删除Excel表格中的重复行数据-详解

目录 简介 使用工具 C# 删除Excel工作表中的重复行 C# 删除指定Excel单元格区域中的重复行 C# 基于特定列删除重复行 RemoveDuplicates 方法快速比较 简介 重复行是指在Excel表格中完全相同的多行数据。这些冗余行的存在可能源于多种原因,例如: …...

WPF-Prism学习笔记之 “导航功能和依赖注入“

新建空白模板(Prism) 新建好后会有自动创建ViewModels和Views 在"MainWindow.xaml"文件里面标题去绑定了一个属性"Title",而"MainWindowViewModel.cs"里面继承一个非常重要的"BindbleBase"(prism框架里面非常重要的)。所以…...

中国城市间地理距离矩阵(2024)

1825 中国城市间地理距离矩阵(2024) 数据简介 中国城市间地理距离矩阵数据集,通过审图号GS(2024)0650的中国城市地图在Albers投影坐标系中进行计算得出矩阵表格,单位为KM,方便大家研究使用。 中国城市地理距离矩阵数据通过计算城市中心距离…...

【孙悟空喝水】2022-2-7

缘由C编程问题求解:9634: 孙悟空喝水-编程语言-CSDN问答 void 孙悟空喝水() {//缘由https://ask.csdn.net/questions/7639865?spm1005.2025.3001.5141int x 2&#xff0c; n 0; double s 0, ss 0;std::cin >> n;while ((int)s < n)s 1.0 / x, ss (x - 1.0) / …...

`sysctl`命令深度剖析:如何优化内核参数以提升服务器网络/IO性能?

更多服务器知识&#xff0c;尽在hostol.com 嘿&#xff0c;各位Linux服务器的“老司机”和“赛车手”们&#xff01;咱们把服务器比作一辆高性能跑车&#xff0c;日常跑起来是很快&#xff0c;但你有没有想过&#xff0c;这辆“跑车”出厂时的默认设置&#xff0c;可能只是为了…...

AxumStatusCode细化Rust Web标准格式响应

1. Axum 中的 StatusCode 概述 axum::http::StatusCode 提供了 HTTP 状态码的枚举&#xff0c;涵盖了从 100 到 599 的所有标准状态码。 通过使用这些状态码&#xff0c;您可以精确地控制 HTTP 响应的语义&#xff0c;例如成功、客户端错误、服务器错误等。 1.1 常用状态码 …...

【备战秋招】C++音视频开发经典面试题整理

1、简要介绍一下对 H.264 的了解&#xff1f; 1&#xff09;基础描述 H.264 是由国际标准组织机构&#xff08;ISO&#xff09;下属的运动图象专家组&#xff08;MPEG&#xff09;和国际电传视讯联盟远程通信标准化组织&#xff08;ITU-T&#xff09;开发的系列编码标准之一。…...

【音频处理】java流式调用ffmpeg命令

今天发现一个ffmpeg的用法&#xff0c;用子进程直接从标准输入写入输入&#xff0c;就可以从标准流式输出获取转码结果。 这样的好处是不用去写ffmpeg的代码&#xff0c;只需要写对ffmpeg的命令、在输入输出的地方加缓存就能进行流式转码了&#xff0c;方便快捷。 但是也有坏处…...

《java创世手记》---java基础篇(下)

《Java 创世手记 - 基础篇&#xff08;下&#xff09;》 第五章&#xff1a;契约与规范 —— 接口 (Interfaces) 与抽象类 (Abstract Classes) 造物主&#xff0c;在你日益繁荣的世界里&#xff0c;你发现仅仅依靠“继承”来构建“物种体系”有时会遇到一些限制。比如&#x…...

【MySQL】C语言连接

要使用C语言连接mysql&#xff0c;需要使用mysql官网提供的库&#xff0c;大家可以去官网下载 我们使用C接口库来进行连接 要正确使用&#xff0c;我们需要做一些准备工作: 保证mysql服务有效在官网上下载合适自己平台的mysql connect库&#xff0c;以备后用 下载开发库 s…...

How API Gateways handle raw TCP packets

How these gateways actually perform their roles at the HTTP packet level? Let’s break it down into something more concrete with examples of how these gateways perform their “unique entrance” function by requiring clients to follow specific protocols, …...

芯片配置文件自动化生成

代码的主要功能是将设置了芯片寄存器的Excel表格&#xff08;.xls或.xlsx&#xff09;中的特定工作表的数据转换成SVD格式。 步骤 Excel文件读取 使用xlrd库打开Excel文件处理.xls格式的特殊情况&#xff08;formatting_infoTrue&#xff09;获取"global"工作表数…...

新能源汽车与油车销量

中国油车与新能源车销量对比&#xff08;2022-2025年&#xff09; ‌1. 市场份额演化&#xff08;2022-2025年&#xff09;‌ ‌年份‌ ‌新能源车销量 &#xff08;渗透率&#xff09;‌ ‌燃油车销量 &#xff08;渗透率&#xff09;‌ ‌关键事件‌ ‌2022‌ 688.7万辆…...

LVS-DR 负载均衡集群

目录 一、简介 1.1 LVS-DR工作原理核心特性 1.2 数据包流向深度解析 二、实验环境准备与规划 三、LVS调度器配置实战 3.1 绑定虚拟IP地址&#xff08;VIP&#xff09; 3.2 调整内核参数禁用重定向 3.3 配置负载均衡策略 四、真实服务器节点配置 4.1 绑定VIP到lo接口 …...

基于Java,SpringBoot,Vue,UniAPP宠物洗护医疗喂养预约服务商城小程序管理系统设计

摘要 随着宠物经济的快速发展&#xff0c;宠物主对宠物服务的便捷性、专业性需求日益增长。本研究设计并实现了一套宠物洗护医疗喂养预约服务小程序系统&#xff0c;采用 Java 与 SpringBoot 构建后端服务&#xff0c;结合 Vue 开发管理后台&#xff0c;通过 UniAPP 实现多端适…...

中车靶场,网络安全暑期实训营

不善攻防&#xff0c;何谈就业&#xff1f; 实训目的&#xff1a;提升实战能力&#xff0c;直通就业快道。 实训对象&#xff1a;面向计算机相关专业、有兴趣接触网络攻防、大专及以上学历的学员。 知识准备 为确保高效实训&#xff0c;学员需具备一定的实战基础。报名后&am…...

2.2.2 06年T1

成功的同化机器——美国&#xff1a;2006年考研英语&#xff08;一&#xff09;Text 1精析 本文解析2006年考研英语&#xff08;一&#xff09;第一篇文章&#xff0c;揭示美国社会强大的文化同化力及其表现。 一、原文与翻译 Paragraph 1&#xff1a;美国社会的同化本质 L1: …...

split_conversion将json转成yolo训练用的txt,在直接按照8:1:1的比例分成训练集,测试集,验证集

第一章 使用说明 类别自己在代码中改&#xff0c;其他四个参数 --json-folder:json文件夹路径 --txt-folder&#xff1a;转换成功后txt的存放路径 --images-dir&#xff1a;图片文件夹路径 --save-dir&#xff1a;转换完成分割后所有文件的路径 终端命令行&#xff1a;p…...

响应式系统与Spring Boot响应式应用开发

响应式系统概述 过去十年间,为应对移动和云计算的需求,软件行业通过改进开发流程来构建更稳定、健壮且灵活的软件系统。这种演进不仅服务于传统用户端(桌面/Web),还需支持多样化设备(手机、传感器等)。为应对这些挑战,多个组织共同制定了《响应式宣言》(2014年发布)…...

【第1章 基础知识】1.8 在 Canvas 中使用 HTML 元素

文章目录 前言示例-橡皮筋式选取框示例代码 前言 尽管我们可以说 Canvas 是 HTML5 之中最棒的功能&#xff0c;不过在实现网络应用程序时&#xff0c;很少会单独使用它。在绝大多数情况下&#xff0c;你都会将一个或更多的 canvas 元素与其他 HTML 控件结合起来使用&#xff0…...

c++流之sstream/堆or优先队列的应用[1]

目录 c流之sstream 解释 注意事项 215.数据流的第k大 问题分析 修正代码 主要修改点 优先队列的比较规则 代码中的比较逻辑 为什么这样能维护第 k 大元素&#xff1f; 举个例子 总结 Python 实现&#xff08;使用heapq库&#xff09; Java 实现&#xff08;使用P…...

SAR ADC 比较器噪声分析(二)

SAR ADC的比较器是非常重要的模块&#xff0c;需要仔细设计。主要考虑比较器的以下指标&#xff1a; 1)失调电压 2)输入共模范围 3)比较器精度 4)传输延时 5)噪声 6)功耗 这里主要讲一下动态比较器的noise。 动态比较器一般用于高速SAR ADC中&#xff0c;且精度不会超过12bit…...

c#与java的相同点和不同点

C# 和 Java 是两大主流的、面向对象的、托管型编程语言&#xff0c;它们共享许多相似的设计理念和语法&#xff0c;但也在细节、生态系统和运行平台上存在显著差异。以下是它们的相同点和不同点的详细对比&#xff1a; 一、相同点 (核心相似之处) 语法高度相似&#xff1a; 都源…...

phpmyadmin

安装PHPMyAdmin PHPMyAdmin通常可通过包管理器安装或手动部署。对于Linux系统&#xff08;如Ubuntu&#xff09;&#xff0c;使用以下命令安装&#xff1a; sudo apt update sudo apt install phpmyadmin安装过程中会提示选择Web服务器&#xff08;如Apache或Nginx&#xff0…...

机器学习Day5-模型诊断

实现机器学习算法的技巧。当我们训练模型或使用模型时&#xff0c;发现预测误差很 大&#xff0c;可以考虑进行以下优化&#xff1a; &#xff08;1&#xff09;获取更多的训练样本 &#xff08;2&#xff09;使用更少的特征 &#xff08;3&#xff09;获取其他特征 &#xff…...

如何将 WSL 的 Ubuntu-24.04 迁移到其他电脑

在使用 Windows Subsystem for Linux (WSL) 时&#xff0c;我们可能会遇到需要将现有的 WSL 环境迁移到其他电脑的情况。无论是为了备份、更换设备&#xff0c;还是在不同电脑之间共享开发环境&#xff0c;掌握迁移 WSL 子系统的方法都是非常有用的。本文将以 Ubuntu-24.04 为例…...

金融欺诈有哪些检测手段

金融欺诈检测是一个多层次的动态防御过程&#xff0c;需要结合技术手段、数据分析、人工智能和人工审核。以下是当前主流的检测手段和技术分类。 ### **一、核心技术手段** 1. **规则引擎&#xff08;Rule-Based Systems&#xff09;** - **原理**&#xff1a;预设基于历史…...

HTML5 全面知识点总结

一、HTML 基础概念 HTML&#xff1a;超文本标记语言&#xff0c;用于创建网页和 Web 应用的结构。 超文本&#xff1a;可以包含文字、图片、音频、视频、链接等多种媒体。 标记语言&#xff1a;通过标签标记网页的各个部分。 二、HTML5 的新特性&#xff08;区别于 HTML4&am…...

vscode一直连接不上虚拟机或者虚拟机容器怎么办?

1. 检查并修复文件权限 右键点击 C:\Users\20325\.ssh\config 文件&#xff0c;选择 属性 → 安全 选项卡。 确保只有你的用户账户有完全控制权限&#xff0c;移除其他用户&#xff08;如 Hena\Administrator&#xff09;的权限。 如果 .ssh 文件夹权限也有问题&#xff0c;同…...

初学c语言21(文件操作)

一.为什么使用文件 之前我们写的程序的数据都是存储到内存里面的&#xff0c;当程序结束时&#xff0c;内存回收&#xff0c;数据丢失&#xff0c; 再次运行程序时&#xff0c;就看不到上次程序的数据&#xff0c;如果要程序的数据一直保存得使用文件 二.文件 文件一般可以…...