C#批量删除Excel重复项的实现方法

 更新时间:2024年04月09日 09:18:03   作者:Eiceblue  
当从不同来源导入Excel数据时,可能存在重复的记录,为了确保数据的准确性,通常需要删除这些重复的行,本文将提供一个使用C# 快速查找并删除Excel重复项的免费解决方案,需要的朋友可以参考下
(福利推荐:【腾讯云】服务器最新限时优惠活动,云服务器1核2G仅99元/年、2核4G仅768元/3年,立即抢购>>>:9i0i.cn/qcloud

(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

前言

当从不同来源导入Excel数据时,可能存在重复的记录。为了确保数据的准确性,通常需要删除这些重复的行。

手动查找并删除可能会非常耗费时间,而通过编程脚本则可以实现在短时间内处理大量数据。本文将提供一个使用C# 快速查找并删除Excel重复项的免费解决方案。

以下是实现步骤:

1. 首先安装免费.NET Excel 库 - Free Spire.XLS for .NET。( 可通过Nuget直接安装或者下载后手动安装)

2. 导入命名空间。

3. 使用LoadFromFile()方法加载Excel文件。

4. 获取指定工作表,并指定需要查找重复记录的单元格区域。

5. 使用LINQ 查询来找出重复行,并将这些行的行号存储在一个列表中。

6. 遍历这个列表并删除所有重复行。

7. 保存文件。

删除Excel重复行(C#代码)

using Spire.Xls;
using System.Linq;
 
namespace RemoveDuplicateRows
{
    class Program
    {
        static void Main(string[] args)
        {
            //加载Excel文件
            Workbook workbook = new Workbook();
            workbook.LoadFromFile("示例.xlsx");
 
            //获取第一张工作表
            Worksheet sheet = workbook.Worksheets[0];
 
            //指定需要删除重复记录的单元格区域
            var range = sheet.Range["A1:A" + sheet.LastRow];
 
            //获取重复项的行号
            var duplicatedRows = range.Rows
                   .GroupBy(x => x.Columns[0].DisplayedText)
                   .Where(x => x.Count() > 1)
                   .SelectMany(x => x.Skip(1))
                   .Select(x => x.Columns[0].Row)
                   .ToList();
 
            //删除重复行     
            for (int i = 0; i < duplicatedRows.Count; i++)
            {
                sheet.DeleteRow(duplicatedRows[i] - i);
            }
 
            //保存Excel文件
            workbook.SaveToFile("删除重复行.xlsx");
        }
    }
}

以上代码快速查找了指定单元格范围内的重复项并实现一次性批量删除。效果如图:

Free Spire.XLS for .NET提供了一种操作Excel文档的高效方法,而无需依赖Microsoft Excel。

到此这篇关于C#批量删除Excel重复项的实现方法的文章就介绍到这了,更多相关C#删除Excel重复项内容请搜索程序员之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持程序员之家!

相关文章

最新评论

?


http://www.vxiaotou.com