点击上方SQL数据库开发,关注获取SQL视频教程

SQL专栏

需求分析

数据库中存在重复记录首码项目,删除保留其中一条(是否重复判断基准为多个字段

解决方案

碰到这样的问题我们先分解步骤来看

创建测试数据

我们创建一个人员信息表并在里面插入一些重复的数据。

CREATE TABLE [dbo].[Person](

[ID] [INT] IDENTITY(1,1) NOT NULL,

[Name] [VARCHAR](20) NULL,

[Age] [INT] NULL,

[Address] [VARCHAR](20) NULL,

[Sex] [CHAR](2) NULL

);

SET IDENTITY_INSERT [dbo].[Person] ON;

INSERT INTO [dbo].[Person] (ID,Name,Age,Address,Sex)

VALUES

( 1, ‘张三’, 18, ‘北京路18号’, ‘男’ ),

( 2, ‘李四’, 19, ‘北京路29号’, ‘男’ ),

( 3, ‘王五’, 19, ‘南京路11号’, ‘女’ ),

( 4, ‘张三’, 18, ‘北京路18号’, ‘男’ ),

( 5, ‘李四’, 19, ‘北京路29号’, ‘男’ ),

( 6, ‘张三’, 18, ‘北京路18号’, ‘男’ ),

( 7, ‘王五’, 19, ‘南京路11号’, ‘女’ ),

( 8, ‘马六’, 18, ‘南京路19号’, ‘女’ );

SET IDENTITY_INSERT [dbo].[Person] OFF;

(提示:可以左右滑动代码)

建立好测试数据如下:

保留重复值的第一个_保留重复值的第一条记录_重复值怎么只保留一个

我们发现除了自增长ID不同以为重复值怎么只保留一个,有几条其他字段都重复的数据出现,符合我们的需求。

找出重复的数据

SELECT MAX(ID) ID ,

Name,Age,Address,Sex

FROM dbo.Person

GROUP BY Name,Age,Address,Sex

HAVING COUNT(1)>1

HAVING将分组后统计出来的数量大于1的数据行,就是我们要找的重复数据:

保留重复值的第一条记录_保留重复值的第一个_重复值怎么只保留一个

上面用Max函数或者Min函数均可重复值怎么只保留一个,只是为了保证取出来的数据的唯一性。

删除重复的数据

其实我们数据库中最后要保留的结果就是第二步中查询出来的数据,我们把其他的数据删除即可。怎么删除呢?我们使用ID来排除。

DELETE FROM Person

WHERE EXISTS

SELECT * FROM (

SELECT

MAX(ID) ID,

Name,Age,Address,Sex

FROM dbo.Person

GROUP BY Name,Age,Address,Sex

HAVING COUNT(1)>1) T

WHERE Person.Name=T.Name

AND Person.Age=T.Age

AND Person.Address=T.Address

AND Person.Sex=T.Sex

AND Person.ID–如果上面使用MIN函数,这里就要改成>

执行完后重新查询Person表结果如下:

重复值怎么只保留一个_保留重复值的第一条记录_保留重复值的第一个

马六因为只有一条记录,所以没有参与去重,直接显示。

今天的案例分享结束,小伙伴们可以自己动手尝试一下,兴许工作中也会遇到类似问题。如果你在公众中遇到一些有趣的问题也可以发送给我。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注