0


MySQL中ON DUPLICATE KEY UPDATE的介绍与使用、批量更新、存在即更新不存在则插入

文章目录

有时候由于业务需求,可能需要先去根据某一字段值查询数据库中是否有记录,有则更新,没有则插入。这个时候就可以用到ON DUPLICATE KEY UPDATE这个sql语句了。

以下内容基于本地windows环境mysql:8.0.34进行讲解。

一、ON DUPLICATE KEY UPDATE的介绍

基本用法

:ON DUPLICATE KEY UPDATE​​是一种MySQL的语法,它在插入新数据时,如果遇到唯一键冲突(即已存在相同的唯一键值),则会执行更新操作,而不是抛出异常或忽略该条数据。这个语法可以大大简化我们的代码,减少不必要的判断和查询操作。

用法总结
1:on duplicate key update 语句根据主键id或唯一键来判断当前插入是否已存在。
2:记录已存在时,只会更新on duplicate key update之后指定的字段。
3:如果同时传递了主键和唯一键,以主键为判断存在依据,唯一键字段内容可以被修改。
4:唯一键大小写敏感时,大小写不同的值被认为是两个值,执行插入。参见下文中的大小写敏感问题

二、ON DUPLICATE KEY UPDATE的使用

准备表结构及测试数据, 注意:name是唯一键

drop table if exists tbl_test;
create table tbl_test(
    id int primary key auto_increment,
    name varchar(30) unique not null,
    age int comment '年龄',
    address varchar(50) comment '住址',
    update_time datetime default null
) comment '测试表';

insert into tbl_test(name,age,address,update_time) values('zhangsan',20,'杭州',now()),('lisi',21,'武汉',now());

测试数据如下:
在这里插入图片描述

2.1、案例一:根据主键id进行更新

on dupdate key update 语句基本功能是:当表中没有原来记录时,就插入,有的话就更新。

如下sql:

insert into tbl_test(id,name,age,address,update_time) values(1,'zhangsan1',201,'杭州1','2024-03-05 15:59:35')
on duplicate key update
age = values(age), -- 注意:values()括号中的内容是字段名称。比如:在java程序中使用时表字段可能叫user_name, 实体类中是userName,values()里面要填user_name
address = values(address),
update_time=now();

在这里插入图片描述

从执行结果可以看出,更新了id为1的age,address两个字段,而name字段没有修改生效。由此我们可以得出两个重要结论:
1:on duplicate key update 语句根据主键id来判断当前插入是否已存在。
2:已存在时,只会更新on duplicate key update之后限定的字段。

2.2、案例二:根据唯一索引进行更新(常用)

根据唯一索引进行更新是生产中比较常用的方式,因为id一般使用的是自增,很少会先把id查询出来,然后根据id进行更新。

如下sql:

insert into tbl_test(name,age,address) values('zhangsan',202,'杭州2')
on duplicate key update
age = values(age), -- 注意:values()括号中的内容是字段名称。比如:在java程序中使用时表字段可能叫user_name, 实体类中是userName,values()里面要填user_name
address = values(address),
update_time=now();

在这里插入图片描述

从执行结果看,这次没有传id,但是age,address字段仍然更新了。
由此可以得出另一个结论:
3:on duplicate key update 语句也可以根据唯一键来判断当前插入的记录是否已存在。

2.3、案例三:没有主键或唯一键字段值相同就插入

如下sql:

insert into tbl_test(name,age,address) values('zhangsan3',203,'杭州3')
on duplicate key update
age = values(age), -- 注意:values()括号中的内容是字段名称。比如:在java程序中使用时表字段可能叫user_name, 实体类中是userName,values()里面要填user_name
address = values(address),
update_time=now();

在这里插入图片描述
这条执行就比较简单了,没有主键或唯一键字段值相同,即判断当前记录不存在,新插入一条。

注意: 这里我们发现主键id并没有连续,直接从2变成了4,具体原理可见《MySQL数据库设置主键自增、自增主键为什么不能保证连续递增》

2.4、案例四:主键与唯一键字段同时存在

如下sql:

insert into tbl_test(id,name,age,address) values(1,'zhangsan4',204,'杭州4')
on duplicate key update
name = values(name),
age = values(age), -- 注意:values()括号中的内容是字段名称。比如:在java程序中使用时表字段可能叫user_name, 实体类中是userName,values()里面要填user_name
address = values(address),
update_time=now();

在这里插入图片描述
从上面可以看出,连唯一键name也被修改了。结论:
4:如果传递了主键,是可以修改唯一键字段内容的。
这里要注意,如果这里的name修改为 lisi,zhangsan3
会报唯一键冲突的。可以自行尝试。

三、ON DUPLICATE KEY UPDATE的注意事项

3.1、on dupdate key update之后values的使用事项

如下sql:

insert into tbl_test(name,age,address,update_time) values('zhangsan4',205,'杭州5','2024-03-05 00:00:00')
on duplicate key update
age = age,
address = '杭州',
update_time=values(update_time);

在这里插入图片描述
on dupdate key update之后没有用values的情况
分为两种情况:
1:如果为如上面的address= “杭州”,则会一直更新为"杭州".
2:如果为如上面的age = age,则age会保持数据库中的值,不会更新。
3:只有当使用了values后,才会更新为上下文中传入的值

3.2、对values使用判断

如下sql

insert into tbl_test(id,name,age,address) values(1,'zhangsan',202,'杭州2')
on duplicate key update
name = ifnull(values(name),name),
age = values(age)

达到的效果是,如果传入的name值为null,则不更新。不为null则更新。这里与mybatis配合使用比较好。

3.3、唯一索引大小写敏感问题

思考这么一个问题:如上面name作为唯一索引,当name大小写敏感时且数据库中存储了name=“zhangsan” ,那么再插入name="ZHANGSAN"是更新还是新增?

1):唯一索引大小写不敏感时
设置name字段为唯一索引且大小写不敏感

drop table if exists tbl_test;
create table tbl_test(
    id int primary key auto_increment,
    name varchar(30) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci unique not null,
    age int comment '年龄',
    address varchar(50) comment '住址',
    update_time datetime default null
) comment '测试表';

insert into tbl_test(name,age,address,update_time) values('zhangsan',20,'杭州',now());
insert into tbl_test(name,age,address,update_time) values('ZHANGSAN',21,'杭州1',now());

在这里插入图片描述
可以看到当字段为大小写不敏感时zhangsan跟ZHANGSAN被认为是同一个值,不能重复插入。

当数据库中name=zhangsan时且name字段大小写不敏感时,我们看一下name="ZHANGSAN"能否更新成功?

insert into tbl_test(name,age,address,update_time) values('ZHANGSAN',22,'杭州2','2024-03-05 00:00:00')
on duplicate key update
age = values(age),
address = values(address),
update_time=values(update_time);

在这里插入图片描述
以上结果可以看出,当大小写不敏感时on duplicate key update是可以更新成功的,即认为是同一个值。

2):唯一索引大小写敏感时
设置name字段为唯一索引且大小写敏感

drop table if exists tbl_test;
create table tbl_test(
    id int primary key auto_increment,
    name varchar(30) CHARACTER SET utf8 COLLATE utf8_bin unique not null,
    age int comment '年龄',
    address varchar(50) comment '住址',
    update_time datetime default null
) comment '测试表';

insert into tbl_test(name,age,address,update_time) values('zhangsan',20,'杭州',now());
insert into tbl_test(name,age,address,update_time) values('ZHANGSAN',21,'杭州1',now());

在这里插入图片描述
可以看到当字段为大小写敏感时zhangsan跟ZHANGSAN被认为是两个值,插入了两条记录。所以此时用on duplicate key update会执行新增操作

四、ON DUPLICATE KEY UPDATE与mybatis联合使用

4.1、写法一:与values()联合使用

注意:values后面的内容是表字段名称即带下划线,而不是实体类驼峰名称
下面的写法支持单条更新与批量更新

如下sql: dept_id为主键或唯一索引

<insert id="replaceInto">
    INSERT INTO sys_dept(
        dept_id,
        parent_id,
        status,
        update_time) 
    VALUES
    <foreach collection="deptList" item="item" separator=",">
        (#{item.deptId},
        #{item.parentId},
        #{item.status},
        #{item.updateTime})
    </foreach>
    ON DUPLICATE KEY UPDATE
        parent_id=VALUES(parent_id),
        status=VALUES(status),
        update_time=VALUES(update_time)
</insert>

4.2、写法二:使用#{}

如下sql: dept_id为主键或唯一索引

注意: #{}方式仅支持单条插入更新,不支持批量插入或更新
<insert id="replaceInto">
    INSERT INTO sys_dept(
        dept_id,
        parent_id,
        status,
        update_time) 
    VALUES
        (#{deptId},
        #{parentId},
        #{status},
        #{updateTime})
    </foreach>
    ON DUPLICATE KEY UPDATE
           parent_id =  #{parentId},
           status = #{status},
           update_time = #{updateTime}
</insert>

五、ON DUPLICATE KEY UPDATE的缺点及坑

5.1、ON DUPLICATE KEY UPDATE每次更新导致id不连续

如下sql:

drop table if exists tbl_test;
create table tbl_test(
    id int primary key auto_increment,
    name varchar(30) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci unique not null,
    age int comment '年龄',
    address varchar(50) comment '住址',
    update_time datetime default null
) comment '测试表';

insert into tbl_test(name,age,address,update_time) values('zhangsan',20,'杭州',now()),('李四',21,'武汉',now());

在这里插入图片描述
执行on duplicate key update进行更新,然后再插入一条新的数据

insert into tbl_test(name,age,address,update_time) values('zhangsan',22,'杭州2','2024-03-05 00:00:00')
on duplicate key update
age = values(age),
address = values(address),
update_time=values(update_time);

insert into tbl_test(name,age,address,update_time) values('王五',23,'深圳',now());

在这里插入图片描述
可以看到id自增值从2直接变成了4,造成了id的不连续。

1.ON DUPLICATE KEY UPDATE每次更新导致id不连续原理:
mysql中有个配置值是innodb_autoinc_lock_mode。
innodb_autoinc_lock_mode中有3中模式,0,1和2,mysql5的默认配置是1,

  • 0是每次分配自增id的时候都会锁表.
  • 1只有在bulk insert的时候才会锁表,简单insert的时候只会使用一个light-weight mutex,比0的并发性能高
  • 2.没有仔细看,好像是很多的不保证…不太安全.

数据库默认是1的情况下,就会发生上面的那种现象,每次使用insert into … on duplicate key update 的时候都会把简单自增id增加,不管是发生了insert还是update

5.2、death lock死锁

经常看到网上说ON DUPLICATE KEY UPDATE会导致死锁,确实是存在这个可能的,不过由于目前没有特别好的方案,所以也只能使用这个sql语法了。

在执行insert ... on duplicate key语句时,如果不对同一个表同时进行并发的insert或者update,基本不会造成死锁。即insert ... on duplicate key时尽量单线程串行进行新增或更新

insert … on duplicate key 在执行时,innodb引擎会先判断插入的行是否产生重复key错误,如果存在,在对该现有的行加上S(共享锁)锁,如果返回该行数据给mysql,然后mysql执行完duplicate后的update操作,然后对该记录加上X(排他锁),最后进行update写入。

如果有两个事务并发的执行同样的语句,那么就会产生death lock,如:
在这里插入图片描述


本文转载自: https://blog.csdn.net/weixin_49114503/article/details/136479860
版权归原作者 五月天的尾巴 所有, 如有侵权,请联系我们删除。

“MySQL中ON DUPLICATE KEY UPDATE的介绍与使用、批量更新、存在即更新不存在则插入”的评论:

还没有评论