首先,我们通过下面的sql语句建立一张表,并插入5行数据:
create table t(
id int(11) not null,
c int(11) default null,
d int(11) default null,
primary key (id),
key c(c)
)engine=innodb;
insert into t values(0,0,0),(5,5,5),(10,10,10),(15,15.15),(20,20,20),(25,25,25);
接着,我们执行下面这条语句:
begin
select * from t where d=5 for update;
commit;
for update 会为d=5的行加上一个锁,这个锁会在commit语句执行时被释放。
由于字段d上没有索引,所以会进行全表扫描。但是,在进行全表扫描的时候,不满足d=5的行会不会被加锁呢?
因为innodb的默认事务隔离级别是可重复读,所以下面的讨论都基于可重复读隔离级别。
我们先来假设,仅仅只在d=5的行行加锁,而其他行不加锁的话,会怎么样?
假设有这样下面这样一个场景:
session a的三次查询我们分别定义为q1,q2,q3。因为都使用了for update,所以是当前读,且会对d=5的行进行加锁。我们来分析下三次查询的结果:
- q1只会返回id=5的行。
- 由于在t2时刻,session b将id=0的d值修改成了5,因此q2查询出来id=0和id=5这两行。
- 由于在t4时刻,session c插入一行(1,1,5),因此q3查询出来id=0,id=1和id=5三行。
其中,q3查询到id=1这种现象,我们称之为“幻读”。幻读是指一个事务在前后两次查询同一个范围的时候,后一次查询看到了前一次查询没有看到的行。
有几个需要注意的点:
- 在可重复读隔离级别下,普通的查询时快照读,是不会看到其他事务插入的数据的。因此,幻读只会在“当前读”才会出现。
- 在q2中,session b修改了结果被session a的当前读看到,我们不称为时幻读。幻读专指“新插入的行”。
但是,上面的场景其实是存在问题的。
第一个问题是语义。 session a在t1时刻就执行了for update,也就是语义上会将所有d=5的行锁住,不准别的事务进行读写操作。但是实际上语义就被破坏了。
又如下面这个场景:
理论上session a会在t1时刻将所有d=5的行锁住。但是session b和sessionc在后来分别修改和插入了d=5的行,但是这两行并没有被锁住,所以就违背了语义。
第二个问题是数据一致性。 数据一致性包括数据库内部数据状态的一致性、数据和日志在逻辑上的一致性。
我们来看下面这个场景:
这个场景在t1时刻的session a中加入了update语句,会把锁了的d=5的行的值修改成100。数据库的执行如下:
- 经过t1时刻,id=5这一行变成(5,5,100),当然这个结果会在t6时刻才提交
- 经过t2时刻,id=0这一行变成(0,5,5)
- 经过t4时刻,表里面多了一行(1,5,5)
我们再来看binlog里面的内容:
- t2时刻,session b事务提交,写入了两条语句
- t4时刻,session c事务提交,写入了两条语句
- t6时刻,session a事务提交,写入了update t set d=100 where d=5这条语句
所以在binlog中,由于t6时刻session a执行了update t set d=100 where d=5这条语句,所以三行变成了(0,5,100),(1,5,100),(5,5,100)。我们就会发现binlog和数据库的不一致性。
因此仅仅只在d=5的行行加锁,而其他行不加锁的假设是不合理的。
如果是会在所有扫描过的行都加锁的话,我们再看下执行效果:
由于session a的q1会将所有的行锁住,所以session b会被阻塞,直到session a提交事务才会继续执行,这样id=0的结果就会是(0,5,5),保证了数据库和binlog的一致性。
但是对所有的行加锁, 并不能阻止session c中的幻读。因为在q1语句进行加锁的时候,id=1这一行还不存在,所以没法进行加锁。
产生幻读的原因是因为行锁只能锁住行,但是新插入记录这个动作,是在行的间隙中的。因此,为了解决幻读,innodb引入了间隙锁(gap lock)。
在表t中,初始有6个记录,也就有7个间隙,如下图:
当执行for update的时候,不止对6个记录加入了行锁,还同时加了7个间隙锁,这就保证了无法插入新的记录。
我们之前学习过行锁,行锁是分为读锁和写锁的,这两种锁可能会存在冲突关系:
但是,间隙锁之间是不存在冲突关系的。例如下面这个场景:
session a和session b都执行了for update语句,都会加上间隙锁,但是它们具有共同的目标:保护这个间隙,不允许插入新值,因此它们之间是不会冲突的。
间隙锁和行锁合称next-key lock,每个next-key lock是前开后闭区间。next-key lock就是锁住满足条件的行和这些行前面的间隙。
间隙锁的引入解决了幻读问题,但是也存在一些问题。如下面这个问题:
我们来分析上面场景的执行流程:
我们假设id=9这一行起初是不存在的
- session a执行for update语句,由于id=9不存在,因此加上间隙锁(5,10)
- session b执行for update语句,同样加上间隙锁(5,10)
- session b试图插入一行(9,9,9),被session a的间隙锁挡住,进入等待
- session a试图插入一行(9,9,9),被session b的间隙锁挡住,进入等待
这样就出现了死锁的问题。只能让session a进行回滚了。
对于for update语句,它是一种悲观锁:
- 如果查询的是主键\索引列,则是行锁。
- 如果查询的是没有主键\索引的话,则是表锁。
对于for update加的是行锁还是表锁,可以看面试官问:select…for update会锁表还是锁行?