对于线上数据库应用系统,突然遭遇 数据库宕机 怎么办?在这种情况下,定位宕机的原因就非常关键。我们可以查看数据库的 错误日志。因为日志中记录了数据库运行中的诊断信息,包括了错误、警告和注释等信息。比如:从日志中发现某个连接中的 sql 操作发生了死循环,导致内存不足,被系统强行终止了。明确了原因,处理起来也就轻松了,系统很快就恢复了运行。
除了发现错误,日志在数据复制、数据恢复、操作审计,以及确保数据的永久性和一致性等方面,都有着不可替代的作用。
mysql支持的日志
日志类型
mysql有不同类型的日志文件,用来存储不同类型的日志,分为二进制日志、错误日志、通用查询日志和慢查询日志,这也是常用的4种。mysol 8又新增两种支持的日志:中继日志和数据定义语句日志。使用这些日志文件可以查看mysql内部发生的事情。
- 慢查询日志:记录所有执行时间超过long_query_time的所有查询,方便我们对查询进行优化。
- 通用查询日志:记录所有连接的起始时间和终止时间,以及连接发送给数据库服务器的所有指令,对我们复原操作的实际场景、发现问题,甚至是对数据库操作的审计都有很大的帮助。
- 错误日志:记录mysql服务的启动、运行或停止mysql服务时出现的问题,方便我们了解服务器的状态,从而对服务器进行维护。
- 二进制日志:记录所有更改数据的语句,可以用于主从服务器之间的数据同步,以及服务器遇到故障时数据的无损失恢复。
- 中继日志:用于主从服务器架构中,从服务器用来存放主服务器二进制日志内容的一个中间文件。从服务器通过读取中继日志的内容,来同步主服务器上的操作。
- 数据定义语句日志:记录数据定义语句执行的元数据操作。
除二进制日志外,其他日志都是 文本文件。默认情况下,所有日志创建于 mysql数据目录中。
日志的弊端
- 日志功能会 降低mysql数据库的性能。例如,在查询非常频繁的mysql数据库系统中,如果开启了通用查询日志和慢查询日志,mysql数据库会花费很多时间记录日志。
- 日志会 占用大量的磁盘空间。对于用户量非常大、操作非常频繁的数据库,日志文件需要的存储空间设置比数据库文件需要的存储空间还要大。
慢查询日志(slow_query_log)
略,可查看《性能分析工具的使用》——>https://blog.csdn.net/doudou_4174/article/details/129246070
通用查询日志 (general query log)
通用查询日志用来 记录用户的所有操作,包括启动和关闭mysql服务、所有用户的连接开始时间和截止时间、发给 mysql数据库服务器的所有 sql 指令等。当我们的数据发生异常时,查看通用查询日志,还原操作时的具体场景,可以帮助我们准确定位问题。
查看当前状态
show variables like '%general%';
- 系统变量 general_log 的值是 off,即通用查询日志处于关闭状态。在 mysql中,通用查询日志默认是关闭的。因为一旦开启记录通用查询日志,mysql 会记录所有的连接起止和相关的 sol操作,这样会消耗系统资源并且占用磁盘空间。我们可以通过手动修改变量的值,在 需要的时候开启日志。
- 通用查询日志文件的名称是 localhost.log(默认主机名)。存储路是var/lib/mysql,默认也是数据路径。
启动日志
方式1:永久性方式
修改my.cnf或者my.ini配置文件来设置。在[mysqld]组下加入log选项,并重启mysql服务。格式如下:
[mysqld]
general_log=on
general_log_file=[path[filename]] #日志文件所在目录路径,filename为日志文件名
如果不指定目录和文件名,通用查询日志将默认存储在mysql数据目录中的hostname.log文件中,hostname表示主机名。
方式2:临时性方式
set global general_log=on;# 开启通用查询日志
set global general_log_file='path/filename';# 设置日志文件保存位置
查看日志
通用查询日志是以文本文件 的形式存储在文件系统中的,可以使用 文本编辑器 直接打开日志文件。每台mysql服务器的通用查询日志内容是不同的
从show variables like 'general_log%’; 结果中可以看到通用查询日志的位置。
通过通用查询日志,可以了解用户对mysql进行的操作。比如,mysql启动信息和用户root连接服务器和执行查询表的记录。
在通用查询日志里面,我们可以清楚地看到,什么时候开启了新的客户端登陆数据库,登录之后做了什么 sql操作,针对的是哪个数据表等信息。
停止日志
方式1:永久性方式
修改my.cnf 或者my.ini 文件,把[mysqld]组下的 general_log 值设置为 off 或者把general_log一项注释掉.修改保存后,再 重启mysql服务,即可生效。
[mysqld]
general_log=off
#或
#general_log=off
方式2:临时性方式
使用set语句停止mysql通用查询日志功能:
set global general_log=off;
删除\刷新日志
如果数据的使用非常频繁,那么通用查询日志会占用服务器非常大的磁盘空间。数据管理员可以删除很长时间之前的查询日志以保证mysql服务器上的硬盘空间。
手动删除文件
使用:show variables like ‘general_log%’;命令查看文件地址,手动将文件删除。
刷新日志
使用如下命令重新生成查询日志文件,具体命令如下。刷新mysql数据目录,发现创建了新的日志文件。前提一定要开启通用日志。
mysqladmin -uroot -p flush-logs
如果希望备份旧的通用查询日志,就必须先将旧的日志文件复制出来或者改名,然后执行上面的mysqladmin命令。正确流程如下:
cd mysql-data-directory #输入自己的通用日志文件所在目录
mv mysql.general.log mysgl.general.log.old #指名就的文件名 以及 新的文件名
mysqladmin -uroot -p flush-logs
错误日志 (error log)
错误日志记录了 mysql 服务器启动、停止运行的时间,以及系统启动、运行和停止过程中的诊断信息,包括错误、警告和 提示等。
通过错误日志可以查看系统的运行状态,便于即时发现故障、修复故障。如果mysql服务 出现异常,错误日志是发现问题、解决故障的 首选。
启动日志
在mysql数据库中,错误日志功能是 默认开启的。而且,错误日志 无法被禁止。
默认情况下,错误日志存储在mysql数据库的数据文件夹下,名称默认为 mysqld.log (linux系统)或hostname.err (mac系统) 。如果需要制定文件名,则需要在my.cnf或者my.ini中做如下配置:
[mysqld]
log-error=[path/[filename]] #path为日志文件所在的目录路径,filename为日志文件名
修改配置项后,需要重启mysql服务以生效。
查看日志
mysql错误日志是以文本文件形式存储的,可以使用文本编辑器直接查看。
查询错误日志的存储路径:
show variables like 'log_err%';
执行结果中可以看到错误日志文件是mysqld.log,位于mysql默认的数据目录下。
可以看到,错误日志文件中记录了服务器启动的时间,以及存储引擎innodb 启动和停止的时间等。我们在做初始化时候生成的数据库初始密码也是记录在error.log中。
删除\刷新日志
对于很久以前的错误日志,数据库管理员查看这些错误日志的可能性不大,可以将这些错误日志删除,以保证mysql服务器上的 硬盘空间。mysql的错误日志是以文本文件的形式存储在文件系统中的,可以 直接删除。
-
第1步:重命名文件
mv /var/log/mysqld.log /var/log/mysqld.log.old
-
第2步:重建日志
mysqladmin -u root -p flush-logs
可能会报错:
ag真人试玩娱乐官网提示:
补充操作:
install -omysql -gmysql -m0644 /dev/null /var/log/mysqld.log
flush-logs 指令操作
- mysql 5.5.7以前的版本,flush-logs将错误日志文件重命名为filename.err_old,并创建新的日志文件。
- 从mysql 5.5.7开始,flush-logs只是重新打开日志文件,并不做日志备份和创建的操作。
- 如果日志文件不存在,mysql启动或者执行flush-logs时会自动创建新的日志文件。重新创建错误日志,大小为0字节。
二进制日志 (bin log)
binlog可以说是mysol中比较重要的日志了,在日常开发及运维过程中,经常会遇到。
binlog即binary log,二进制日志文件,也叫作变更日志 (update log)。它记录了数据库所有执行的ddl和dml等数据库更新事件的语句,但是不包含没有修改任何数据的语句(如数据查询语句select、show等)。
它以事件形式 记录并保存在二进制文件 中。通过这些信息,我们可以再现数据更新操作的全过程。
binlog主要应用场景
- 一是用于 数据恢复,如果mysql数据库意外停止,可以通过二进制日志文件来查看用户执行了哪些操作,对数据库服务器文件做了哪些修改,然后根据二进制日志文件中的记录来恢复数据库服务器。
- 二是用于数据复制,由于日志的延续性和时效性,master把它的二进制日志传递给slaves来达到master-slave数据一致的目的。
可以说mysql数据库的数据备份、主备、主主、主从都离不开binlog,需要依靠binlog来同步数据,保证数据一致性。
查看默认情况
查看记录二进制日志是否开启: 在mysql8中默认情况下,二进制文件是开启的。
show variables like '%log_bin%';
- log_bin_basename: 是binog日志的基本文件名,后面会追加标识来表示每一个文件;
- log_bin_index:是binlog文件的索引文件,这个文件管理了所有的binlog文件的目录;
- log_bin_trust_function_creatprs: 限制存储过程,前面我们已经讲过了,这是因为二进制日志的一个重要功能是用于主从复制,而存储函数有可能导致主从的数据不一致。所以当开启二进制日志后,需要限制存储函数的创建、修改、调用;
- log_bin_use_v1_row_events:此只读系统变量已弃用。on表示使用版本1二进制日志行,off表示使用版本2二进制日志行(mysql5.6的默认值为2);
日志参数设置
方式1:永久性方式
修改mysql的my.cnf或my.ini 文件可以设置二进制日志的相关参数:
[mysqld]
#启用二进制日志
log-bin=doudoubinlog
binlog_expire_logs_seconds=600
max_binlog_size=100m
- log-bin=mysql-bin 打开日志(主机需要打开),这个mysql-bin也可以自定义,这里也可以加上路径如:/home/www/mysql_bin_log/mysql-bin
- binlog_expire_logs_seconds: 此参数控制二进制日志文件保留的时长,单位是秒,默认2592000:30天,常用14400 4小时;86400 1天;259200 3天;
- max_binlog_size: 控制单个二进制日志大小,当前日志文件大小超过此变量时,执行切换动作。此参数的最大和默认值是1gb,该设置并 不能严格控制binlog的大小,尤其是binlog比较靠近最大值而又遇到一个比较大事务时,为了保证事务的完整性,可能不做切换日志的动作,只能将该事务的所有sql都记录进当前日志,直到事务结束。一般情况下可采取默认值。
重新启动mysql服务,查询二进制日志的信息,执行结果:
设置带文件夹的bin-log日志存放目录
如果想改变日志文件的目录和名称,可以对my.cnf或myini中的log_bin参数修改如下:
[mysqld]
log-bin="/var/lib/mysql/binlog/doudou-bin"
注意:新建的文件夹需要使用mysql用户,使用下面的命令即可
chown -r -v mysql:mysql binlog
重启mysql服务之后,新的二进制日志文件将出现在/var/lib/mysql/binlog/文件夹下面:
提示:数据库文件最好不要与日志文件放在同一个磁盘上!这样,当数据库文件所在的磁盘发生故障时,可以使用日志文件恢复数据。
方式2:临时性方式
如果不希望通过修改配置文件并重启的方式设置二进制日志的话,还可以使用如下指令,需要注意的是在mysql8中只有 会话级别 的设置,没有了global级别的设置。
# qlobal 级别
mysql> set global sql_log_bin=;
error 1228 (hy000): variable 'sql_log_bin' is a session variable and can t be used with set global
# session级别
mysql> set sql_log_bin=0;
query 0k, rows affected (0.01 秒)
查看日志
当mysql创建二进制日志文件时,先创建一个以“filename”为名称、以“index”为后缀的文件,再创建一个以“filename”为名称、以“000001”为后缀的文件。
mysql服务重新启动一次,以“000001”为后缀的文件就会增加一个,并且后缀名按1递增。即日志文件的个数与mysql服务启动的次数相同;如果日志长度超过了 max_binlog_size 的上限(默认是1gb),就会创建一个新的日志文件。
查看当前的二进制日志文件列表及大小。指令如下:
show binary logs;
所有对数据库的修改都会记录在binglog中。但binlog是二进制文件,无法直接查看,想要更直观的观测它就要借助mysqlbinlog 命令工具了。指令如下: 在查看执行,先执行一条sql语句,如下:
update user set username='豆豆1' where id = 1;
开始查看binlog:
mysqlbinlog查询命令
mysqlbinlog "doudou-bin.000001"
执行结果可以看到,这是一个简单的日志文件,日志中记录了用户的一些操作,这里并没有出现具体的sql语句,这里因为binlog关键字后面的内容是经过编码后的二进制日志。
这里一个update语句包含如下事件:
- query 事件负责开始一个事务(begin)
- table_map事件负责映射需要的表
- update_rows事件负责写入数据
- xid事件负责结束事务
下面命令将行事件以伪sql的形式 表现出来
mysqlbinlog -v "doudou-bin.000001"
前面的命令同时显示binlog格式的语句,使用如下命令不显示它
mysqlbinlog -v --base64-output=decode-rows "doudou-bin.000001"
mysqlbinlog工具常用语句
# 可查看参数帮助
mysqlbinlog --no-defaults --help
# 查看最后100行
mysqlbinlog --no-defaults --base64-output=decode-rows -vv doudou-bin.000001 | tail -100
# 根据position查找
mysqlbinlog --no-defaults --base64-output=decode-rows -vv doudou-bin.000001 | grep -a 20 '692'
enents查询命令
上面这种办法读取出binlog日志的全文内容比较多,不容易分辨查看到pos点信息,下面介绍一种更为方便的查询命令:
show binlog events [in 'log_name'] [from pos] [limit offset,row_count];
- in log_name: 指定要查询的binlog文件名 (不指定就是第一个binlog文件)
- from pos:指定从哪个pos起始点开始查起 (不指定就是从整个文件首个pos点开始算)
- from pos:指定从哪个pos起始点开始查起 (不指定就是从整个文件首个pos点开始算)
- row_count :查询总条数 (不指定就是所有行)
举例:
#查询第一个最早的binlog日志
show binlog events;
#指定查询doudou-bin.000001这个文件
show binlog events in 'doudou-bin.000001;
#指定查询doudou-bin.000002这个文件,从pos点:391开始查起
show binlog events in atguigu-bin.@00002' from 3911;
#指定查询doudou-bin.000002这个文件,从pos点:391开始查起,查询5条(即5条语句)
show binlog events in 'doudou-bin.000002' from 391 limit 5;
#指定查询 doudou-bin.000002这个文件,从pos点:391开始查起,偏移2行(即中间跳过2个) 查询5条 (即5条语句)。
show binlog events in 'doudou-bin.000002' from 391 limit 2,5;
binlog格式查看
show variables like 'binlog_format';
-
statement
每一条会修改数据的sql都会记录在binlog中。
优点: 不需要记录每一行的变化,减少了binlog日志量,节约了io,提高性能。
-
row
5.1.5版本的mysql才开始支持row level 的复制,它不记录sq语句上下文相关信息,仅保存哪条记录被修改
优点:rowlevel 的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题。
-
mixed
从5.1.8版本开始,mysql提供了mixed格式,实际上就是statement与row的结合。
使用日志恢复数据
如果mysql服务器启用了二进制日志,在数据库出现意外丢失数据时,可以使用mysolbinlog工具从指定的时间点开始(例如,最后一次备份)直到现在或另一个指定的时间点的日志中恢复数据
mysqlbinlog恢复数据的语法如下:
mysqlbinlog [option] filename | mysql -uuser -ppass;
这个命令可以这样理解: 使用mysqlbinlog命令来读取filename中的内容,然后使用mysql命令将这些内容恢复到数据库中。
- filename: 是日志文件名
- option : 可选项,比较重要的两对option参数是-start-date -stop-date和 --stat-position、–stop-position
- –start-date 和 --stop-date: 可以指定恢复数据库的起始时间点和结束时间点
- –start-position和–stop-position: 可以指定恢复数据的开始位置和结束位置
注意: 使用mysqlbinlog命令进行恢复操作时,必须是编号小的先恢复,例如doudou-bin.000001必须在doudou-bin.000002之前恢复
举例
现在如何使用bin log恢复数据?
第一步:flush logs;
原因:若不进行次操作,在恢复过程中为修改操作,会再次将修改语句记录到原binlog日志中,因此刷新创建新日志,将后续操作记录到新的binlog日志中,使用doudou-bin.000001恢复数据。
插入的操作在三个事务中,而且三个事务是连在一起的,所以我们可以直接恢复后两个事务,开始pos是1178,结束pos是1701
mysqlbinlog --start-position=1178 --stop-position=1701 --database=studydb /var/lib/mysql/binlog/doudou-bin.000001 | mysql -uroot -pdoudou -v studydb
mysqlbinlog命令对于意外操作非常有效,比如因操作不当误删了数据表。
删除二进制日志
mysql的二进制文件可以配置自动删除,同时mysql也提供了安全的手动删除二进制文件的方法。purge master logs 只删除指定部分的二进制日志文件,reset master 删除所有的二进制日志文件。具体如下:
purge master logs: 删除指定日志文件
purge master logs语法如下:
purge {
master | binary} logs to '指定日志文件名'
purge {
master | binary} logs before '指定日期'
举例:删除doudou-bin.000005之前的binlog日志文件
reset master:删除所有二进制日志文件
使用reset master语句,清空所有的binlog日志。mysql会重新创建二进制文件,新的日志文件扩展名将重新从000001开始编号。慎用 !
举例:
其他场景
二进制日志可以通过数据库的 全量备份 和二进制日志中保存的 增量信息,完成数据库的 无损失恢复。但是,如果遇到数据量大、数据库和数据表很多(比如分库分表的应用)的场景,用二进制日志进行数据恢复,是很有挑战性的,因为起止位置不容易管理。
在这种情况下,一个有效的解决办法是 配置主从数据库服务器,甚至是 一主多从的架构,把二进制日志文件的内容通过中继日志,同步到从数据库服务器中,这样就可以有效避免数据库故障导致的数据异常等问题。
再谈binlog
写入机制
binlog的写入时机也非常简单,事务执行过程中,先把日志写到 binlog cache,事务提交的时候,再把binlog cache写到binlog文件中。因为一个事务的binlog不能被拆开,无论这个事务多大,也要确保一次性写入,所以系统会给每个线程分配一个块内存作为binlog cache。
我们可以通过 binlog_cache_size 参数控制单个线程 binlog cache 大小,如果存储内容超过了这个参数,就要暂存到磁盘(swap)。binlog日志刷盘流程如下:
- 上图的 write,是指把日志写入到文件系统的 page cache,并没有把数据持久化到磁盘,所以速度比较快
- 上图的fsync,才是将数据持久化到磁盘的操作
write和fsync的时机,可以由参数 sync_binlog 控制,默认是0。为0的时候,表示每次提交事务都只write,由系统自行判断什么时候执行fsync。虽然性能得到提升,但机器宕机,page cache里面的 binglog 会丢失。如下图:
为了安全起见,可以设置为1,表示每次提交事务都会执行fsync,就如同redo log 刷盘流程一样。
最后还有一种折中方式,可以设置为n(n>1),表示每次提交事务都write,但累积n个事务后才fsync。
在出现io瓶颈的场景里,将sync_binlog设置成一个比较大的值,可以提升性能,同样的,如果机器宕机,会丢失最近n个事务的binlog日志。
binlog与redolog对比
- redo log 它是物理日志,记录内容是“在某个数据页上做了什么修改”,属于lnnodb 存储引擎层产生的
- binlog 是逻辑日志,记录内容是语句的原始逻辑,类似于“给d=2 这一行的c字段加 1”,属于mysql server 层。
- 虽然它们都属士持久化的保证,但是则重点不同
- redo log让innodb存储引擎拥有了崩溃恢复能力
- binlog保证了mysql集群架构的数据一致性
两阶段提交
在执行更新语句过程,会记录redo log与binlog两块日志,以基本的事务为单位,redo log在事务执行过程中可以不断写入,而binlog只有在提交事务时才写入,所以redo log与binlog的 写入时机不一样。
redo log与binlog两份日志之间的逻辑不一致,会出现什么问题?
以update语句为例,假设 id=2 的记录,字段c值是0,把字段值更新成1,sql语为update t set c=1 whereid=2。
假设执行过程中写完redolog日志后,binlog日志写期间发生了异常,会出现什么情况呢?
由于binlog没写完就异常,这时候binlog里面没有对应的修改记录。因此,之后用binlog日志恢复数据时(从库),就会少这一次更新,恢复出来的这一行c值是,而原库因为redo log日志恢复(主库),这一行c值是1,最终数据不一致。
为了解决两份日志之间的逻辑一致问题,lnnodb存储引擎使用两阶段提交方案。原理很简单,将redo log的写入拆成了两个步骤prepare和commit,这就是两阶段提交。
使用两阶段提交后,写入binlog时发生异常也不会有影响,因为mysql根据redo log日志恢复数据时,发现redo log还处于prepare阶段,并且没有对应binlog日志,就会回滚该事务。
另一个场景,redo log设置commit阶段发生异常,那会不会回滚事务呢?
并不会回滚事务,它会执行上图框住的逻辑,虽然redo log是处于prepare阶段,但是能通过事务id找到对应的binlog日志,所以mysql认为是完整的,就会提交事务恢复数据。
中继日志 (relay log)
介绍
中继日志只在主从服务器架构的从服务器上存在。从服务器为了与主服务器保持一致,要从主服务器读取二进制日志的内容,并且把读取到的信息写入 本地的日志文件 中,这个从服务器本地的日志文件就叫 中继日志。然后从服务器读取中继日志,并根据中继日志的内容对从服务器的数据进行更新,完成主从服务器的 数据回步。
搭建好主从服务器之后,中继日志默认会保存在从服务器的数据目录下。
文件名的格式是: 从服务器名 -relay-bin.序号。中继日志还有一个索引文件: 从服务器名 -relay-bin.index,用来定位当前正在使用的中继日志。
查看中继日志
中继日志与二进制日志的格式相同,可以用 mysqlbinlog 工具进行查看。
恢复的典型错误
如果从服务器宕机,有的时候为了系统恢复,要重装操作系统,这样就可能会导致你的 服务器名称 与之前 不同而中继日志里是 包含从服务器名 的。在这种情况下,就可能导致你恢复从服务器的时候,无法从宕机前的中继日志里读取数据,以为是日志文件损坏了,其实是名称不对了。
解决的方法也很简单,把从服务器的名称改回之前的名称。