一、数据库克隆概念介绍

在数据库MySQL 8.0(8.0.17+)版本中,引入了数据库的克隆功能,主要是借助clone-plugin实现的,是对数据页底层克隆;

克隆的数据是InnoDB存储引擎中的物理快照信息,包括schemas, tables, tablespaces, and data dictionary metadata;

在数据库中出现克隆功能,主要是为了满足目前云原生的技术应用场景,同时也是为了海量数据备份而诞生的;

在数据库中实现克隆功能应用有两种方式:

  • 本地克隆(Local Cloning)
  • 远程克隆(Remote Cloning)

本地克隆(Local Cloning):

启动克隆操作的MySQL数据库服务器实例中的数据,将会克隆到同服务器或同节点上的一个目录里;

Day009-数据库服务克隆应用、主从架构-图1

远程克隆(Remote Cloning)

默认情况下,远程克隆操作会删除接受者(recipient)数据目录中的数据,并将其替换为捐赠者(donor)的克隆数据;

也可以将数据克隆到接受者的其他目录中,以避免删除现有数据;(属于可选操作);

主要用于实现数据远程的快速热迁移操作,在迁移过程中,除了DDL操作情况,其他操作都不会出现阻塞情况;

还可以利用远程克隆技术,实现快速构建数据库的主从架构环境,实现主从数据信息快速复制同步;

Day009-数据库服务克隆应用、主从架构-图2

二、数据库克隆原理说明

在进行数据库克隆操作时,会经历几个重要的过程或步骤:

01 Page copy:

在进行数据页复制操作时,会涉及到两个操作动作:

开启redo archiving功能,从当前点开始存储新增的redo_log,这样从当前位置点开始所有的增量修改都不会丢失;

同时上一步在page track的page被发送到目标端,确保当前位置点之前所有做的变更一定发送到目标端;

关于redo archiving实际上这是官方早就存在的功能,主要用于官方的企业级备份工具,clone利用了该特性来维持记录增量产生的redo

在开始克隆前会做一次checkpoint;

对于redo archiving功能应用,会开启一个后台线程log_archiver_thread()来做日志归档;

当有新的写入时(notify_about_advanced_write_lsn),也会通知线程去进行归档,当arch_log_sys处于活跃状态时,

线程会控制日志写入以避免未归档的日志被覆盖(log_write_wait_on_archiver),注意如果log_write等待时间过长的话,

archive任务会被中断掉;

02 Redo copy:

停止redo archiving功能,所有归档的日志被发送到目标端,这些日志包含了从page copy阶段开始到现在的所有日志;

另外可能还需要记下当前的复制点,例如:最后一个事务提交时的binlog位置点或者gtid信息,在系统页中可以找到;

03 Done:

目标端重启实例,通过crash recovery将redo log应用上去;

克隆原理过程分析参考链接:https://zhuanlan.zhihu.com/p/437760913

说明:整个克隆过程都会以事件信息记录,可以很清晰的看到克隆的流程,如果克隆过程中断,也会以追加方式进行继续克隆;

在进行克隆功能应用时,也是存在一些限制性操作的:(结合官方列出的限制)

  • 对于MySQL 8.0.27之前版本,在进行克隆操作期间,是不允许在捐赠者和接受者上进行DDL操作,包括:truncate table操作;

对于MySQL 8.0.27之后版本,在捐赠者上默认允许并发DDL操作,对于捐赠者上并发DDL的支持由clone_block_DDL变量控制;

  • 对于不同版本的MySQL数据库实例之间,是不能进行克隆操作的。对于捐赠者和接受者必须是确切相同数据库服务版本;

例如:你不能克隆数据在between MySQL 5.7 and MySQL 8.0, or between MySQL 8.0.19 and MySQL 8.0.20;

这个克隆功能只支持在数据库8.0.17版本或之后的版本

参考官方链接说明:https://dev.mysql.com/doc/refman/8.0/en/clone-plugin-limitations.html

三、数据库克隆功能实践

实现本地克隆操作过程:

克隆需求:实现快速创建和源数据库服务一模一样的多实例服务程序;

克隆操作步骤01:加载克隆插件信息

# 进行克隆插件加载配置(临时配置和永久配置)
mysql> INSTALL PLUGIN clone SONAME 'mysql_clone.so';
或者
[mysqld]
plugin-load-add=mysql_clone.so
clone=FORCE_PLUS_PERMANENT

# 查看克隆插件加载情况
mysql> SELECT PLUGIN_NAME, PLUGIN_STATUS FROM INFORMATION_SCHEMA.PLUGINS WHERE PLUGIN_NAME = 'clone';
+-------------+---------------+
| PLUGIN_NAME | PLUGIN_STATUS |
+-------------+---------------+
| clone       | ACTIVE        |
+-------------+---------------+
1 row in set (0.00 sec)

克隆操作步骤02:创建克隆专用用户

-- backup_admin权限是mysql 8.0才有的备份导出的权限;
mysql> create user clone_user@'%' identified by 'password';
mysql> grant backup_admin on *.* to 'clone_user';

克隆操作步骤03:进行本地克隆操作

注意事项:在克隆操作的同时,会实行优化。比如遇到空的数据库,不会进行克隆。

[root@master ~]# mkdir -p /data/test
[root@master ~]# chown -R mysql.mysql /data/
-- 完成本地数据库目录的克隆操作,如果出现异常需要删除克隆目录,在进行重新克隆操作
[root@master ~]# mysql -uclone_user -ppassword
mysql> clone local data directory = '/data/test/clonedir';

克隆操作步骤04:观测本地克隆状态(另开窗口使用管理员用户查看)

-- 当克隆数据量比较大的时候,可以使用此SQL语句进行克隆状态查看
mysql> select stage,state,end_time from performance_schema.clone_progress;
+-----------+-------------+----------------------------+
| stage     | state       | end_time                   |
+-----------+-------------+----------------------------+
| DROP DATA | Completed   | 2025-03-10 20:47:10.781456 |
| FILE COPY | Completed   | 2025-03-10 20:47:10.888770 |
| PAGE COPY | Completed   | 2025-03-10 20:47:10.891893 |
| REDO COPY | Completed   | 2025-03-10 20:47:10.892402 |
| FILE SYNC | Completed   | 2025-03-10 20:47:11.110077 |
| RESTART   | Not Started | NULL                       |
| RECOVERY  | Not Started | NULL                       |
+-----------+-------------+----------------------------+
7 rows in set (0.00 sec)

克隆操作步骤05:实现克隆日志观测(另开窗口使用管理员用户查看)

mysql> set global log_error_verbosity=3;
[root@master ~]# tail -f /data/3306/logs/mysql3306.err
clone local data directory = '/data/test/clonedir'

克隆操作步骤06:启动运行克隆实例

[root@master ~]# mysqld_safe --datadir=/data/test/clonedir --port=3333 --socket=/tmp/mysql3333.sock --user=mysql --mysqlx=off &
[root@master ~]# netstat -lntup|grep 3333
tcp6       0      0 :::3333                 :::*                    LISTEN      52674/mysqld

# 核实查看克隆后数据库信息
[root@master ~]# mysql -uroot -p123456 -S /tmp/mysql3333.sock
mysql> show databases;

实现远程克隆操作过程:

在进行实现远程克隆操作步骤之前,可以利用虚拟软件再次克隆出一台新的数据库8.0版本的服务器主机;

环境说明:

主机IP 主机角色
10.0.0.51 克隆捐赠者
10.0.0.52 克隆接收者

克隆操作步骤01:克隆操作环境准备

# 在克隆接收者主机-10.0.0.52上清理数据库服务环境:
[root@master-02 ~]# pkill mysqld
[root@master-02 ~]# rm -rf /data/3306/data/*
[root@master-02 ~]# rm -rf /data/3306/binlog/*
[root@master-02 ~]# rm -rf /data/3306/logs/*

# 在克隆接收者主机-10.0.0.52上进行实例初始化操作:
[root@master-02 ~]# mysqld --initialize-insecure --user=mysql --basedir=/usr/local/mysql --datadir=/data/3306/data
-- 修改克隆接收者主机上的server_id的配置信息
[root@master-02 ~]# vim /etc/my.cnf
[mysqld]
server_id=16

# 在克隆接收者主机-10.0.0.52上进行实例的运行操作:
[root@master-02 ~]# /etc/init.d/mysqld start

克隆操作步骤02:加载克隆插件信息

# 进行克隆插件加载配置
-- 克隆插件信息需要在克隆主机的捐赠者和接受者上都进行安装
mysql> INSTALL PLUGIN clone SONAME 'mysql_clone.so';
或者
[mysqld]
plugin-load-add=mysql_clone.so
clone=FORCE_PLUS_PERMANENT

# 查看克隆插件加载情况
-- 克隆插件信息需要在克隆主机的捐赠者和接受者上都进行安装后确认
mysql> SELECT PLUGIN_NAME, PLUGIN_STATUS FROM INFORMATION_SCHEMA.PLUGINS WHERE PLUGIN_NAME = 'clone';
+-------------+---------------+
| PLUGIN_NAME | PLUGIN_STATUS |
+-------------+---------------+
| clone       | ACTIVE        |
+-------------+---------------+
1 row in set (0.00 sec)

克隆操作步骤03:创建克隆专用用户

# 在克隆捐赠者主机上进行授权(数据库01主机-10.0.0.51上设置)
-- backup_admin权限是mysql 8.0才有的备份导出的权限;
mysql> create user test_jz@'%' identified by 'password';
mysql> grant backup_admin on *.* to test_jz@'%' ;
mysql> create user test_js@'%' identified by 'password';
mysql> grant clone_admin on *.* to test_js@'%' ;

# 在克隆接收者主机上进行授权(数据库02主机-10.0.0.52上设置)
-- clone_admin权限是mysql 8.0才有的克隆同步数据的权限;
mysql> create user test_js@'%' identified by 'password';
mysql> grant clone_admin on *.* to test_js@'%' ;

说明:可以在克隆捐赠者主机上和接收者主机上均创建两个用户信息,防止克隆同步数据后,接收者主机上不再含有接收用户信息;

克隆操作步骤04:进行远程克隆操作

# 在克隆接收者主机-10.0.0.52上进行设置
-- 设置克隆同步数据的信任列表(需要使用系统管理员进行设置)
mysql> set global clone_valid_donor_list='10.0.0.51:3306';

# 在克隆接收者主机-10.0.0.52上进行克隆
-- 在接收者主机上实现远程克隆操作
[root@master-02 ~]# mysql -utest_js -ppassword -h10.0.0.52 -P3306
mysql> clone instance from test_jz@'10.0.0.51':3306 identified by 'password';

补充说明:

参考链接:https://dev.mysql.com/doc/refman/8.0/en/clone-plugin-remote.html

上面执行完成后,可能会遇到下面报错信息。这类报错没有影响,只是需要手动重启mysql服务

mysql> clone instance from test_jz@'10.0.0.51':3306 identified by 'password';
ERROR 3869 (HY000): Clone system configuration: 10.0.0.51:3306 is not found in clone_valid_donor_list:

如果消除上面影响,或者不是手动进行重启,则需要配置下服务配置管理文件:

#重点添加如下配置即可解决
Restart=on-failure
RestartPreventExitStatus=1
Environment=MYSQLD_PARENT_PID=1
RestartForceExitStatus=16

#完整的服务配置管理文件
[root@db02-52 ~]# vim /usr/lib/systemd/system/mysqld.service
[Unit]
Description=MySQL Server
After=network.target

[Service]
User=mysql
Group=mysql
Restart=on-failure
RestartPreventExitStatus=1
Environment=MYSQLD_PARENT_PID=1
RestartForceExitStatus=16
ExecStart=/usr/local/mysql/bin/mysqld --defaults-file=/etc/my.cnf
ExecStop=/usr/local/mysql/bin/mysqladmin shutdown
LimitNOFILE=5000

[Install]
WantedBy=multi-user.target

#重新加载服务管理文件
[root@db02-52 ~]# systemctl daemon-reload

克隆操作步骤05:观测本地克隆状态

-- 当克隆数据量比较大的时候,可以使用此SQL语句进行克隆状态查看,在克隆接收者主机上使用root用户进行查看
mysql> select stage,state,end_time from performance_schema.clone_progress;
+-----------+-----------+----------------------------+
| stage     | state     | end_time                   |
+-----------+-----------+----------------------------+
| DROP DATA | Completed | 2025-03-10 21:46:00.907743 |
| FILE COPY | Completed | 2025-03-10 21:46:01.330186 |
| PAGE COPY | Completed | 2025-03-10 21:46:01.334994 |
| REDO COPY | Completed | 2025-03-10 21:46:01.339426 |
| FILE SYNC | Completed | 2025-03-10 21:46:01.578575 |
| RESTART   | Completed | 2025-03-10 21:46:04.768224 |
| RECOVERY  | Completed | 2025-03-10 21:46:04.976835 |
+-----------+-----------+----------------------------+
7 rows in set (0.01 sec)

-- 此时克隆接收者主机上查看到的数据信息,与克隆捐赠者主机上查看到的数据信息一致,即远程克隆操作完成
mysql> show databases;