一、rsync介绍

1、rsync是什么
rsync(remote synchronize)是Liunx/Unix下的一个远程数据同步工具。
它可通过LAN/WAN快速同步多台主机间的文件和目录,并适当利用rsync算法(差分编码)以减少数据的传输。

rsync算法并不是每一次都整份传输,而是只传输两个文件的不同部分,因此其传输速度相当快。

除此之外,rsync可拷贝、显示目录属性,以及拷贝文件,并可选择性的压缩以及递归拷贝。
2、rsync的工作原理
a、客户端构造FileList,FileList包含了需要与服务器同步的所有文件信息对name->id
(id用来唯一表示文件例如MD5)

b、客户端将FileList发送到服务器。

c、服务器上rsync处理客户端发过来的FileList,构建新的NewFileList。
 其中根据MD5值比较,删除服务器上已经存在的文件信息对,只保留服务器上不存在或变化的文件。

d、客户端得到服务器发送过来的NewFileList,然后把NewFileList中的文件重新传输到服务器。
3、rsync优点
1)可以镜像保存整个目录树和文件系统。

2)可以很容易做到保持原来文件的权限、时间、软硬连接等。

3)无需特殊权限即可安装。

4)快速:第一次同步时rsync复制全部内容,但在下一次值传输修改过的内容

5)压缩传输:rysnc在传输的过程中可以实行压缩及解压缩操作,可以使用更少的带宽

6)安全:可以使用scp、ssh等方式来进行文件传输

7)支持匿名传输,以方便进行网站镜像

8)rsync不仅可以远程同步数据(类似于scp),而且可以本地同步数据(类似于cp),做差异同步

9)openssh 8.0已经把scp标记为过时不建议使用了。建议用sftp或者rsync替代scp


# 需要在Liunx/Unix服务器之间互传海量数据时,建议选择rsync进行传输
4、rsync认证方式

rsync有两种常用的认证方式,一种是rsync-daemon方式,另外一种是ssh方式。

在平时使用过程,我们使用最多的是rsync-daemon方式。

注意:在使用rsync时,服务器和客户端都必须安装rsync程序

rsync-daemon 认证

rsync在rsync-daemon认证方式下,默认监听TCP的873端口。

rsync-daemon认证方式是rsync的主要认证方式,这个也是我们经常使用的认证方式。
并且也只有在此种模式下,rsync才可以把密码写入到一个文件中。

注意:
	rsync-daemon认证方式,需要服务器和客户端都安装rsync服务
	并且只需要rsync服务器端启动rsync,同时配置rsync配置文件。
	客户端启动不启动rsync服务,都不影响同步的正常进行。

ssh认证

rsync在ssh认证方式下,可通过系统用户进行认证,即在rsync上通过ssh隧道进行传输,类似于scp工具。
此时同步操作不在局限于rsync中定义的同步文件夹。

注意:
	ssh认证方式,不需要服务器和客户端配置rsync配置文件
	只需要双方都安装rsync服务,并且也不需要双方启动rsync。

# 若rsync服务端SSH为标准端口,此时rsync使用方式如下:

	rsync -avz /root/test root@10.10.10.10:/root/


# 若rsync服务端SSH为非标准端口,可通过rsync的-e参数进行端口指定。使用方式如下:

	rsync -avz /root/test -e 'ssh -p1234' root@10.10.10.10:/root/

二、安装rsync

安装rsync,我们可以分为两种方式:源码方式安装和RPM方式安装。

注意:rsync软件无论是服务器端还是客户端都是同一个软件包。

1、源码方式安装
# 源码方式安装rsync,需要到其官网下载对应的安装包。rsync官网:rsync.samba.org 

1)、下载
wget https://download.samba.org/pub/rsync/src/rsync-3.2.3.tar.gz

2)、解压并安装
tar -xvf rsync-3.2.3.tar.gz

3)、编译安装
# 源码安装rsync时,其编译时所需要的gcc库文件尽量提前安装完毕
# 默认安装到/usr/local/目录下
./configure
make &&make install

4)、设置开机启动
echo “/usr/local/bin/rsync --daemon -config=/etc/rsyncd.conf” >>/etc/profile
2、 yum方式安装
yum -y install  rsync

#设置开机启动
echo “/usr/local/bin/rsync --daemon -config=/etc/rsyncd.conf” >>/etc/profile

三、配置rsync daemon

rsync的配置分为服务器端和客户端

使用rsync协议,需要服务端启动守护进程

1、服务端配置

  • 准备rsync配置文件
# 以 rsync 用户启动进程
uid = rsync
gid = rsync

 # 无需让rsync以root身份运行,允许接收文件的完整属性
fake super = yes       

# 禁锢推送的数据至某个目录, 不允许跳出该目录
use chroot = no                

max connections = 200          # 最大连接数
timeout = 600                  # 超时时间
ignore errors                  # 忽略错误信息

read only = false              # 对备份数据可读写

list = false                   # 不允许查看模块信息

# 定义虚拟用户,作为连接认证用户
auth users = myuser 

# 定义rsync服务用户连接认证密码文件路径
secrets file = /etc/rsync.passwd

#### 定义模块信息
[backup]                
comment = commit        # 模块注释信息
path = /backup          # 定义接收备份数据目录

# 只允许10.10.10段ip连接
hosts allow = 10.10.10.0/24
  • 配置并启动守护进程
# 需要一个rsync进程运行时使用的普通用户 rsync
useradd rsync -M -s /sbin/nologin

# 服务端需要定义一个客户端连接    虚拟用户名和密码
# 密码文件形式  user:passwd
echo "myuser:password" > /etc/rsync.passwd
chmod 600 /etc/rsync.passwd

# 准备模块定义好的目录,客户端的数据都存放在该目录下
mkdir /backup
chown -R rsync.rsync /backup

# 启动服务
rsync --daemon

# 查看服务
ps aux | grep rsync
netstat -lntp|grep 873

2、客户端使用


# 在客户端安装完毕rsync服务后,是不需要启动rsync服务的。
# 我们只需要在客户端创建连接rsync服务器时,验证码用户所需要的密码文件即可。
# 该密码文件中的密码要与rsync服务器上的密码文件中的密码对应
# 并且也要与rsync服务器rsyncd.conf配置文件中的认证模块中的用户匹配。

echo “password”>>/etc/rsync.passwd

chmod 600 /etc/rsync.passwd


# 查看 rsync 守护程序分配的所有 module 列表,可以执行下面命令。
rsync rsync://10.10.10.10


# 具体写法是服务器与目标目录之间使用双冒号分隔`::`
# 地址中的module并不是实际路径名,而是 rsync 守护程序指定的模块名

# 把本地的文件同步到远程服务器
# rsync [OPTION]… [SRC]… [USER@]HOST::DEST
# rsync [选项] [--port=]  [--password-file=] [/local/path] [用户名]@服务端IP::[模块名]

rsync -av --password-file=/etc/rsync.passwd local/ myuser@10.10.10.10::backup

# 把远程机器的文件同步到本地
# rsync [OPTION]… [USER@]HOST::SRC [DEST]
# rsync [选项] [--port=] [--password-file=] [用户名@]服务端IP::[模块名]  [/local/path]

rsync -av --password-file=/etc/rsync.passwd myuser@10.10.10.10::backup local/

四、rsync使用

1、同步模式模式
1.1 本地同步
##本地  rsync   选项       源      目标
Local:  rsync [OPTION...] SRC... [DEST]

#将/etc目录备份到/opt目录下,和cp的区别在于会自动增量备份
rsync -avz /etc /opt

1.2远程同步
ssh协议
# 默认使用 SSH 进行远程登录和数据传输
# 不需要做任何配置,需要都安装rsync,操作上类似scp

#将远端文件拉(下载)到本地
Pull: rsync [OPTION...] [USER@]HOST:SRC... [DEST]
         
#将本地文件推送(上传)到远端
Push: rsync [OPTION...] SRC... [USER@]HOST:DEST
 
#将etc推送到10.10.10.10下的自定义文件夹下
rsync -az /etc/ 10.10.10.10:/opt/etc-$(hostname)-$(date +%F)
rsync协议

使用rsync协议,需要服务端启动守护进程

操作参考 配置rsync daemon

2、命令参数

常用参数

-v, –verbose详细模式输出。

-a, –archive归档模式,表示以递归方式传输文件,并保持所有文件属性不变。

-z, –compress对备份的文件在传输时进行压缩处理。

–delete:删除那些DST中存在而在SRC中没有的文件。

所有参数

-a:–archive archive mode 权限保存模式,相当于 -rlptgoD 参数,存档,递归,保持属性等。
-r:–recursive 复制所有下面的资料,递归处理。
-p:–perms 保留档案权限,文件原有属性。
-t:–times 保留时间点,文件原有时间。
-g:–group 保留原有属组。
-o:–owner 保留档案所有者(root only)。
-D:–devices 保留device资讯(root only)。
-l:–links 复制所有的连接,拷贝连接文件。
-z:–compress 压缩模式,当资料在传送到目的端进行档案压缩。
-H:–hard-links 保留硬链接文件。
-A:–acls 保留ACL属性文件,需要配合–perms。
-P:-P参数和 --partial --progress 相同,只是为了把参数简单化,表示传进度。
--version:输出rsync版本。
-v:–verbose 复杂的输出信息。
-u:–update 仅仅进行更新,也就是跳过已经存在的目标位置,并且文件时间要晚于要备份的文件,不覆盖新的文件。
--port=PORT:定义rsyncd(daemon)要运行的port(预设为tcp 873)。

--delete:删除那些目标位置有的文件而备份源没有的文件。

--delete-before: 接收者在传输之前进行删除操作

--password-file=FILE :从 指定密码文件中获取密码。
--bwlimit=KBPS:限制 I/O 带宽。
--filter “-filename”:需要过滤的文件。
--exclude=filname:需要过滤的文件。
--progress:显示备份过程。

五、示例

1、常用示例
# 将当前目录下所有文件同步到远端
rsync -avzP ./* myuser@10.10.10.15::backup 

# 从服务端同步数据到本地
rsync -avzP  myuser@10.10.10.15::backup .

# 保持服务端于客户端上数据完全一致,服务端有则同步给客户端,服务端没有,客户端有的则从客户端删除
# –delete 选项,表示客户端上的数据要与服务器端完全一致,多则删之,少则补之
# 用的时候要小心点,最好不要把已经有重要数所据的目录,当做本地更新目录,否则会把你的数据全部删除
rsync -avzP  --delete myuser@10.10.10.15::backup  /tmp/test/

# 下面的 rsync 命令将10.10.10.10主机上的 /www 目录(不包含 /www/logs 和 /www/conf子目录)复制到本地的 /backup/www/ 
rsync -avzP --delete --exclude "logs/" --exclude "conf/"  \
10.10.10.10:/www/ /backup/www/

2、快速删除大量数据

1、在need_delete 目录下建立30万个文件

time for i in $(seq 1 300000)
do
echo test >>$i.txt
done

# 执行时间
real	0m42.267s
user	0m6.756s
sys	0m33.973s

2、测试rsync删除

# 先创建一个空目录new_dir

# 然后执行 
time rsync -a --delete-before new_dir/ need_delete/

# 只需要几秒钟,速度非常快
real	0m8.146s
user	0m0.216s
sys	0m7.127s

3、测试 rm -rf 删除

time rm -rf need_delete/

real	0m9.639s
user	0m0.143s
sys	0m8.250s

六、rsyncd.conf 详解

1、全局参数
# 在独立运行时,用于指定的服务器运行的 IP 地址
address = IP

# 监听端口
port = 873 

# rsync 的守护进程将其 PID 写入指定的文件
pid file = /var/run/rsyncd.pid

# 指定支持 max connections 参数的锁文件
lock file = /var/run/rsync.lock

# 指定 rsync 守护进程的日志文件,而不将日志发送给 syslog
log file = /var/log/rsyncd.log

#========== 控制参数 =============#
 # 以指定的 UID 传输文件
uid = rsync        

# 指定该模块以指定的 GID 传输文件。
gid = rsync                     

# 禁锢推送的数据至某个目录, 不允许跳出该目录,
# 默认为 yes,则 rsync 在传输文件之前首先 chroot 到 path 参数所指定的目录下
# 这样做的原因是实现额外的安全防护,但是缺点是需要 root 权限
# 并且不能备份指向 path 外部的符号连接所指向的目录文件
use chroot = no                

# 无需让rsync以root身份运行,允许接收文件的完整属性
fake super = yes                

# 大并发连接数量以保护服务器,超过限制的连接请求将被告知随后再试
# 默认为0 (没有限制)
max connections = 200

# 超时时间
timeout = 600                  

# 指定在 rsync 服务器上运行 delete 操作时是否忽略 I/O 错误。
# 一般来说 rsync 在出现 I/O 错误时将将跳过 –delete 操作
# 以防止因为暂时的资源不足或其它 I/O 错误导致的严重问题。
ignore errors 

# 指定是否允许客户上传文件。
# 默认为true,不允许用户上传文件,
# 若为 false 并且服务器目录也具有读写权限则允许上传。
read only = false 

# 指定当客户请求列出可以使用的模块列表时,该模块是否应该被列出。
# 默认为 true,如果设置该选项为 false,可以创建隐藏的模块
list = false                  
2、模块参数

模块参数主要用于定义 rsync 服务器哪个目录要被同步。

模块声明的格式必须为 [module] 形式,这个名字就是在 rsync 客户端看到的名字,类似于 Samba 服务器提供的共享名。

而服务器真正同步的数据是通过 path 来指定的。可以根据自己的需要,来指定多个模块,模块中可以定义以下参数:

  • 基本模块参数
# 指定模块名
[backup]

# 指定当前模块在 rsync 服务器上的同步路径,该参数是必须指定的
path = /backup  	

# 给模块指定一个描述,该描述连同模块名在客户连接得到模块列表时显示给客户
comment = commit	
  • 模块文件筛选参数

# 指定多个由空格隔开的多个文件或目录(相对路径)
# 并将其添加到 exclude 列表中。这等同于在客户端命令中使用 –exclude 来指定模式。
exclude = exclude_file

# 指定一个包含 exclude 规则定义的文件名,服务器从该文件中读取 exclude 列表定义
exclude from = exclude-file.txt

# 指定多个由空格隔开的多个文件或目录(相对路径),并将其添加到 include 列表中。
# 这等同于在客户端命令中使用 –include 来指定模式 。
include = include-file.txt

# 指定一个包含 include 规则定义的文件名,服务器从该文件中读取 include 列表定义
include from = exclude-file.txt

# 一个模块只能指定一个exclude 参数、一个include 参数
# 结合 include 和 exclude 可以定义复杂的exclude/include 规则
# 这几个参数分别与相应的rsync 客户命令选项等价,唯一不同的是它们作用在服务器端


  • 模块用户认证参数
# rsync 默认匿名方式传输
# 若只配置匿名访问的 rsync 服务器,则无需设置下述参数

# 指定由空格或逗号分隔的用户名列表,只有这些用户才允许连接该模块。
# 这里的用户和系统用户没有任何关系。用户名和口令以明文方式存放在 secrets file 参数指定的文件中
auth users = user_name

# 指定一个 rsync 认证口令文件。只有在 auth users 被定义时,该文件才起作用
secrets file = /etc/rsync.passwd

# rsync 认证口令文件的权限一定是 600,否则客户端将不能连接服务器。
# rsync 认证口令文件中每一行指定一个 用户名:口令 对,格式为:
# username:passwd

# 一般来说口令最好不要超过8个字符

# 一个rsync配置文件中可以包含多个认证模块,同时一个密码文件中也可以存放多个用户和其对应的密码。
# 其中每一个认证模块可以对应不同的客户端。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐