用法示例:rsync -zavP --delete --exclude=.svn --exclude=.git --exclude=.gitignore --exclude=*.log --exclude=.gitattributes --exclude=storage /data/www/vhosts/fotophireapi.wondershare.com/ apache@172.30.0.112::apache/data/www/vhosts/fotophireapi.wondershare.com/
一、简介
rsync 是一个常用的 Linux 应用程序,用于文件同步。
它可以在本地计算机与远程计算机之间,或者两个本地目录之间同步文件(但不支持两台远程计算机之间的同步)。它也可以当作文件复制工具,替代cp和mv命令。

它名称里面的r指的是 remote,rsync 其实就是"远程同步"(remote sync)的意思。与其他文件传输工具(如 FTP 或 scp)不同,rsync 的最大特点是会检查发送方和接收方已有的文件,仅传输有变动的部分(默认规则是文件大小或修改时间有变动)。
二、安装
如果本机或者远程计算机没有安装 rsync,可以用下面的命令安装。
# Debian
$ sudo apt-get install rsync
# Red Hat
$ sudo yum install rsync
# Arch Linux
$ sudo pacman -S rsync
注意,传输的双方都必须安装 rsync。
三、基本用法
3.1 -r 参数
本机使用 rsync 命令时,可以作为cp和mv命令的替代方法,将源目录同步到目标目录。
$ rsync -r source destination
上面命令中,-r表示递归,即包含子目录。注意,-r是必须的,否则 rsync 运行不会成功。source目录表示源目录,destination表示目标目录。
如果有多个文件或目录需要同步,可以写成下面这样。
$ rsync -r source1 source2 destination
上面命令中,source1、source2都会被同步到destination目录。
3.2 -a 参数
-a参数可以替代-r,除了可以递归同步以外,还可以同步元信息(比如修改时间、权限等)。由于 rsync 默认使用文件大小和修改时间决定文件是否需要更新,所以-a比-r更有用。下面的用法才是常见的写法。
$ rsync -a source destination
目标目录destination如果不存在,rsync 会自动创建。执行上面的命令后,源目录source被完整地复制到了目标目录destination下面,即形成了destination/source的目录结构。
如果只想同步源目录source里面的内容到目标目录destination,则需要在源目录后面加上斜杠。
$ rsync -a source/ destination
上面命令执行后,source目录里面的内容,就都被复制到了destination目录里面,并不会在destination下面创建一个source子目录。
3.3 -n 参数
如果不确定 rsync 执行后会产生什么结果,可以先用-n或--dry-run参数模拟执行的结果。
$ rsync -anv source/ destination
上面命令中,-n参数模拟命令执行的结果,并不真的执行命令。-v参数则是将结果输出到终端,这样就可以看到哪些内容会被同步。
3.4 --delete 参数
默认情况下,rsync 只确保源目录的所有内容(明确排除的文件除外)都复制到目标目录。它不会使两个目录保持相同,并且不会删除文件。如果要使得目标目录成为源目录的镜像副本,则必须使用--delete参数,这将删除只存在于目标目录、不存在于源目录的文件。
$ rsync -av --delete source/ destination
上面命令中,--delete参数会使得destination成为source的一个镜像。
四、排除文件
4.1 --exclude 参数
有时,我们希望同步时排除某些文件或目录,这时可以用--exclude参数指定排除模式。
$ rsync -av --exclude='*.txt' source/ destination
# 或者
$ rsync -av --exclude '*.txt' source/ destination
上面命令排除了所有 TXT 文件。
注意,rsync 会同步以"点"开头的隐藏文件,如果要排除隐藏文件,可以这样写--exclude=".*"。
如果要排除某个目录里面的所有文件,但不希望排除目录本身,可以写成下面这样。
$ rsync -av --exclude 'dir1/*' source/ destination
多个排除模式,可以用多个--exclude参数。
$ rsync -av --exclude 'file1.txt' --exclude 'dir1/*' source/ destination
多个排除模式也可以利用 Bash 的大扩号的扩展功能,只用一个--exclude参数。
$ rsync -av --exclude={'file1.txt','dir1/*'} source/ destination
如果排除模式很多,可以将它们写入一个文件,每个模式一行,然后用--exclude-from参数指定这个文件。
$ rsync -av --exclude-from='exclude-file.txt' source/ destination
4.2 --include 参数
--include参数用来指定必须同步的文件模式,往往与--exclude结合使用。
$ rsync -av --include="*.txt" --exclude='*' source/ destination
上面命令指定同步时,排除所有文件,但是会包括 TXT 文件。
五、远程同步
5.1 SSH 协议
rsync 除了支持本地两个目录之间的同步,也支持远程同步。它可以将本地内容,同步到远程服务器。
$ rsync -av source/ username@remote_host:destination
也可以将远程内容同步到本地。
$ rsync -av username@remote_host:source/ destination
rsync 默认使用 SSH 进行远程登录和数据传输。
由于早期 rsync 不使用 SSH 协议,需要用-e参数指定协议,后来才改的。所以,下面-e ssh可以省略。
$ rsync -av -e ssh source/ user@remote_host:/destination
但是,如果 ssh 命令有附加的参数,则必须使用-e参数指定所要执行的 SSH 命令。
$ rsync -av -e 'ssh -p 2234' source/ user@remote_host:/destination
上面命令中,-e参数指定 SSH 使用2234端口。
5.2 rsync 协议
除了使用 SSH,如果另一台服务器安装并运行了 rsync 守护程序,则也可以用rsync://协议(默认端口873)进行传输。具体写法是服务器与目标目录之间使用双冒号分隔::。
$ rsync -av source/ 192.168.122.32::module/destination
注意,上面地址中的module并不是实际路径名,而是 rsync 守护程序指定的一个资源名,由管理员分配。
如果想知道 rsync 守护程序分配的所有 module 列表,可以执行下面命令。
$ rsync rsync://192.168.122.32
rsync 协议除了使用双冒号,也可以直接用rsync://协议指定地址。
$ rsync -av source/ rsync://192.168.122.32/module/destination
六、增量备份
rsync 的最大特点就是它可以完成增量备份,也就是默认只复制有变动的文件。
除了源目录与目标目录直接比较,rsync 还支持使用基准目录,即将源目录与基准目录之间变动的部分,同步到目标目录。
具体做法是,第一次同步是全量备份,所有文件在基准目录里面同步一份。以后每一次同步都是增量备份,只同步源目录与基准目录之间有变动的部分,将这部分保存在一个新的目标目录。这个新的目标目录之中,也是包含所有文件,但实际上,只有那些变动过的文件是存在于该目录,其他没有变动的文件都是指向基准目录文件的硬链接。
--link-dest参数用来指定同步时的基准目录。
$ rsync -a --delete --link-dest /compare/path /source/path /target/path
上面命令中,--link-dest参数指定基准目录/compare/path,然后源目录/source/path跟基准目录进行比较,找出变动的文件,将它们拷贝到目标目录/target/path。那些没变动的文件则会生成硬链接。这个命令的第一次备份时是全量备份,后面就都是增量备份了。
下面是一个脚本示例,备份用户的主目录。
#!/bin/bash
# A script to perform incremental backups using rsync
set -o errexit
set -o nounset
set -o pipefail
readonly SOURCE_DIR="${HOME}"
readonly BACKUP_DIR="/mnt/data/backups"
readonly DATETIME="$(date '+%Y-%m-%d_%H:%M:%S')"
readonly BACKUP_PATH="${BACKUP_DIR}/${DATETIME}"
readonly LATEST_LINK="${BACKUP_DIR}/latest"
mkdir -p "${BACKUP_DIR}"
rsync -av --delete \
"${SOURCE_DIR}/" \
--link-dest "${LATEST_LINK}" \
--exclude=".cache" \
"${BACKUP_PATH}"
rm -rf "${LATEST_LINK}"
ln -s "${BACKUP_PATH}" "${LATEST_LINK}"
上面脚本中,每一次同步都会生成一个新目录${BACKUP_DIR}/${DATETIME},并将软链接${BACKUP_DIR}/latest指向这个目录。下一次备份时,就将${BACKUP_DIR}/latest作为基准目录,生成新的备份目录。最后,再将软链接${BACKUP_DIR}/latest指向新的备份目录。
七、配置项
| 选项 | 说明 |
|---|---|
| -a, ––archive | 归档模式,表示以递归方式传输文件,并保持所有文件属性,等价于 -rlptgoD (注意不包括 -H) |
| -r, ––recursive | 对子目录以递归模式处理 |
| -l, ––links | 保持符号链接文件 |
| -H, ––hard-links | 保持硬链接文件 |
| -p, ––perms | 保持文件权限 |
| -t, ––times | 保持文件时间信息 |
| -g, ––group | 保持文件属组信息 |
| -o, ––owner | 保持文件属主信息 (super-user only) |
| -D | 保持设备文件和特殊文件 (super-user only) |
| -z, ––compress | 在传输文件时进行压缩处理 |
| ––exclude=PATTERN | 指定排除一个不需要传输的文件匹配模式 |
| ––exclude-from=FILE | 从 FILE 中读取排除规则 |
| ––include=PATTERN | 指定需要传输的文件匹配模式 |
| ––include-from=FILE | 从 FILE 中读取包含规则 |
| ––copy-unsafe-links | 拷贝指向SRC路径目录树以外的链接文件 |
| ––safe-links | 忽略指向SRC路径目录树以外的链接文件(默认) |
| ––existing | 仅仅更新那些已经存在于接收端的文件,而不备份那些新创建的文件 |
| ––ignore-existing | 忽略那些已经存在于接收端的文件,仅备份那些新创建的文件 |
| -b, ––backup | 当有变化时,对目标目录中的旧版文件进行备份 |
| ––backup-dir=DIR | 与 -b 结合使用,将备份的文件存到 DIR 目录中 |
| ––link-dest=DIR | 当文件未改变时基于 DIR 创建硬链接文件 |
| ––delete | 删除那些接收端还有而发送端已经不存在的文件 |
| ––delete-before | 接收者在传输之前进行删除操作 (默认) |
| ––delete-during | 接收者在传输过程中进行删除操作 |
| ––delete-after | 接收者在传输之后进行删除操作 |
| ––delete-excluded | 在接收方同时删除被排除的文件 |
| -e, ––rsh=COMMAND | 指定替代 rsh 的 shell 程序 |
| ––ignore-errors | 即使出现 I/O 错误也进行删除 |
| ––partial | 保留那些因故没有完全传输的文件,以是加快随后的再次传输 |
| ––progress | 在传输时显示传输过程 |
| -P | 等价于 ––partial ––progress |
| ––delay-updates | 将正在更新的文件先保存到一个临时目录(默认为 “.~tmp~”),待传输完毕再更新目标文件 |
| -v, ––verbose | 详细输出模式 |
| -q, ––quiet | 精简输出模式 |
| -h, ––human-readable | 输出文件大小使用易读的单位(如,K,M等) |
| -n, ––dry-run | 显示哪些文件将被传输 |
| ––list-only | 仅仅列出文件而不进行复制 |
| ––rsyncpath=PROGRAM | 指定远程服务器上的 rsync 命令所在路径 |
| ––password-file=FILE | 从 FILE 中读取口令,以避免在终端上输入口令,通常在 cron 中连接 rsync 服务器时使用 |
| -4, ––ipv4 | 使用 IPv4 |
| -6, ––ipv6 | 使用 IPv6 |
| ––version | 打印版本信息 |
| ––help | 显示帮助信息 |
-
若使用普通用户身份运行 rsync 命令,同步后的文件的属主将改变为这个普通用户身份。
-
若使用超级用户身份运行 rsync 命令,同步后的文件的属主将保持原来的用户身份。
八、参考链接
- How To Use Rsync to Sync Local and Remote Directories on a VPS, Justin Ellingwood
- Mirror Your Web Site With rsync, Falko Timme
- Examples on how to use Rsync, Egidio Docile
- How to create incremental backups using rsync on Linux, Egidio Docile
本文介绍了Linux应用程序rsync,它用于文件同步,可在本地或远程间操作,最大特点是仅传输有变动部分。文中详细说明了其安装、基本用法、排除文件、远程同步、增量备份等内容,还提及不同身份运行命令对文件属主的影响,并给出参考链接。

3506

被折叠的 条评论
为什么被折叠?



