GlusterFS：原理 + 7 种卷类型 + CentOS7 集群部署 + 性能测试全攻略

翻斗包菜

456人浏览 · 2026-04-22 14:07:40

翻斗包菜 · 2026-04-22 14:07:40 发布

前言

在云计算、大数据与容器化场景高速发展的今天，传统集中式存储早已难以应对 PB 级海量数据、高并发读写与弹性扩展需求。分布式存储凭借横向扩展、高可用、高吞吐等优势，成为企业存储架构的主流选择。

GlusterFS 作为一款开源、无中心化、无元数据服务器的分布式文件系统，无需专用硬件、兼容标准 POSIX 接口、支持 TCP/IP 与 RDMA 高速网络，广泛应用于云平台、虚拟化、大数据存储、文件共享与容器持久化存储等场景。

本文基于 CentOS 7 环境，从核心原理、弹性 HASH 算法、7 种卷类型详解、集群完整部署、客户端挂载、功能 / 破坏性测试、运维命令全流程拆解，带你从零掌握 GlusterFS 生产级实践。

一、GlusterFS 核心概述

1.1 什么是 GlusterFS

GlusterFS 是开源 Scale-Out 横向扩展分布式文件系统，是 Gluster 存储方案的核心组件，可通过扩展普通 x86 服务器支撑PB 级存储容量，借助 TCP/IP 或 InfiniBand RDMA 网络整合分散存储资源，以全局统一命名空间对外提供服务。

1.2 GlusterFS 核心架构组件

GlusterFS 采用无元数据服务器设计，彻底规避传统分布式存储的单点故障与性能瓶颈，核心组件如下：

表格

组件	作用说明
Brick（存储块）	集群基本存储单元，由服务器 + 目录构成，如 node1:/data/bricks
Volume（逻辑卷）	多个 Brick 组成的逻辑设备，是数据读写与管理的核心对象
Glusterd	集群管理守护进程，所有节点必须运行，负责节点通信、卷管理、配置同步
FUSE	用户态文件系统内核模块，允许用户态程序实现文件系统，无需修改内核
VFS	内核虚拟文件系统，为上层应用提供统一磁盘访问接口
Client	挂载 GlusterFS 的客户端，通过 FUSE 与 VFS 访问集群
NFS/Samba 网关	可选组件，为非 GlusterFS 客户端提供标准协议访问

1.3 GlusterFS 核心优势

无中心化 / 无元数据：无元数据服务器，无单点故障，集群稳定性极强
弹性横向扩展：在线增删节点，不中断业务，容量与性能线性提升
全局统一命名空间：屏蔽物理存储细节，应用像访问本地目录一样使用分布式存储
模块化堆栈架构：通过 Translator 模块组合实现复制、条带、分布式等复杂功能
兼容标准协议：支持 NFS/CIFS/SMB/FUSE/HTTP，完全兼容 POSIX，应用零改造接入
自动修复：数据不一致时后台增量自愈，不占用大量系统资源
无私有格式：基于 EXT3/EXT4/XFS/ZFS 等标准文件系统，数据可直接本地读取

二、GlusterFS 工作原理深度解析

2.1 数据访问完整流程

客户端读写 GlusterFS 数据需经过VFS→FUSE→Client→Server链路，步骤如下：

应用通过挂载点发起文件操作
内核 VFS 接收请求并转发
VFS 交给 FUSE 内核模块，FUSE 通过 /dev/fuse 传递给 GlusterFS Client
Client 依据卷配置与弹性 HASH 算法定位数据所在 Brick
Client 通过网络与对应 GlusterFS Server 通信，完成数据读写
结果原路返回应用层

2.2 弹性 HASH 算法（核心）

GlusterFS 放弃元数据索引，采用Davies-Meyer 实现的弹性 HASH定位数据，是无中心化的关键：

对文件路径 / 名称计算 32 位 HASH 值
32 位整数空间按 Brick 数量 N 划分为 N 个连续子区间
每个区间对应一个 Brick，区间存在 Brick 目录扩展属性中
读写时直接 HASH 定位，无需查询中心节点

核心优点：

数据均匀分布，负载均衡
无元数据依赖，无单点瓶颈
增删节点仅重分配区间，不影响全局

三、GlusterFS 7 种卷类型详解（生产必看）

GlusterFS 支持3 种基础卷 + 4 种复合卷，覆盖大容量、高性能、高可用三大场景，以下为详细对比与选型指南。

3.1 卷类型总览表

表格

卷类型	英文名称	对应 RAID	冗余	性能	适用场景	节点要求
分布式卷	Distribute	RAID0	无	容量扩展	大容量、非核心、廉价存储	≥1
条带卷	Stripe	RAID0	无	极高大文件吞吐	超大文件、高并发读写	= 条带数
复制卷	Replica	RAID1	有	读提升 / 写下降	核心数据、高可用	= 副本数
分布式条带卷	Distribute-Stripe	RAID0 组合	无	大容量 + 高性能	海量大文件、MapReduce	条带数倍数
分布式复制卷	Distribute-Replica	RAID10	有	容量 + 高可用	生产核心业务首选	副本数倍数
条带复制卷	Stripe-Replica	RAID10	有	极高可用 + 高性能	金融 / 数据库高并发	条带 × 副本
分布式条带复制	Distribute-Stripe-Replica	三者组合	有	全场景	超大规模集群	条带 × 副本倍数

3.2 基础卷详细说明

1）分布式卷（默认）

原理：文件以完整文件为单位，按 HASH 散列到不同 Brick，不分块
特点：容量叠加、无冗余、单点故障丢数据
命令：

bash

运行

gluster volume create dis-volume node1:/e6 node2:/e6 force

2）条带卷

原理：文件切成数据块，轮询写入多个 Brick，类似 RAID0
特点：大文件性能极强、无冗余、任意节点故障文件丢失
命令：

bash

运行

gluster volume create stripe-volume stripe 2 node1:/d5 node2:/d5 force

3）复制卷（AFR）

原理：同一文件写入多个 Brick，保存多副本，类似 RAID1
特点：强冗余、读性能提升、写性能下降、容量取最小节点
命令：

bash

运行

gluster volume create rep-volume replica 2 node3:/d5 node4:/d5 force

3.3 复合卷详细说明

4）分布式条带卷

原理：先分布式定位文件，再条带分块存储
特点：大容量 + 大文件高性能，无冗余
命令：

bash

运行

gluster volume create dis-stripe stripe 2 node1:/b3 node2:/b3 node3:/b3 node4:/b3 force

5）分布式复制卷（生产最常用）

原理：先分布式定位文件，再复制多副本
特点：容量扩展 + 高可用，企业核心数据首选
命令：

bash

运行

gluster volume create dis-rep replica 2 node1:/c4 node2:/c4 node3:/c4 node4:/c4 force

6）条带复制卷

原理：条带分块 + 复制冗余，类似 RAID10
特点：极高并发读写 + 强可用，适合数据库 / 高性能存储

7）分布式条带复制卷

原理：分布式 + 条带 + 复制三者结合
特点：超大规模、PB 级、高并发、高可用，适合大型 MapReduce / 云平台

四、CentOS 7 GlusterFS 集群完整部署

本文采用4 节点 Server+1 节点 Client，系统 CentOS 7.3，关闭防火墙与 SELinux，配置主机名与 hosts 解析。

4.1 实验环境规划

服务器节点信息

表格

主机名	IP 地址	磁盘	挂载目录	角色
node1	192.168.8.134	/dev/sdb、sdc、sdd、sde	/b3、/c4、/d5、/e6	存储节点
node2	192.168.8.136	/dev/sdb、sdc、sdd、sde	/b3、/c4、/d5、/e6	存储节点
node3	192.168.8.139	/dev/sdb、sdc、sdd	/b3、/c4、/d5	存储节点
node4	192.168.8.141	/dev/sdb、sdc、sdd	/b3、/c4、/d5	存储节点
client	192.168.8.x	—	—	客户端

卷规划表

表格

卷名称	卷类型	Brick 组成	容量
dis-volume	分布式	node1:/e6、node2:/e6	12GB
stripe-volume	条带	node1:/d5、node2:/d5	10GB
rep-volume	复制	node3:/d5、node4:/d5	5GB
dis-stripe	分布式条带	node1-4:/b3	12GB
dis-rep	分布式复制	node1-4:/c4	8GB

4.2 部署前置准备（所有节点执行）

1）磁盘分区与格式化

bash

运行

# 以node1为例，分区、格式化、挂载
fdisk /dev/sdb
mkfs.xfs /dev/sdb1
mkdir /b3
mount /dev/sdb1 /b3
echo "/dev/sdb1 /b3 xfs defaults 0 0" >> /etc/fstab

2）关闭防火墙与 SELinux

bash

运行

systemctl stop firewalld
systemctl disable firewalld
setenforce 0
sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config

3）配置 hosts 解析

bash

运行

cat >> /etc/hosts << EOF
192.168.8.134 node1
192.168.8.136 node2
192.168.8.139 node3
192.168.8.141 node4
EOF

4.3 安装 GlusterFS（所有节点）

bash

运行

# 安装GlusterFS源
yum install -y centos-release-gluster
# 安装核心组件
yum install -y glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma
# 启动并开机自启
systemctl start glusterd
systemctl enable glusterd

4.4 组建集群（仅 node1 执行）

bash

运行

# 添加节点到信任池
gluster peer probe node2
gluster peer probe node3
gluster peer probe node4
# 查看集群状态
gluster peer status
# 预期：State: Peer in Cluster (Connected)

4.5 创建 5 种典型卷（node1 执行）

1）创建分布式卷

bash

运行

gluster volume create dis-volume node1:/e6 node2:/e6 force
gluster volume start dis-volume

2）创建条带卷

bash

运行

gluster volume create stripe-volume stripe 2 node1:/d5 node2:/d5 force
gluster volume start stripe-volume

3）创建复制卷

bash

运行

gluster volume create rep-volume replica 2 node3:/d5 node4:/d5 force
gluster volume start rep-volume

4）创建分布式条带卷

bash

运行

gluster volume create dis-stripe stripe 2 node1:/b3 node2:/b3 node3:/b3 node4:/b3 force
gluster volume start dis-stripe

5）创建分布式复制卷

bash

运行

gluster volume create dis-rep replica 2 node1:/c4 node2:/c4 node3:/c4 node4:/c4 force
gluster volume start dis-rep

4.6 查看卷信息

bash

运行

# 卷列表
gluster volume list
# 卷详情
gluster volume info
# 卷运行状态
gluster volume status

五、GlusterFS 客户端挂载与使用

5.1 客户端安装依赖

bash

运行

yum install -y glusterfs glusterfs-fuse

5.2 配置 hosts 与挂载目录

bash

运行

# 配置hosts
cat >> /etc/hosts << EOF
192.168.8.134 node1
192.168.8.136 node2
192.168.8.139 node3
192.168.8.141 node4
EOF
# 创建挂载目录
mkdir -p /test/{dis,stripe,rep,dis_and_stripe,dis_and_rep}

5.3 挂载所有卷

bash

运行

mount -t glusterfs node1:dis-volume /test/dis
mount -t glusterfs node1:stripe-volume /test/stripe
mount -t glusterfs node1:rep-volume /test/rep
mount -t glusterfs node1:dis-stripe /test/dis_and_stripe
mount -t glusterfs node1:dis-rep /test/dis_and_rep

5.4 开机自动挂载（/etc/fstab）

bash

运行

cat >> /etc/fstab << EOF
node1:dis-volume /test/dis glusterfs defaults,_netdev 0 0
node1:stripe-volume /test/stripe glusterfs defaults,_netdev 0 0
node1:rep-volume /test/rep glusterfs defaults,_netdev 0 0
node1:dis-stripe /test/dis_and_stripe glusterfs defaults,_netdev 0 0
node1:dis-rep /test/dis_and_rep glusterfs defaults,_netdev 0 0
EOF

5.5 查看挂载结果

bash

运行

df -h

六、功能测试 + 节点宕机破坏性测试

6.1 写入测试文件

bash

运行

# 生成5个43MB测试文件
for i in {1..5};do dd if=/dev/zero of=demo$i.log bs=1M count=43;done
# 拷贝到所有挂载目录
cp demo*.log /test/dis/
cp demo*.log /test/stripe/
cp demo*.log /test/rep/
cp demo*.log /test/dis_and_stripe/
cp demo*.log /test/dis_and_rep/

6.2 各卷文件分布验证

1）分布式卷

文件完整散列，不分块
node1 存 demo1-4，node2 存 demo5

2）条带卷

文件被切分，node1 与 node2 各存一半数据块
单个节点无法读取完整文件

3）复制卷

node3 与 node4 保存完全相同完整文件
任意节点故障不影响访问

4）分布式条带卷

先分布式定位，再条带切分
大文件性能强，无冗余

5）分布式复制卷

分布式扩容 + 复制冗余
任意单节点故障，数据完全可用

6.3 破坏性测试（核心结论）

分布式 / 条带卷：无冗余，任意 Brick 节点宕机，对应文件丢失 / 不可读
复制 / 分布式复制卷：强冗余，单节点 / 双节点故障，数据完全正常
生产建议：核心业务强制使用分布式复制卷（replica 2/3）

七、GlusterFS 日常运维命令

7.1 集群管理

bash

运行

# 添加节点
gluster peer probe <节点主机名>
# 移除节点
gluster peer detach <节点主机名>
# 查看节点状态
gluster peer status
# 查看节点列表
gluster pool list

7.2 卷管理

bash

运行

# 查看所有卷
gluster volume list
# 查看卷详情
gluster volume info <卷名>
# 启动卷
gluster volume start <卷名>
# 停止卷
gluster volume stop <卷名>
# 删除卷
gluster volume delete <卷名>
# 设置访问控制
gluster volume set <卷名> auth.allow 192.168.8.*

7.3 自愈与状态查看

bash

运行

# 查看卷运行状态
gluster volume status
# 触发数据自愈
gluster volume heal <卷名> full
# 查看自愈状态
gluster volume heal <卷名> info

八、GlusterFS 生产环境最佳实践

卷选型：非重要数据用分布式卷；核心业务用replica 2 分布式复制卷；高性能大文件用条带复制卷
节点数量：复制卷推荐 3 副本，避免脑裂；分布式复制卷推荐 4/6/8 节点
网络：生产使用10GbE+，关闭防火墙，配置 hosts，避免 DNS 故障
磁盘：使用 XFS 文件系统，独立物理盘，不与系统盘共享
高可用：客户端多路径挂载，搭配 Keepalived 实现 VIP 高可用
监控：对接 Zabbix/Prometheus 监控节点、Brick、卷状态、自愈情况
扩容：在线添加 Brick，执行 rebalance 均衡数据，不中断业务

九、总结

GlusterFS 凭借无元数据、弹性扩展、高可用、易部署、兼容标准协议等特性，成为轻量级分布式存储的首选方案。本文完整覆盖：

GlusterFS 核心架构与无中心化原理
弹性 HASH 算法与数据定位机制
7 种卷类型原理、命令、场景对比
CentOS 7 集群完整部署 + 客户端挂载
功能测试 + 节点宕机破坏性验证
生产运维命令与最佳实践

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

WalkingLab 组织入驻 AtomGit，释放高校智能体开源科研成果

AtomGit开源社区

海外动态代理行业彻底换代，AI 数据时代新标准已到来

AtomGit开源社区

全球首个！京东全栈开源JoyAI-VL-Interaction，让大模型从“一问一答”走向“边看边说”

AtomGit开源社区

所有评论(0)

查看更多评论

翻斗包菜

@2601_94969811

已为社区贡献7条内容

GlusterFS：原理 + 7 种卷类型 + CentOS7 集群部署 + 性能测试全攻略

翻斗包菜

前言

一、GlusterFS 核心概述

1.1 什么是 GlusterFS

1.2 GlusterFS 核心架构组件

1.3 GlusterFS 核心优势

二、GlusterFS 工作原理深度解析

2.1 数据访问完整流程

2.2 弹性 HASH 算法（核心）

三、GlusterFS 7 种卷类型详解（生产必看）

3.1 卷类型总览表

3.2 基础卷详细说明

1）分布式卷（默认）

2）条带卷

3）复制卷（AFR）

3.3 复合卷详细说明

4）分布式条带卷

5）分布式复制卷（生产最常用）

6）条带复制卷

7）分布式条带复制卷

四、CentOS 7 GlusterFS 集群完整部署

4.1 实验环境规划

服务器节点信息

卷规划表

4.2 部署前置准备（所有节点执行）

1）磁盘分区与格式化

2）关闭防火墙与 SELinux

3）配置 hosts 解析

4.3 安装 GlusterFS（所有节点）

4.4 组建集群（仅 node1 执行）

4.5 创建 5 种典型卷（node1 执行）

1）创建分布式卷

2）创建条带卷

3）创建复制卷

4）创建分布式条带卷

5）创建分布式复制卷

4.6 查看卷信息

五、GlusterFS 客户端挂载与使用

5.1 客户端安装依赖

5.2 配置 hosts 与挂载目录

5.3 挂载所有卷

5.4 开机自动挂载（/etc/fstab）

5.5 查看挂载结果

六、功能测试 + 节点宕机破坏性测试

6.1 写入测试文件

6.2 各卷文件分布验证

1）分布式卷

2）条带卷

3）复制卷

4）分布式条带卷

5）分布式复制卷

6.3 破坏性测试（核心结论）

七、GlusterFS 日常运维命令

7.1 集群管理

7.2 卷管理

7.3 自愈与状态查看

八、GlusterFS 生产环境最佳实践

九、总结

所有评论(0)

温馨提示：您尚未绑定手机号

翻斗包菜