大纲
一,总论
存储系统的定义:
存储系统是,通过硬件(磁盘介质,网络连接)、软件和协议的协同,实现数据的存储、管理、访问和保护的完整体系。其核心目标是确保数据的持久性、可访问性、可靠性和一致性。
存储的基本能力:持久化,可访问性(访问接口,可管理),可靠性(解决硬件故障),一致性(并发读写一致性)
分布存储系统,以单机存储为基础单元构建,相比单机存储提供可扩展性,大容量,高性能能力
| 单机存储 | 分布式存储 | |
| 持久化 | 硬件为主raid,jbod;单机文件系统ext4 | 以单机为单元构建 |
| 可用性 | 文件,块,对象,生命周期管理 | |
| 可靠性 | raid,crc | 副本,纠删码 |
| 一致性 | 单机维度wal,log,事务 | 单机+多机paxos,raft |
| 数据分布 | 本主机 | 集群:无中心/有中心 |
| 可扩展性 | 本机维度 | 本机+多机 |
分布式存储核心组件
- 控制面:元数据,分片,结点(磁盘)增减,访问接口
-
数据面: I/O 调度,数据路由,一致性机制,数据落盘
二 业界不同架构
根据数据路由不同,以独立的元数据结点提供数据块元数据,如GFS,HDFS;通过hash规则确定结点位置,ceph,glusterfs
1 各种架构特点,比较分析出技术优缺点,适用场景,设计思想
3fs架构开源,核心技术点,优缺点
curve网易开源,架构,优缺点
daos架构,优缺点
CubeFS
JuiceFS
zstorage架构
fusionstorage
ceph
Ceph 未直接使用 Raft 或 Paxos 协议,而是基于自研的Paxos 变种(如 Monitors 间的一致性)和主从复制模型(OSD 间的数据同步)。这是因为:
- Raft/Paxos 适合元数据管理(如 Leader 选举),但对大规模数据存储(如 PB 级对象)的复制效率较低。
- Ceph 通过简化的多数派确认机制,在保证一致性的同时降低协议开销。
glusterfs sheepdog fastblock
美团存储云原生探索和实践_服务_数据库_MStore
扬州万方:基于申威平台的 Curve 块存储在高性能和超融合场景下的实践 - 知乎 (zhihu.com)基于SPDK技术重构Chunkserver的Ext4 filepool。与当前社区中所采用的 Polarfs+SPDK 的方式不同,我们使用 SPDK blobstore 实现 Chunkserver 的底层存储逻辑。
2 存储技术栈
spdk框架
底层 硬盘介质,总线
driver
rpc,rdma
服务,协议
一致性级别
三 性能
四 一致性
state machine replication 与 primary backup system 之间的区别 - 李兆龙的博客 - 博客园 (cnblogs.com)
一致性hash
一致性Hash算法原理总结 - 知乎
分布式共识算法(Paxos、Raft)-腾讯云开发者社区-腾讯云 (tencent.com)

2万+

被折叠的 条评论
为什么被折叠?



