分布式存储架构

大纲

一,总论

存储系统的定义
存储系统是,通过硬件(磁盘介质,网络连接)、软件和协议的协同,实现数据的存储、管理、访问和保护的完整体系。其核心目标是确保数据的持久性、可访问性、可靠性和一致性

存储的基本能力:持久化,可访问性(访问接口,可管理),可靠性(解决硬件故障),一致性(并发读写一致性)

分布存储系统,以单机存储为基础单元构建,相比单机存储提供可扩展性,大容量,高性能能力

单机存储分布式存储
持久化硬件为主raid,jbod;单机文件系统ext4以单机为单元构建
可用性文件,块,对象,生命周期管理
可靠性raid,crc副本,纠删码
一致性单机维度wal,log,事务单机+多机paxos,raft
数据分布本主机集群:无中心/有中心
可扩展性本机维度本机+多机

分布式存储核心组件

  • 控制面:元数据,分片,结点(磁盘)增减,访问接口
  • 数据面: I/O 调度,数据路由,一致性机制,数据落盘

二 业界不同架构

根据数据路由不同,以独立的元数据结点提供数据块元数据,如GFS,HDFS;通过hash规则确定结点位置,ceph,glusterfs

1 各种架构特点,比较分析出技术优缺点,适用场景,设计思想

3fs架构开源,核心技术点,优缺点

curve网易开源,架构,优缺点

daos架构,优缺点

CubeFS

JuiceFS

zstorage架构

fusionstorage

ceph

Ceph 未直接使用 Raft 或 Paxos 协议,而是基于自研的Paxos 变种(如 Monitors 间的一致性)和主从复制模型(OSD 间的数据同步)。这是因为:

  • Raft/Paxos 适合元数据管理(如 Leader 选举),但对大规模数据存储(如 PB 级对象)的复制效率较低。
  • Ceph 通过简化的多数派确认机制,在保证一致性的同时降低协议开销。

glusterfs sheepdog  fastblock

美团存储云原生探索和实践_服务_数据库_MStore
扬州万方:基于申威平台的 Curve 块存储在高性能和超融合场景下的实践 - 知乎 (zhihu.com)基于SPDK技术重构Chunkserver的Ext4 filepool。与当前社区中所采用的 Polarfs+SPDK 的方式不同,我们使用 SPDK blobstore 实现 Chunkserver 的底层存储逻辑。

2 存储技术栈

spdk框架

底层 硬盘介质,总线

driver 

rpc,rdma

服务,协议

一致性级别

三 性能

四 一致性

state machine replication 与 primary backup system 之间的区别 - 李兆龙的博客 - 博客园 (cnblogs.com)

一致性hash

一致性Hash算法原理总结 - 知乎
分布式共识算法(Paxos、Raft)-腾讯云开发者社区-腾讯云 (tencent.com)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值