目录
一、什么是StarRocks?
StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP 架构、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。
二、适用场景
StarRocks 可以满足企业级用户的多种分析需求,包括 OLAP 多维分析、定制报表、实时数据分析和 Ad-hoc 数据分析等。
OLAP 多维分析:
-
用户画像、标签分析、圈人
-
用户行为分析
-
财务报表
-
业务问题探查分析
-
高维业务指标报表
-
自助式报表平台
-
系统监控分析
-
跨主题业务分析
实时数据仓库:
-
电商大促数据分析
-
物流行业的运单分析
-
金融行业绩效分析、指标计算
-
直播质量分析
-
广告投放分析
-
管理驾驶舱
-
探针分析APM(Application Performance Management)
高并发查询:
-
广告主报表分析
-
零售行业渠道人员分析
-
SaaS 行业面向用户分析报表
-
Dashbroad 多页面分析
统一分析 :
-
通过使用一套系统解决多维分析、高并发查询、预计算、实时分析查询等场景,降低系统复杂度和多技术栈开发与维护成本。
-
使用StarRocks 来统一数据湖和数据仓库,将高并发和实时要求性很高的业务放在StarRocks中分析,把数据湖上的分析使用StarRocks外表查询,统一使用 StarRocks 管理湖仓数据。
三、系统架构
系统架构图

StarRocks的架构简洁,整个系统的核心只有FE(Frontend)、BE(Backend)两类进程,不依赖任何外部组件,方便部署与维护。同时,FE和BE模块都可以在线水平扩展,元数据和数据都有副本机制,确保整个系统无单点。
FE(Frontend)是StarRocks的前端节点,负责管理元数据,管理客户端连接,进行查询规划,查询调度等工作。FE根据配置会有两种角色:Follower和Observer。
- Follower会通过类Paxos的BDBJE协议选主出一个Leader(实现选主需要集群中有半数以上的Follower实例存活),只有Leader会对元数据进行写操作。非Leader节点会自动的将元数据写入请求路由到Leader节点。每次元数据写入时,必须有多数Follower成功才能确认是写入成功。
- Observer不参与选主操作,只会异步同步并且回放日志,主要用于扩展集群的查询并发能力。每个FE节点都会在内存保留一份完整的元数据,这样每个FE节点都能够提供无差别的服务。
BE(Backend)是StarRocks的后端节点,负责数据存储以及SQL执行等工作。
数据存储方面,StarRocks的BE节点都是完全对等的,FE按照一定策略将数据分配到对应的BE节点。在数据导入时,数据会直接写入到BE节点,不会通过FE中转,BE负责将导入数据写成对应的格式以及生成相关

StarRocks是一款高性能的分析型数据仓库,适用于OLAP多维分析、实时数据仓库和高并发查询场景。其系统架构简单,采用FE和BE节点,支持弹性扩展和数据高可用。表设计采用列式存储、稀疏索引和加速技术,提供明细、聚合、更新和主键四种数据模型。StarRocks通过多副本、分区和分桶策略实现高效数据管理和查询处理。

1万+

被折叠的 条评论
为什么被折叠?



