StarRocks学习-初识

最新推荐文章于 2026-05-22 15:47:49 发布

原创

最新推荐文章于 2026-05-22 15:47:49 发布 · 5.5k 阅读

·

5

·

标签

#数据仓库 #OLAP

StarRocks是一款高性能的分析型数据仓库，适用于OLAP多维分析、实时数据仓库和高并发查询场景。其系统架构简单，采用FE和BE节点，支持弹性扩展和数据高可用。表设计采用列式存储、稀疏索引和加速技术，提供明细、聚合、更新和主键四种数据模型。StarRocks通过多副本、分区和分桶策略实现高效数据管理和查询处理。

目录

一、什么是StarRocks？

二、适用场景

OLAP 多维分析：

实时数据仓库：

高并发查询：

统一分析：

三、系统架构

系统架构图

四、StarRocks表设计

加速数据处理

五、数据模型

一、什么是StarRocks？

StarRocks 是一款高性能分析型数据仓库，使用向量化、MPP 架构、可实时更新的列式存储引擎等技术实现多维、实时、高并发的数据分析。

二、适用场景

StarRocks 可以满足企业级用户的多种分析需求，包括 OLAP 多维分析、定制报表、实时数据分析和 Ad-hoc 数据分析等。

OLAP 多维分析：

用户画像、标签分析、圈人
用户行为分析
财务报表
业务问题探查分析
高维业务指标报表
自助式报表平台
系统监控分析
跨主题业务分析

实时数据仓库：

电商大促数据分析
物流行业的运单分析
金融行业绩效分析、指标计算
直播质量分析
广告投放分析
管理驾驶舱
探针分析APM（Application Performance Management）

高并发查询：

广告主报表分析
零售行业渠道人员分析
SaaS 行业面向用户分析报表
Dashbroad 多页面分析

统一分析：

通过使用一套系统解决多维分析、高并发查询、预计算、实时分析查询等场景，降低系统复杂度和多技术栈开发与维护成本。
使用StarRocks 来统一数据湖和数据仓库，将高并发和实时要求性很高的业务放在StarRocks中分析，把数据湖上的分析使用StarRocks外表查询，统一使用 StarRocks 管理湖仓数据。

三、系统架构

系统架构图

StarRocks的架构简洁，整个系统的核心只有FE（Frontend）、BE（Backend）两类进程，不依赖任何外部组件，方便部署与维护。同时，FE和BE模块都可以在线水平扩展，元数据和数据都有副本机制，确保整个系统无单点。

FE（Frontend）是StarRocks的前端节点，负责管理元数据，管理客户端连接，进行查询规划，查询调度等工作。FE根据配置会有两种角色：Follower和Observer。

Follower会通过类Paxos的BDBJE协议选主出一个Leader（实现选主需要集群中有半数以上的Follower实例存活），只有Leader会对元数据进行写操作。非Leader节点会自动的将元数据写入请求路由到Leader节点。每次元数据写入时，必须有多数Follower成功才能确认是写入成功。
Observer不参与选主操作，只会异步同步并且回放日志，主要用于扩展集群的查询并发能力。每个FE节点都会在内存保留一份完整的元数据，这样每个FE节点都能够提供无差别的服务。

BE（Backend）是StarRocks的后端节点，负责数据存储以及SQL执行等工作。

数据存储方面，StarRocks的BE节点都是完全对等的，FE按照一定策略将数据分配到对应的BE节点。在数据导入时，数据会直接写入到BE节点，不会通过FE中转，BE负责将导入数据写成对应的格式以及生成相关

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。