助力“新基建” | 基于StreamWorks构建实时大数据处理平台

本文介绍了基于StreamWorks构建的实时大数据处理平台,强调实时计算在数据ETL、数据分析和事件驱动应用中的作用。StreamWorks提供实时采集、开发、运维等功能,支持FlinkSQL,简化实时业务开发,助力企业数智化转型和‘新基建’建设。

2020年春节期间,一场突如其来的疫情在全国蔓延开来,打破了大家原有的工作生活节奏。疫情期间,大家宅在家就能随时看到实时的大数据疫情地图,可以随时刷到自己当前感兴趣的抖音视频,这一切背后依赖的最重要的技术,就是实时大数据处理技术。

现在疫情即将过去,国家提出要加快大数据中心等新型基础设施建设,实时大数据处理平台建设成为企业数智化转型过程中越来越重要的部分。

什么是实时计算

在大数据处理领域,通常根据数据的不同性质,将任务划分为实时计算与离线计算,以温度传感器的场景举例:假设某城市安装了大量的温度传感器,每个传感器每隔1min上传一次采集到的温度信息,由气象中心统一汇总,每隔5分钟更新一次各个地区的温度,这些数据是一直源源不断的产生的,且不会停止。实时计算就主要用于“数据源源不断的产生,而且不会停止,需要以最小的延迟获得计算结果”的场景,这种最小的延迟通常为秒级或分钟级。

为了满足这种数据量很大,而且实时性要求又非常高的场景,通常会采用实时计算技术,实时计算的“数据源源不断”的特定决定了其数据处理方式与离线是截然不同的。

与离线计算的批量、高延时、主动发起的计算特点不同,实时计算是一种持续、低延时、事件触发的计算任务。离线计算需要先装载数据,然后提交离线任务,最后任务计算返回结果;实时计算首先要提交流式任务,然后等实时流数据接入,然后计算出实时结果流。

形象点可以理解为离线计算是开着船去湖里(数据库)打渔,实时计算为在河流(数据流)上建立大坝发电。进一步发散,湖泊的形成依赖河流,河流确定上下边界就是湖泊;其实,离线计算可以理解为实时计算的一种特例。

实时计算能解决的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值