https://www.bilibili.com/video/BV1L4411K7hW?p=31&spm_id_from=pageDriver
架构:
Zookeeper 66,88,99
HDFS NameNode 66,88
MR RM 66,88
HDFS DataNode 66,88,99
MR NodeManager 66,88,99
生产Flume 66,88
Kafka 66,88,99
消费Flume 66,88
Hive 88
Hive 的MetaDB Mysql 66
数据流
生产Flume读取日志文件做简单ETL后写入到kafka,然后消费Flume从kafka中将数据读出写入到hdfs。项目中还应用了zookeeper来协调分布式kafka和分布式Hadoop。

本文介绍了大数据项目实战,主要涉及电商埋点日志的分析。首先制作埋点日志dummy文件,然后搭建Hadoop环境,接着配置Flume从日志文件读取数据并写入Kafka。再安装Kafka,启动Flume agent并使用Kafka Manager监控。最后,配置消费Flume将数据从Kafka读取并写入HDFS。
&spm=1001.2101.3001.5002&articleId=118423464&d=1&t=3&u=d210a1bb9c0f4a12b6ebcf0e624d42b0)
4万+

被折叠的 条评论
为什么被折叠?



