Flume 与 Kafka 整合连接

最新推荐文章于 2026-05-18 16:46:20 发布

原创最新推荐文章于 2026-05-18 16:46:20 发布 · 1.7k 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#flume #kafka #大数据

BigData 专栏收录该内容

6 篇文章

订阅专栏

Flume从一个java程序接受随机生成的数据，并传至kafka，java程序通过http协议连接flume

把flume安装目录下的配置文件复制一份到任意路径如：/home/hadoop/flume.conf
进入文件修改： vi /home/hadoop/flume.conf

# Define a memory channel called ch1 on agent1
agent.channels.cnl.type = memory
agent.channels.cnl.capacity = 1000
agent.channels.cnl.thransaction = 100
agent.channels.cnl.kafka.consumer.group.id = flume-consumer

# Define an Avro source called avro-source1 on agent1 and tell it
# to bind to 0.0.0.0:41414. Connect it to channel ch1.
agent.sources.src.channels = cnl
agent.sources.src.type = http # 这里是flume通过http协议接受数据
agent.sources.src.bind = 192.168.48.101 # 主机ip地址
agent.sources.src.port = 44556 # 接受数据端口号
agent.sources.src.capacity = 10000
agent.sources.src.transactionCapacity = 100

# Define a logger sink that simply logs all events it receives
# and connect it to the other end of the same channel.
agent.sinks.kafka-sink.channel = cnl
agent.sinks.kafka-sink.type = org.apache.flume.sink.kafka.KafkaSink # 输出至Kafka
agent.sinks.kafka-sink.serializer.class = kafka.serializer.StringEncoder
agent.sinks.kafka-sink.kafka.bootstrap.servers = 192.168.48.101:9092,192.168.48.102:9092,192.168.48.103:9092,192.168.48.104:9092 # Kafka集群
agent.sinks.kafka-sink.kafka.topic = kafkatest # Kafka topic

# Finally, now that we've defined all of our components, tell
# agent1 which ones we want to activate.
agent.channels = cnl # 自定义名字
agent.sources = src # 自定义名字
agent.sinks = kafka-sink # 自定义名字

flume启动命令(配置过环境变量就不需要进入安装路径启动了)：
flume-ng agent --conf /home/hadoop --conf-file /home/hadoop/flume.conf --name agent -Dflume.root.logger=INFO,console
记得修改路径