大数据环境搭建
环境介绍
使用阿里云ecs环境,2核8G。
- jdk版本 jdk-8u211-linux-x64.tar.gz
- scala版本 scala-2.11.8.tgz
- zookeeper版本 apache-zookeeper-3.5.7-bin.tar.gz
- kafka版本 kafka_2.11-2.4.0.tgz
- hadoop版本 hadoop-3.1.3.tar.gz
- hive版本 apache-hive-3.1.2-bin.tar.gz
- hue版本 hue-master VERSION=“4.6.0”
- datax
- hbase版本 hbase-2.2.4-bin.tar.gz
- flink版本 flink-1.10.0-bin-scala_2.11.tgz
- flink-hadoop版本 flink-shaded-hadoop-2-uber-2.8.3-10.0.jar
- spark版本 spark-2.1.1-bin-hadoop2.7.tgz
- elasticsearch版本 elasticsearch-6.3.1.tar.gz
- Kibana版本 kibana-6.3.1-linux-x86_64.tar.gz
-rw-r--r-- 1 root root 278813748 Sep 25 16:26 apache-hive
本文详述了一步一步在阿里云ECS上搭建大数据环境的过程,包括免密登录、JDK、Scala、Zookeeper、MySQL、Hadoop、Hive、Hue、DataX、Kafka、Flink、HBase、Phoenix、SQuirrel SQL Client、Spark的安装配置,以及Spark与Hive的整合。还涉及到Elasticsearch、Kibana和Canal的安装,涵盖了大数据处理的多个关键组件。
订阅专栏 解锁全文

8791

被折叠的 条评论
为什么被折叠?



