Spark系列1 Spark 安装

本文介绍如何在Windows及类Unix系统(如Linux、Mac OS)上安装Spark,强调首先需要配置Java环境并正确设置JAVA_HOME。Spark支持Java8+,Python2.7+/3.4+,R 3.1+,对于Scala API,推荐使用Scala 2.11版本。
一、 Spark安装


环境要求
  
  • Spark可以在Windows和类Unix系统(例如Linux, Mac OS)上运行。
  • 运行Spark需要系统中先安装Java环境,并设置JAVA_HOME环境变量为Java的安装目录。
  • Spark运行在Java8+,Python2.7+/3.4+ 和R 3.1+。 对于Scala API, Spark 2.2.0 使用Scala 2.11。

安装  
    下载Spark:http://spark.apache.org/downloads.html
    直接下载编译好的Spark包即可,如果需要源码编译,下载源码包, 交易教程请戳:http://spark.apache.org/docs/latest/building-spark.html
    
    将下载的压缩包spark-2.2.0-bin-hadoop2.7.tgz解压到某个目录下即可。

二、运行示例和Shell

Spark自带了一些示例程序,包括Scala、Java、Python和R语言的相关示例代码在examples/src/main目录下。如果要运行Scala或Java示例程序,直接在Spark安装根目录下下运行命令 bin/run-exmple <class> [params]即可。例如:
1
./bin/run-example SparkPi 10

也可以通过Scala Shell运行Spark交互shell,如下:
1
./bin/spark-shell --master local[2]
上例中--master指定分布式集群的master URL,或本地运行的线程数, local[N]即本地运行并且线程数为N。完全的参数李彪,可以运行Spark shell --help查看。

Spark 也提供了一个Python API。使用bin/pyspark可以以Python解释器的方式与Spark交互,如下:
1
./bin/pyspark --master local[2]

示例程序也提供了python版的,示例:
1
./bin/spark-submit examples/src/main/python/pi.py 10

Spark自1.4版本开始也提供了实验性的R API,以R语言解释器运行Spark交互,如下:
1
./bin/sparkR --master local[2]

示例代码也包括R语言示例:
1
./bin/spark-submit examples/src/main/r/dataframe.R

三、相关问题

问题1  Spark不能绑定端口
    运行命令./bin/run-example SparkPi 10 报如下错误:
1
17/08/30 05:52:18 WARN Utils: Service 'sparkDriver' could not bind on a random free port. You may check whether configuring an appropriate binding address.
   解决方法:
    将 /spark/conf/spark-env.sh.template 拷贝为spark- env.sh, 并在该文件中添加
1
export  SPARK_MASTER_IP=127.0.0.1
2
export  SPARK_LOCAL_IP=127.0.0.1
    执行 spark-env.sh
本教程为官方授权出品如今大数据已经成了各大互联网公司工作的重点方向,而推荐系统可以说就是大数据最好的落地应用之一,已经为企业带来了可观的用户流量和销售额。特别是对于电商,好的推荐系统可以大大提升电商企业的销售业绩。国内外的知名电商,如亚马逊、淘宝、京东等公司,都在推荐系统领域投入了大量研发力量,也在大量招收相关的专业人才。量身定制打造的电商推荐系统项目,就是以经过修改的中文亚马逊电商数据集作为依托,并以某电商网站真实的业务架构作为基础来实现的,其中包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。具体实现的模块主要有:基于统计的离线推荐、基于隐语义模型的离线推荐、基于自定义模型的实时推荐,以及基于内容的、和基于Item-CF的离线相似推荐。整个项目具有很强的实操性和综合性,对已有的大数据和机器学习相关知识是一个系统性的梳理和整合,通过学习,同学们可以深入了解推荐系统在电商企业中的实际应用,可以为有志于增加大数据项目经验的开发人员、特别是对电商业务领域感兴趣的求职人员,提供更好的学习平台。适合人群:1.有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2.有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3.有电商领域开发经验,希望拓展电商业务场景、丰富经验的开发人员4.有较好的数学基础,希望学br习机器学习和推荐系统相关算法的求职人员
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值