实验拓扑图

编写Spark独立应用程序(Maven)
① 使用Scala语言编写Spark独立应用程序;
② 使用Maven工具对Spark应用程序进行编译打包。
实验原理
-> Maven
Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(Project Lifecycle),一个依赖管理系统(Dependency Management System),和用来运行定义在生命周期阶段(phase)中插件(plugin)目标(goal)的逻辑。当你使用Maven的时候,你用一个明确定义的项目对象模型来描述你的项目,然后Maven可以应用横切的逻辑,这些逻辑来自一组共享的(或者自定义的)插件。Maven 有一个生命周期,当你运行 mvn install 的时候被调用。这条命令告诉 Maven 执行一系列的有序的步骤,直到到达你指定的生命周期。遍历生命周期旅途中的一个影响就是,Maven 运行了许多默认的插件目标,这些目标完成了像编译和创建一个 JAR 文件这样的工作。此外,Maven能够很方便的帮你管理项目报告,生成站点,管理JAR文件,等等。
1. 安装Maven工具
∥ 下载maven安装包
打开浏览器,访问如下链接,下载maven安装包
拷贝代码http://file.ictedu.com/fileserver/big_data_common/data/apache-maven-3.3.9.tar.gz
下载后的安装包保存在/home/user/Downloads目录下

本文详细介绍了如何使用Maven工具配合Scala编写Spark独立应用程序。首先讲解了Maven的基本原理和安装过程,接着展示了如何创建Spark应用程序代码,包括创建目录结构,编写SimpleApp.scala代码文件。然后,通过Maven进行编译打包,生成JAR包。最后,通过spark-submit将程序提交到Spark运行,并展示了过滤输出信息的方法。通过这个实验,读者可以学习到Spark应用的开发和部署流程。
&spm=1001.2101.3001.5002&articleId=125223248&d=1&t=3&u=37e3ea9d6fea4d079ba44eae148204e0)
1393

被折叠的 条评论
为什么被折叠?



