Hive 、Impala的用法相同,Hive直接输入hive就能启动,Impala使用Impala-shell命令进行启动
下面用一道题进行讲解这个过程:
给定一个企业对员工进行的安全培训数据表TrainingRecord(如下图),包括姓名(Name),培训日期(Date)和培训小时数(Hours),请写出相应的SQL查询回答下列问题:
(1)查询每个员工的总培训小时数,平均培训时长和培训次
本文介绍了如何使用HDFS将本地文件上传至HDFS,然后通过Hive和Impala从HDFS读取文件进行建表。详细步骤包括启动Hive和Impala shell,创建HDFS目录,上传文件,以及编写SQL查询来统计员工的培训小时数、平均时长和次数。示例数据包括员工的安全培训记录,通过查询找出总培训小时数超过8小时的员工。
Hive 、Impala的用法相同,Hive直接输入hive就能启动,Impala使用Impala-shell命令进行启动
下面用一道题进行讲解这个过程:
给定一个企业对员工进行的安全培训数据表TrainingRecord(如下图),包括姓名(Name),培训日期(Date)和培训小时数(Hours),请写出相应的SQL查询回答下列问题:
(1)查询每个员工的总培训小时数,平均培训时长和培训次
3479

被折叠的 条评论
为什么被折叠?
读取本地文件到HDFS,再使用Hive(Impala)从HDFS读取文件进行建表&spm=1001.2101.3001.5002&articleId=81127130&d=1&t=3&u=e2204b1755314955824afadf1ec7c587)