利用spark读取phoenix(phoenix-spark)

最新推荐文章于 2026-03-22 01:05:02 发布

原创

最新推荐文章于 2026-03-22 01:05:02 发布 · 置顶 · 6.9k 阅读

标签

#spark #phoenix #phoenix-spark

收录于

为何不是jdbc访问phoenix？

具体原因参照phoenix官网地址：(https://phoenix.apache.org/phoenix_spark.html)

为何不是官网提倡的访问方式？

官网提倡：

import org.apache.spark.SparkContext
import org.apache.spark.sql.SQLContext
import org.apache.phoenix.spark._

val sc = new SparkContext("local", "phoenix-test")
val sqlContext = new SQLContext(sc)

val df = sqlContext.load(
  "org.apache.phoenix.spark",
  Map("table" -> "TABLE1", "zkUrl" -> "phoenix-server:2181")
)

df
  .filter(df("COL1") === "test_row_1" && df("ID") === 1L)
  .select(df("ID"))
  .show

但是实际上，spark2.0+版本已经不建议使用sqlContext.load（）方法了，而且这种方式也有一些bug会导致phoenix数据取不出来。

正确的连接phoenix的姿势！！！

主要代码如下：

val spark = SparkSession.builder()
      .master("local[*]")
      .getOrCreate()

    val conf = new Configuration
    conf.addRe

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

枫叶的落寞

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Spark 实战系列】Phoenix 整合 spark 进行查询分析

JasonLee实时计算

11-17

994

Phoenix 是一个开源的 HBASE SQL 层。它不仅可以使用标准的 JDBC API 替代 HBASE client API 创建表，插入和查询 HBASE，也支持二级索引、事物以及多种 SQL 层优化。

4 条评论您还未登录，请先登录后发表或查看评论

学习笔记：Spark 读取和写入Phoenix数据

瑞瑞ruirui的博客

12-09

2907

Phoenix 是使用 Java 编写的一个开源项目，基于在 HBase 之上的一个 SQL 层，能让我们通过标准的 JDBC API 读写 HBase，而不用 scan 或者 get 的方式，其实底层是将 SQL 编译成原生的 HBase scans 进行查询。引入依赖： <dependency> <groupId>org.apache.phoenix</groupId> <artifactId&g

逆向实战：Unidbg辅助DFA攻击还原白盒AES密钥

热门推荐

安小飞的博客

01-24

1万+

此篇文章主要介绍用spark如何读取hbase中的数据。 spark官方提供了用spark直接读取hbase的方法，但是直接读取hbase的数据类似于hbase shell中的scan方法全表扫描，当然如果知道rowkey当然就不会有什么问题，但是在真实的业务场景中onebyone通过rowkey去取hbase的数据是不现实的，这样也没用必要用spark去跑数据，因为发挥不出spark的性

Spark教程——（6）Spark-shell基于Phoenix访问HBase数据

weixin_30369087的博客

07-03

285

package statistics import common.util.timeUtil import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.sql.SQLContext import org.apache.spark.sql.functions.{col, count, sp...

大数据（5e）Spark之Scala读写HBase之Phoenix表

ArYe

08-28

1069

Phoenix建表依赖写 HBaseConfiguration.create 读 phoenixTableAsDataFrame

Phoenix-基于HBase的低延迟操作头歌——答案

大家一起入坑

06-19

1766

目录第1关：Phoenix初识第2关 Phoenix 查询和更新第3关 Phoenix 二级索引第4关 Phoenix Spark操作第2关 Phoenix 查询和更新第3关 Phoenix 二级索引第4关 Phoenix Spark操作

Phoenix实现用SQL查询HBase

weixin_30337157的博客

12-02

584

博客已转移，请借一步说话，http://www.daniubiji.cn/archives/111 HBase，一个NoSQL数据库，可存储大量非关系型数据。 HBase，可以用HBase shell进行操作，也可以用HBase Java api进行操作。HBase虽然是一个数据库，但是它的查询语句，很不太好用。要是能像使用Mysql等关系型数据库一样用sql语句操作HBase，那...

phoenix+hbase+Spark整合，Spark处理数据操作phoenix入hbase，Spring Cloud整合phoenix

涂作权的博客

03-19

8062

1 版本要求 Spark版本：spark-2.3.0-bin-hadoop2.7 Phoenix版本：apache-phoenix-4.14.1-HBase-1.4-bin HBASE版本：hbase-1.4.2 上面的版本必须是对应的，否则会报错 2 Phoenix + HBase + Spark整合 A:安装HBASE,这里略，默认都会 B:Phoenix + HBASE整合，参考：ht...

spark+phoenix读取hbase

潮落拾贝

01-18

1002

这是phoenix官网提供的代码，我执行没成功，显示org.apache.phoenix.spark.datasource.v2.PhoenixDataSource这个找不到，我不知道是我依赖包没引对还是其他原因，我的代码在上面的基础上做了一些改动。然后解压缩，将里面的phoenix-server-hbase-2.4-5.1.3.jar（你的版本可能和我下载的不一致，这个根据hadoop上安装的hbase的版本来定）拷贝到hbase/lib/目录下，然后重启hbase。最后执行成功的结果如下所示。

Spark——Spark读写Phoenix

aof

07-20

957

文章目录1. Spark加载Phoenix表2. Spark持久化数据到Phoenix保存RDD到Phoenix保存DataFrame到Phoenix Phoenix为NoSQL数据库HBase提供了标准SQL和JDBC API的强大功能，且具备完整的ACID事务处理能力。对于小数据量的查询，其性能可以达到毫秒级别；对于数千万行的数据，其性能也可以达到秒级。要使用phoenix-spark插件，需要在项目中添加如下依赖： <dependency> <groupId>

spark操作操作Phoenix

qq_41018861的博客

06-16

699

phoenix结合spark配置在Spark运行环境中添加Phoenix依赖，需要在spark-env.sh添加如下代码: #添加Phoenix依赖 for file in $(find /opt/hbase-1.2.4/lib |grep phoenix) do SPARK_DIST_CLASSPATH="$SPARK_DIST_CLASSPATH:$file" done export SPARK_DIST_CLASSPATH 这样每次启动spark任务都会将phoenix的jar包添加到c

Phoenix 中如何使用Spark

厚积薄发

07-19

2711

大数据组件详解：Spark、Hive、HBase、Phoenix 与 Presto

fudaihb的博客

09-12

3603

随着大数据技术的快速发展，各种大数据处理框架和工具也应运而生。其中，Spark、Hive、HBase、Phoenix 和 Presto 是广泛应用于大数据领域的几款核心组件，它们各自擅长处理不同类型的大数据任务。本文将详细介绍这些技术的特点、应用场景以及它们之间的区别和联系。

Spark批处理读写Phoenix

邢为栋

03-19

947

关于Spark读写Phoenix，我找到两种方法，整理成笔记，用作备忘。方法一 Phoenix官方提供了Spark插件，可以激活Spark和Phoenix的交互。地址：http://phoenix.apache.org/phoenix_spark.html 如果使用CDH，Cloudera也提供了相应的工具，来实现Spark和Phoenix的交互。地址：https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/phoenix_spa

Spark教程——（10）Spark SQL读取Phoenix数据本地执行计算

weixin_30765475的博客

09-19

1037

添加配置文件phoenixConnectMode.scala ： package statistics.benefits import org.apache.hadoop.conf.Configuration import org.apache.spark.sql.{DataFrame, SQLContext} import org.apache.phoenix.spa...

Phoenix之JDBC整合Spark

南风知我意

07-07

885

spark 通过Phoenix操作Hbase