空间数据计算引擎GeoSpark调研

空间数据包括地图、遥感影像、地形等多种类型,常以WKT、WKB、GeoJSON、NetCDF/HDF、Shapefile格式存储。Apache Sedona是一个用于大规模空间数据处理的集群计算系统,它基于Apache Spark,提供了高速、低内存消耗的空间数据计算能力,支持SpatialRDD、SpatialSQL和多种空间索引。Sedona的特性包括高效的查询性能、多种空间数据格式支持以及简单的API使用。

什么是空间数据

空间数据(Spatial Data)

空间数据又称几何数据,它用来表示物体的位置、形态、大小分布等各方面的信息,是对
现实世界中存在的具有定位意义的事物和现象的定量描述。根据在计算机系统中对地图是
对现实教想的存储组织、处理方法的不同,以及空间数据本身的几何特征,空间数据又可分为图形数据和图像数据。

来源与类型

空间数据来源和类型繁多,概括起来主要可以分为地图数据、影像数据、地形数据、属性数据和元数据。

  1. 地图数据:这类数据主要来源于各种类型的普通地图和专题地图,这些地图的内容非常丰富。
  2. 影像数据:这类数据主要来源于卫星、航空遥感,包括多平台、多层面、多种传感器、多时相、多光谱、多角度和多种分辨率的遥感影像数据,构成多元海量数据,是空间数据库最有用、最廉价、利用率最低的数据源之一。
  3. 地形数据:这类数据来源于地形等高线图的数字化,已建立的数据高程模型(DEM)和其他实测的地形数据。
  4. 属性数据:这类数据主要来源于各类调查统计报告、实测数据、文献资料等。
  5. 混合数据:这类数据来源于卫星、航空遥感与各种类型的普通地图和专题地图形成多方面数据

空间数据常用存储文件格式

1. WKT:

WKT(Well-known text)是一种文本标记语言,用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。该格式由开放地理空间联盟(OGC)制定

以下是几个几何对象WKT表示的示例:

· Point:

POINT(15 20)

注意,指定点坐标时不使用分隔用逗号。

· 具有4个点的LineString:

LINESTRING(0 0, 10 10, 20 25, 50 60)

注意,点坐标对采用逗号隔开。

· 具有1个外部环和1个内部环的Polygon:

POLYGON((0 0,10 0,10 10,0 10,0 0),(5 5,7 5,7 7,5 7, 5 5))

· 具有三个Point值的MultiPoint:

MULTIPOINT(0 0, 20 20, 60 60)

· 具有2个LineString值的MultiLineString:

MULTILINESTRING((10 10, 20 20), (15 15, 30 15))

· 具有2个Polygon值的MultiPolygon:</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值