地物分类对城市规划和资源管理至关重要,但是传统统计方法进行的遥感影像分类存在“同物异谱”或者“异物同谱”的问题,为了使遥感影像分类高效、准确,本文通过构建一个基于BP神经网络的分类模型,对京津冀地区的典型地物数据集进行分类研究。
研究过程中首先对京津冀地区landsat8 OLI遥感影像数据进行了辐射定标、大气校正、图像融合,对京津冀遥感影像数据集进行光谱特征和纹理特征提取,将地物划分为耕地、建筑物、水体 道路、林地、裸地,并创建标签数据集,并将数据集以7:3的比例划分为训练集和测试集作为本研究的数据集,搭建并初始化BP神经网络分类模型进行分类。为了最小化分类误差,本研究使用梯度下降法与自适应学习率相结合的方法优化BP神经网络,并对结果进行混淆矩阵运算。最后,使用搭建成功的模型进行京津冀地区的分类,并进行可视化界面的开发与展示。
为了更好的评估本模型的性能,将BP神经网络京津冀地物分类模型进行混淆矩阵的计算发现模型分类准确率为79%,对选取的典型地物耕地、建筑物、水体、道路、林地、裸地的分类准确率分别为72%、90%、94%、71%、73%,对比传统监督分类中的最小距离准确率69%和最大似然分类结果准确率76%,发现BP神经网络模型在京津冀地区典型地物分类的任务中表现出较好的性能,且对于水体、建筑物有较好的分类效果。
本研究的分类结果对于解决京津冀地区的地物分类问题具有重要意义,可以为京津冀城市规划和资源管理提供精确的信息,有助于决策制定和资源分配,为进一步改进和优化相关技术提供了有益的参考。
关键字:BP神经网络 地物分类 京津冀地区 模型评估
Abstract
Content classification is very important to urban planning and resource management, but the traditional statistical method of remote sensing image classification is "spectrum" or "foreign body spectrum" problem, in order to make the remote sensing image classification efficient and accurate, this paper by building a classification model based on BP neural network, classification research of typical features data set of Beijing-Tianjin-Hebei region.
In the process of research on the Beijing-Tianjin-Hebei region landsat8 OLI remote sensing image data radiation calibration, atmospheric correction, image fusion and of Beijing-Tianjin-Hebei remote sensing image data set spectral features and texture feature extraction, the features into cultivated land, buildings, water road, forest land, bare land, and create labels, data set and training set and test set as 7:3 ratio, set up and initialize BP neural network classification model for classification. To minimize the classification error, this study used the combination of the gradient descent method with the adaptive learning rate to optimize the BP neural network and perform the confusion matrix operation on the results. Finally, the successful model was used to classify the Beijing-Tianjin-Hebei region, and the visualization interface was developed and displayed.
In order to better evaluate the performance of the model, the BP neural network of Beijing-Tianjin-Hebei features classification model calculation confusion matrix found model classification accuracy of 79%, to select typical features of land, buildings, water, roads, woodland, bare land, 72%, 90%, 94%, 71%, 73%, compared with the traditional supervision classification of the minimum distance accuracy of 69% and maximum likelihood classification accuracy of 76%, found that BP neural network model in the Beijing-Tianjin-Hebei region typical features classification task showed good performance, and for has a good classification effect of water and buildings.
The classification results of this study are of great significance for solving the land classification problem in the Beijing-Tianjin-Hebei region, and can provide precise information for urban planning and resource management in the Beijing-Tianjin-Hebei region, contribute to decision making and resource allocation, and provide a useful reference for further improvement and optimization of related technologies.
Keywords:BP neural network Classification of earth objects Beijing-Tianjin-Hebei region Model evaluation
目 录
1.1 研究背景及意义
遥感技术是一项依靠电磁波完成地物探测的技术手段,不段增长的人口危机和环境破坏问题也成为人类可持续发展道路的一大难题,这也人们对地球资源环境的探索也不断深入,人们必须通过技术手段来获取地球能源信息。而现在,计算机技术和空间技术的发展,人类航天技术和卫星技术的不断进步,人们能够获取到的关于地球的遥感影像数据越来越多,越来越丰富,如何处理这些急剧增长的数据量也成为难点[1]。
遥感影像的分类是遥感技术应用中的重要一环[2],是研究地区发展和地理信息的重要参考技术,对于地图测绘、目标识别、军事领域都具有重要研究价值和意义。但是,采用传统的遥感影像分类方法进行分类的遥感影像仍然存在许多的问题,“同物异谱”和“异物同谱”的问题层出不穷。同时,随着遥感数据获取手段的加强,需要处理的遥感信息量急剧增加,使得遥感影像分类的过程更加艰难。
近几十年,随着我国遥感工作者持续不断的努力,中国的遥感技术已经取得了世界级的成果。遥感技术的飞速发展和遥感影像数据的规模化也使得遥感技术被广泛应用于国民经济发展的各个方面,如土地资源调查和管理、农作物估产、地质勘查、海洋环境监测、灾害监测、全球变化研究等,形成了适合中国国情的技术发展和应用推广模式。
20世纪以来,国内外工作者不断改进遥感影像分类方法,将其与神经网络、机器学习相结合,探索创造出了许多更加高效、准确的遥感影像分类方法,这也成为推动遥感分类技术发展的巨大动力。
人工神经网络作为一种强大的机器学习算法,在模式识别和分类任务中具有广泛应用[3]。本文的研究正是基于人工神经网络中的BP神经网络,旨在解决京津冀地区典型地物分类问题。通过本次研究,可以提高京津冀地区典型地物分类的准确性,为相关领域的决策提供准确的基础数据支持。
人工神经网络是模拟人类审题头脑和神经网络组织进行抽象思考和仿真,对数据进行处理的模式,1943年由心理学家Warren McCulloch和数理逻辑学家Walter Pitts提出的MP模型(单层感知网络)做为最初的神经网络,为人工神经网络的发展奠定了基础[3]。但是随着人们对人工神经网络的深入研究,人们发现它存无法处理非线性问题的不足。解决非线性问题的唯一途径是采用多层前馈网络,即在输入层和输出层之间加上隐含层,构成多层前馈感知器网络。
1986年由Rumelhart和McClelland为首的科学家提出的BP(Back Propagation)神经网络概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,具有任意复杂的模式分类能力和优良的多维函数映射能力,解决了简单感知器不能解决的异或(Exclusive OR,XOR)和一些其他问题,解决了多层神经网络隐含层连接权学习问题[4],并在数学上给出了完整推导。人们把采用这种算法进行误差校正的多层前馈网络称为BP网络,BP网络常应用于模式识别,回归预测等,是应用最广泛的神经网络模型之一[2]。
1992年,人工神经网络被Kanellopoulos应用于SPOT图像分类,将其分类了20个对象并将分类的结果与其他方法进行比较,证实人工神经网络应用于图像分类具有良好的效果[5],2001年J. Zhang使用神经网络对进行郊区土地覆盖检测并表明了其优于传统统计方法[6];2010年Gonzalo等人将纹理特征与Hop filed神经网络结合进行分类,分类精度达到89%[7].
近几十年来,在我国,人工神经网络在图像识别,土地分类等领域取得了显著的成果,2000年贾永红将人工神经网络应用于多源遥感影像分类中,证实了人工神经网络在遥感影像分类中的良好效果[8],;2007年,赵泉华,宋伟基等人提出分形纹理的BP神经网络遥感影像分类,同样取得较好的结果[9],20016年曹兆伟等人对海岛地区遥感影像进行神经网络分类,并与非监督分类及最大似然、最小距离的分类结果比较[10],发现优于这两种算法。
我国研究人员对于BP神经网络的学习和发展以及其在遥感影像分类领域的探索有着强烈的追求,这也促使BP神经网络在遥感领域的应用越来越广泛,更大大推动了我国遥感技术的发展及应用。
本研究的旨在使用BP神经网络完成BP神经网络模型搭建,并运用模型为京津冀遥感影像进行分类,研究结果可以为京津冀地区的城市规划和资源管理提供科学支持:地物分类对于城市规划、资源管理和环境保护等领域具有重要意义
本研究采用了BP神经网络对京津冀地区进行典型的地物分类,对获取的遥感影像进行预处理过程和特征提取,制作标签样本,与传统的BP神经网络分类相比,本文在对BP神经网络的参数传递过程中增加了梯度下降和自适应学习率的方法来减小误差,与监督分类中的最大似然分类方法和最小距离分类方法进行对比,得到了BP神经网络算法较两种分类方法相比具有明显优势的结论,并使用构建的BP神经网络分类模型完成了对京津冀遥感影像的分类。
本研究的分类结果为京津冀地区的城市规划和资源管理提供科学支持:地物分类对于城市规划、资源管理和环境保护等领域具有重要意义。证实了BP神经网络遥感影像分类是一种高效准确的地物分类方法,为京津冀地区的城市规划和资源管理决策提供科学支持,帮助准确获取和利用地物信息。
同时,这些分类结果可以为土地利用规划提供重要的数据支持,帮助决策者了解不同地区的土地利用状况,制定合理的土地利用政策和规划。BP神经网络对遥感影像进行分类,识别和监测城市扩张过程中的建设用地变化有助于及时掌握城市扩张的情况,为城市规划和土地资源管理提供科学依据。
1.4 论文结构
第一章是论文的绪论,阐述了本论文研究工作的背景、实际价值以及国际国内的研究成果,详细说明本论文的研究目标与内容。
第二章介绍了京津冀研究区的特点,并进行了影像分类处理工作之前的预处理。一般涵盖辐射定标、大气校正、辐射校正、影像融合以及图像裁剪,为之后的分类处理提供数据信息支持。
第三章是通过PyQt5和Qt design进行软件的设计与搭建,完成BP神经网络分类系统的可视化过程,借助图形手段清晰的传达出分类的信息。
第四章总体解释了BP神经网络的算法原理以及特征,同时具体说明文章里选择的 BP网络算法的相关理论、算法机理以及使用梯度下降和自适应学习率对BP模型参数进行优化,为之后的论述提供理论支持。
第五章是对上述分类结果的分析与总结获得最后的结果,对分类结果制图,同时对其结果予以检验与分析,将BP神经网络分类器与非监督分类方法和最小距离分类进行对照,最后获得有关BP神经网络优势的实际结论。
第六章是结论,总结本文的研究内容,并对该项研究的未来进行展望。
第2章 研究区和研究方法
2.1 研究区介绍
京津冀研究区,也被称为京津冀协同发展区或北京-天津-河北协同发展区,是中国境内一个重要的经济区域,位于华北地区。该区域由北京市、天津市和河北省的部分地区组成,面积约为21.1万平方公里。
京津冀研究区地貌复杂多样。北部的北京市和天津市主要是平原地区,地势相对较为平坦。南部的河北省则包括了平原、丘陵、山地等多种地貌类型,如河北平原、太行山脉等。京津冀地区是中国重要的粮食生产基地之一,农田面积较大;该地区有一定面积的森林和林地;京津冀地区有广阔的草地,草地覆盖主要分布在河北省的山区和辽河平原等地;京津冀地区有多条重要的河流,如黄河、海河和津浦水系;随着经济的发展和城市化进程,京津冀地区的城市和人工用地不断扩大。北京和天津是中国重要的城市中心,河北省的大部分地区也呈现出城市化快速发展的趋势[12],如图2-1为本研究的研究区域京津冀地区。

图2-1 京津冀研究区
2.2 技术路线
本研究主要的研究内容和技术路线如图2-2所示,首先获取影像数据进行预处理,在将影像进行特征提取,制作带标签的数据集并划分训练集和测试集,初始化网络结构和参数,使用训练集进行网络的训练,并在迭代的过程中完成优化和参数的更新直到得到较好精度模型并输出模型[13],最后对分类结果进行精度验证。

图2-2 技术路线
2.3 数据预处理
本论文研究的是京津冀地区的典型地物,本次研究采用landsat8 OLI数据卫星数据产品,数据时间为2021年3月份至5月份,应用数据为北京、天津、河北三个地区影像;landsat8的OLI陆地成像仪包括下表所示的9个波段,其原始数据以进行过几何校正,选择2021年3月份至5月份京津冀地区的影像作为研究材料。landsat8 OLI传感器数据介绍如表2-1所示。
表2-1 landsat8 OLI传感器数据说明
| OLI陆地成像仪 | ETM+ | ||||
| 波段名称 | 波段(μm) | 空间分辨率(m) | 波段名称 | 波段(μm) | 空间分辨率(m) |
| Band1Coastal | 0.433-0.453 | 30 | |||
| Band2Blue | 0.450-0.515 | 30 | Band1Blue | 0.450-0.515 | 30 |
| Band3Green | 0.525-0.600 | 30 | Band2Green | 0.525-0.605 | 30 |
| Band4Red | 0.630-0.680 | 30 | Band3Red | 0.630-0.690 | 30 |
| Band5NIR | 0.845-0.885 | 30 | Band4NIR | 0.775-0.900 | 30 |
| Band6SWIR1 | 1.560-1.651 | 30 | Band5SWIR1 | 1.550-1.750 | 30 |
| Band7SWIR2 | 2.100-2.300 | 30 | Band7SWIR2 | 2.090-2.350 | 30 |
| Band8Pan | 0.500-0.680 | 15 | Band8Pan | 0.520-0.900 | 15 |
| Band9Cirrus | 1.360-1.390 | 30 | |||
本次研究过程中使用的分类数据通过ENVI ROI进行选取并输出,将数据集划分为训练集、测试集两部分,使用训练集数据对搭建的BP神经网络进行训练和学习,使用测试集完成验证,当达到较好的精度或到达迭代次数时,模型搭建成功,使用此模型对获取的京津冀遥感影像进行分类得出分类结果。
2.3.1辐射定标和大气校正
辐射定标和大气校正是进行遥感影像分析的首要工作,此次研究为达到完整的研究软件过程,在Python环境下来实现两部分内容。
考虑研究所采用到的遥感影像数据较为庞大,通过预处理-拼接-裁剪的过程进行预处理,本次研究过程中裁剪结束后北京、河北、天津的遥感影像大小分别为6GB、10GB、5GB。
辐射定标的过程中反映了遥感传感器接收到的电磁辐射的强度或能量,它是将遥感影像中的数字值(DN,DigitalNumber)转换为辐射值或辐射亮度值的过程,遥感光谱辐射定标时的转换算式为:

) (2-1)
单位:mWc

-2ster-1mm-1
其中

为辐射亮度值,Bias是偏移量,Gain是增益,DN是像元值
遥感影像的预处理流程图如图2-3所示

图2-3 遥感影像预处理流程图
由于landsat8OLI影像已经经过几何校正,本次研究不需再进行,研究过程中使用6S模型技术实现landsat8OLI数据的大气校正过程,6S模型属于基于物理模型的绝对辐射校正,是利用电磁波在大气中的辐射传输原理搭建的模型对遥感影像大气校正的方法,校正精度较高。
6S模型大气校正主要的参数包括几何参数(卫星及太阳的天顶角、方位角)、气溶胶光学厚度、水蒸汽、臭氧、高程等[14],在使用Python环境进行6S模型大气校正时,可以直接调用Py6s库(基于Python的6S模型接口)来自动计算和应用6S模型参数,以实现Landsat8OLI影像的大气校正,使用6S模型完成大气校正后的光谱曲线图如图2-4所示。

图2-4 6S模型大气校正光谱曲线图
图像融合将多光谱影像与全色影像结合在一张影像中,使这张影像具有全色影像较高的分辨率,又可以和多光谱一样可以精细的描述目标光谱,含有更丰富的信息,本次研究通过重写GDAL库中的gdal_pansharpen库完成遥感影像全色影像和多光谱影像的融合过程,图2-5为遥感影像融合前后对比图,可以发现,融合后的遥感影像精度更高,较原来的影像,数据量更大。


图2-5 图像融合前(左图)和图像融合后(右图)
此研究采用对融合图像基于ENVI进行裁剪,本次研究是针对京津冀三个区域的研究,因而需要拼接后的遥感影像进行矢量裁剪的操作,将问题聚焦在我们需要研究的三个行政区内,得到裁剪后图像图2-6所示。
裁剪和融合将对大幅影像进行调整,以河北省影像为例,其操作过程可以分为:预处理-分块处理--分类处理-拼接,此过程可以保证在内存相对较小的计算机上可以较好的进行影像处理和分类。同时,这种做法会使处理、分类时间大幅度增加,增大处理周期。



图2-6 裁剪后的天津影像,裁剪后的河北省影像,裁剪后的北京影像
通过使用Python进行遥感影像的预处理,对遥感影像进行辐射定标和大气校正,与ENVI处理结果进行对比发现结果无异,证实对遥感影像进行预处理可以通过代码来完成,实现自动化的辐射定标和大气校正过程。
在ENVI中进行上述辐射定标、Flash快速大气校正,图像融合,输出的影像如图2-7右图所示,与使用python代码完成的遥感影像进行对比,发现使用python代码完成的遥感影像与在ENVI中完成的结果相同.


图2-7在python中进行预处理的结果(左)在ENVI中进行预处理的结果(右)
特征提取是计算机提取到影像特征性信息的方法及过程,其主要作用是特征降维和提取特征方便后续的机器学习,就是将图像或者事物简化成只有显著特点的一个过程,对于机器学习的识别来讲,如何在图片中将猫识别出来首先就是提取出猫所具有的特征。
特征可以理解为数字,在进行计算过程中,数值越大,特征越强烈。针对遥感影像数据的特征提取,地物具有光谱特征、纹理特征、形状特征三大部分。
遥感影像的光谱信息反映了地物反射电磁波能量的大小,是进行遥感影像木事判读的重要依据[15]。光谱特征最主要的特点是对应与每个像素,但与像素的排列等空间结构无关,是区分地物类别的本质特征,因而可以根据地物光谱特征进行遥感影像的特征提取。
对遥感影像进行光谱特征提取的方法本研究使用ENV进行光谱特征提取,并辅以纹理特征提取,将影像的光谱特征和纹理特征相结合,作为本研究的标签样本数据集,如图2-8为ENVI进行纹理特征的提取。


图2-8 提取纹理特征
计算的样本分离度如表2-2所示,可以看出,每个类别的样本分离度均大于1.8,可以获得较好的分类结果。
表2-2 训练样本可分离度
| 地物 | 建筑物 | 道路 | 耕地 | 林地 | 水体 | 裸地 |
| 建筑物 | ||||||
| 道路 | 1.976 | |||||
| 耕地 | 1.998 | 1.999 | ||||
| 林地 | 1.999 | 1.997 | 1.995 | |||
| 水体 | 1.999 | 1.999 | 1.999 | 2.000 | ||
| 裸地 | 1.999 | 1.999 | 1.999 | 1.997 | 1.999 |
依据上述京津冀的地物类型及特点,本研究通过使用ENVI 的ROI选取包含建筑物、耕地、林地、裸地、水体、道路在内的6个类别样本,共计3000个左右的样本作为训练数据集;为保证BP神经网络训练的准确性,选取样本数量应保持一致性均匀性,对于本研究的数据,采用7:3的比列将结果分割为训练集和测试集,如下表2-3所示为训练样本和测试样本的数量。
表2-3样本选取和数量
| 样本类别 | 训练样本 | 测试样本 |
| 建筑物 | 358 | 154 |
| 耕地 | 349 | 150 |
| 林地 | 352 | 151 |
| 裸地 | 353 | 152 |
| 水体 | 357 | 153 |
| 道路 | 352 | 152 |
本章介绍了文章研究的区域为京津冀区域,首先介绍了研究区概况,及使用的数据为landsat8 OLI数据,并使用Python进行了遥感影像的辐射定标和大气校正,裁剪出主要研究对象-京津冀研究区,同时进行遥感影像的光谱特征和纹理特征提取,制作出标签样本数据集,将数据集按照7:3划分为训练集和测试集,为下面BP神经网络的搭建和训练提供数据支持。
第3章 软件设计
为了使本次研究的内容更具直观性,在研究中进行了软件的设计与实现,软件的开发环境是python,python作为一种强大的集成开发工具,拥有大量可提供帮助的库函数,使用Qt5Qt和Qtdesign进行软件的界面开发,并使用GDAL与OpenCV对原始影像与预处理的结果进行显示,本次研究提供了强有力的支持。
3.1软件开发环境
1、软件环境:本研究所采用的软件研究环境为Python。主要研究框架为Tensorflow2.0-CPU,Numpy,PyTorch,Pyqt5,Qtdesign,GDAL,OpenCV等。Tensorflow2.0-CPU,Numpy,PyTorch为基于神经网络的深度学习框架。Pytq5,Qtdesign负责可视化界面的设计与实现。
2、硬件环境:CPU:2.6GHz四核IntelCorei7-9750;内存:8G
3.2软件功能
软件主要功能包括文件,编辑,设置三大模块,软件可以实现的功能是进行影像的加载显示,保存文件,清理窗口,影像的预处理,BP训练,BP分类,退出

图3-1 软件的初始界面


图3-2 加载显示天津影像和北京影像

图3-3 进行影像预处理

651

被折叠的 条评论
为什么被折叠?



