Processing math: 100%
 注册 登录 English Version
冰冻圈遥感 | 浏览量 : 0 下载量: 386 CSCD: 0 更多指标
  • 导出

  • 分享

  • 收藏

  • 专辑

    • 基于深度学习的全极化SAR影像冰川边界识别

    • Identification of glaciers using fully polarimetric SAR data based on deep-learning

    • 范吉延

      柯长青

      姚国慧

      王梓霏

    • 2023年27卷第9期 页码:2098-2113   

      纸质出版日期: 2023-09-07

    • DOI: 10.11834/jrs.20221541     

    扫 描 看 全 文

  • 引用

    阅读全文PDF

  • 范吉延,柯长青,姚国慧,王梓霏.2023.基于深度学习的全极化SAR影像冰川边界识别.遥感学报,27(9): 2098-2113 DOI: 10.11834/jrs.20221541.
    Fan J Y,Ke C Q,Yao G H and Wang Z F. 2023. Identification of glaciers using fully polarimetric SAR data based on deep-learning. National Remote Sensing Bulletin, 27(9):2098-2113 DOI: 10.11834/jrs.20221541.
  •  
  •  
    论文导航

    摘要

    冰川识别对于周边地区水资源与气候变化监测具有重要意义。全极化SAR影像包含地物表面散射、偶次散射、体散射、统计特性等丰富的特征,而深度学习能够充分挖掘影像信息,因此使用全极化SAR影像结合深度学习能够得到精确的冰川识别效果。本文基于喜马拉雅山脉西端ALOS2-PALSAR全极化影像,使用VGG16特征提取网络与全卷积神经网络模型U-net相结合的VGG16-unet对冰川进行识别。采用的特征包括极化相干矩阵对角线元素、Freeman-Durden、H/A/α、Pauli、VanZyl、Yamaguchi这5种极化分解参数共计19种特征。为了充分利用影像信息,对这些特征进行分析与组合,并比较它们之间的冰川识别精度,以选取最佳特征。由于冰川与非冰川的地形具有明显差异,因此将DEM、坡度、局部入射角等作为辅助特征与极化特征结合。通过对比不同极化特征分类精度得出,基于物理特性的Pauli、Freeman-Durden、VanZyl、Yamaguchi特征分类的精度较高,其中Pauli特征分类的精度最高,整体精度(OA)达到92.54%,平均用户交并比(mIoU)达到78.78%。加入地形数据后整体精度(OA)提升至94.34%,平均用户交并比(mIoU)提升至82.35%。为了进一步提高冰川的识别精度,提出了一种基于单波段特征整体精度(OA)及召回率(Recall)筛选出的SDV(表面散射、偶次散射、体散射)特征交叉组合方式,结果显示,该组合整体精度(OA)达到94.98%,用户交并比(mIoU)达到85.67%,比Pauli特征分类精度分别高出0.64%和 3.32%。上述结果表明,选择最佳的特征组合方式并结合深度学习在提升冰川识别精度中具有重要的作用。

    Abstract

    Glacier identification is important for monitoring water resources and climate change in surrounding areas. Although optical images have achieved high accuracy in glacier boundary identification, optical images are affected by cloud cover, and reproducing information under the clouds is difficult. Fully polarized SAR images contain rich features, and deep learning can fully exploit image information. Therefore, using fully polarized SAR images combined with deep learning can compensate for the lack of optical images and obtain accurate glacier recognition results. In this paper, VGG16-unet (VGG16 combined with U-net) is used to identify glaciers based on ALOS2-PALSAR fully polarized images of the western part of the Himalayas. The features include the diagonal elements of the polarization coherence matrix, Freeman-Durden, H/A/α, Pauli, VanZyl, and Yamaguchi polarization decomposition parameters totaling 19 features. To make full use of the image information, these features are analyzed and combined, and the glacier recognition accuracies are compared to select the best features. Given evident differences between glacier and nonglacier topography, elevation, slope, and local incidence angle are combined with polarization features as auxiliary features.

    Comparing the classification accuracy of different polarization features reveals the accuracy of Pauli, Freeman-Durden, VanZyl, and Yamaguchi features based on physical characteristics is higher, among which Pauli features have the highest accuracy with an Overall Accuracy (OA) of 92.54% and an average user intersection ratio (mIoU) of 78.78%. The OA is improved to 94.34%, and the mIoU is improved to 82.35% after adding the topographic data. In order to improve the recognition accuracy of glaciers further, a feature cross-combination approach is proposed, and results show the OA of the combination reaches 94.98%, and the mIoU reaches 85.67%, which are 0.64% and 3.32% higher than the classification accuracy of Pauli features, respectively.

    Selecting the best feature combination method and combining with deep learning plays an important role in improving the accuracy of glacier recognition, and the use of neural networks combined with fully polarized SAR images can effectively compensate for the shortcomings of optical images in glacier boundary identification.

    关键词

    遥感; 冰川; ALOS2-PALSAR; 极化分解; 图像分割; 深度学习; 喜马拉雅

    Keywords

    remote sensing; glaciers; ALOS2-PALSAR; polarimetric decomposition; image segmentation; deep learning; Himalayas

    1 引言

    来自喜马拉雅山脉的冰川融水为周边地区居住的人口提供了至关重要的淡水资源(

    Immerzeel等,2010)。近年来喜马拉雅山脉的冰川在加速萎缩(聂勇 等,2010Scherler等,2011)。通过监测冰川获取冰川融水情况已经成为评估周边国家水资源可用性和提供区域气候反馈的重要方式。

    冰川识别是冰川监测的重要组成部分,而使用遥感图像能够快速、准确的提取冰川边界以显示冰川变化与研究冰川物质平衡(

    Harris等,2009Paul等,2015)。虽然使用光学遥感影像能够准确的识别出冰川边界,但由于其受到云层的影响,云及云影下冰/雪信息重建面临困难,且冰川表面积雪消融变化特征在光学影像上难以观测,无法在固定区域研究冰川变化的时间序列问题。合成孔径雷达(SAR)具有穿透云层的能力,而L波段的SAR有比X和C波段SAR更长的波长,能够穿透更厚的雪(Takeuchi和Oguro,2003),因此更适合于冰川识别与变化监测。从20世纪80年代后期开始L波段SAR影像就开始被用于冰川识别,Shi和Dozier(1993)使用AIRSAR数据对冰川进行识别,并探究了L波段SAR与C波段SAR在冰川识别中的效果。

    全极化SAR数据具有比传统SAR以及单极化SAR数据更丰富的信息,而极化分解可以量化表面和内部后向散射的贡献,提高对不同位置冰川的识别能力(

    Sharma等,2011)。极化分解的特征参数不仅增加了雷达图像的信息量,而且扩大了SAR数据在冰川遥感中的应用维度(Singh等,2014Thakur等,2017)。Thakur等(2017)利用Pauli极化分解特征,基于支持向量机(SVM)实现了表碛冰川的识别。除此之外,人们发现在用极化雷达数据识别冰川时,加入地形数据能够大幅提升识别精度(Usami等,2016)。Callegari等(2016)在采用后向散射值时,将局部入射角作为支持向量机(SVM)的输入特征,得到的分类精度最高。Yao等(2020)将局部入射角与多种极化分解特征参数相结合,分类精度得到显著提升。

    近年来,深度学习发展迅速,在AlexNet基础上发展出的VGG(

    Simonyan和Zisserman,2015)神经网络大大提高了图像的分类精度,全卷积神经网络模型U-net(Ronneberger等,2015)的出现使影像在实现像素级分类的同时能够获取更深层次的语义信息,这些网络凭借其优良的纹理特征提取能力应用广泛,在冰川识别方面也展现出其优势。Parrella等(2016)使用经过微调的Alex-Net从Sentinel-2图像中提取特征,并使用主成分分析(PCA)进行降维,然后输入到随机森林分类器(RF)中识别出冰川,精度达到96.02%;Xie等(2020)使用基于深度学习改进的GlacierNet图像分割方法,将Landsat 8影像作为特征进行输入以识别冰川,精度达到99.36%。由以上方法可以发现,使用图像分割能够实现更高的识别精度。虽然以上方法在冰川识别中达到了很高的精度,但多光谱影像数据受制于气候条件。因此,本文采用全极化SAR影像作为数据源,并在此基础上生成极化相干矩阵,使用Freeman-Durden、H/A/α、Pauli、VanZyl、Yamaguchi这5种极化分解特征参数以及极化相干矩阵对角线元素共计19个特征参数,并结合基于U-net开发出的适用于全极化SAR影像的VGG16-unet进行冰川识别。在此过程中探究多种极化特征参数在冰川识别中的作用,进而获取最优的特征组合方式;探究冰川与非冰川地区地形差异对冰川识别的影响,并将地形数据与极化特征参数相结合提升冰川的识别精度。与以往研究相比,使用具有更多特征的全极化影像,并与地形因子结合作为VGG16-unet的输入进行冰川识别,探究了全极化影像在全卷积神经网络中对冰川边界识别的适用性。

    2 研究区与数据

    2.1 研究区

    研究区位于喜马拉雅山脉西端克什米尔,区域内包含典型的中纬度、高海拔冰川,大部分地区高程处于3200—6500 m。该地区多数大型冰川地势起伏大,平均坡度处于17°左右,同一冰川内不同区域坡度具有明显差异(

    Vijay和Braun,2018)。研究区总面积7613.678 km2,其中冰川面积1909.047 km2,G1冰川面积16.484 km2,区域内月平均气温在-8.4 ℃—17.5 ℃(Rai等,2016)。由于其独特的地形条件,大部分冰川如G1冰川内地表类型丰富,包含表碛覆盖冰川、含有裸冰与雪的纯净冰川以及冰川外围的裸露岩石,且冰川的大小、状态以及几何形状差异较大(Brun等,2017)。

    fig

    图1  克什米尔冰川地理位置及其分布

    Fig. 1  Location and distribution of Kashmir glaciers

    icon 下载:  原图 | 高精图 | 低精图

    2.2 SAR数据

    采用ALOS2-PALSAR全极化数据。ALOS-2卫星搭载的PALSAR是一种SAR传感器,向地面物体发射L波段雷达波,并接收其后向散射信号。与ALOS-PALSAR相比,它在时间和空间分辨率、观测波段、极化方式以及数据传输的时间间隔方面有显著的提升。特别是全极化模式可以获取目标的所有极化特性,大大提高了成像雷达对目标信息的获取能力。本文使用了条带模式下的同一轨两景全极化SAR影像,空间分辨率为5 m。成像时间为2020年10月2日。

    2.3 DEM数据

    SRTM(Shuttle Radar Topography Mission)数据是由美国航空航天局(NASA)和国防部国家测绘局(NIMA)联合测量的,雷达影像数据覆盖全球陆地表面的80%以上,精度有1 arc-second 和3 arc-seconds两种,即30 m与90 m空间分辨率的数据。本文选取SRTM 30 m空间分辨率的数据作为原始数据,用来对SAR数据进行地理编码并计算雷达波在冰川表面的局部入射角以及地表的坡度信息。

    2.4 辅助数据

    GLIMS(Global Land Ice Measurements from Space)是一项使用光学卫星数据监测世界冰川的计划,而RGI(Randolph Glacier Inventory)是对GLIMS的补充,它将曾经的冰川地图和有用的属性相结合。RGI包含了全球的冰川轮廓,使用RGI 6.0(2017年7月28日)作为训练样本的标签数据。选取2020年10月21日的Landsat 8影像作为精度验证数据。

    3 方法

    SAR影像,DEM与冰川边界数据按照图2所示的流程进行处理。整个过程细分为3个部分:SAR数据处理、神经网络分类、精度评价。下面对这3个部分进行详细说明。

    fig

    图2  基于深度学习的ALOS2-PALSAR影像冰川识别流程

    Fig. 2  Deep learning based glacier recognition process for ALOS2-PALSAR images

    icon 下载:  原图 | 高精图 | 低精图

    3.1 SAR数据处理

    3.1.1 数据预处理

    SAR数据预处理分为4个部分,包括极化矩阵生成、极化滤波、极化分解和地理编码(红色虚线矩形,图2)。

    极化雷达影像中的每一个像素的信息能够通过Sinclair散射矩阵表示。

    S=[SHHSHVSVHSVV]
    (1)

    式中,S是描述散射体对入射波散射现象的2×2散射矩阵,SHV表示发射的水平H极化波和接收的垂直V极化波的目标后向散射系数。为了从散射矩阵中提取物理信息,将矩阵转换为字典矩阵基表示的目标散射向量k

    k=[SHH    SHV    SVH    SVV]T
    (2)

    基于以上的等式,与极化相关的散射矩阵的二阶乘积可以定义为相干矩阵[T3]

    Cloude,1985),如式(3)所示。

    T3=12[|SHH+SHV|2(SHH+SVV)(SHH-SVV)*2(SHH+SVV)S*HV(SHH-SVV)(SHH+SVV)*|SHH-SVV|22(SHH-SVV)S*HV2SHV(SHH+SVV)*2SHV(SHH-SVV)*4|SHV|2]
    (3)

    相干斑是SAR成像中的一种散射现象,含有相干斑的后向散射系数影像不利于图像解译。为了消除相干斑的影响,使用Improved Lee sigma滤波器(

    Lee等,2009)对影像进行滤波,以保证极化SAR影像的清晰度和极化信息。

    当雷达波与地面目标相互作用时极化状态会发生变化,这种变化受到目标的介电常数、结构、粗糙度和化学成份影响。通过对表面和体积分量的分解能够推断出冰面和冰内特性的独立信息,而极化分解可以量化表面和体积后向散射的贡献,从而提高区分不同冰川带的能力(Sharma等,2010)。

    由于雷达的成像机制,地形因素会使影像产生几何畸变,并对雷达接收的后向散射产生一定影响(

    Paul等,2017)。因此,采用DEM对遥感影像进行地理配准,并将DEM及其衍生出的局部入射角、坡度与极化特征相结合以消除影响。

    3.1.2 极化特征组合

    为了探究不同极化特征在冰川识别中的作用,选取了Pauli分解(

    Cloude和Pottier,1996)、Freeman-Durden分解(Freeman和Durden,1998)、Yamaguchi分解(Yamaguchi等,2005)、Van Zyl分解(van Zyl等,2011)和H/A/α分解(Cloude和Pottier,1996)5种极化分解方式生成的特征以及具有物理散射信息的极化矩阵3个对角线元素T11T22T33赵泉华 等,2018)共计19个特征(表1)。按照两种方法对特征进行划分,第1种方法是根据特征的生成方式对数据进行划分(图2绿色虚线部分),第2种方式是根据单特征输入网络后的整体精度、特征的所属类别进行选取,将特征划分为3种类别,表面散射、偶次散射、体散射,选取每种类别中整体精度最高的特征并进行组合。按照上述方式共划分为7组数据。

    表1  19个极化特征的描述与计算式
    Table 1  Description and calculation formula of the 19 polarization features
    序号特征含义
    1 SurfFD Freeman-Durden极化分解中表面散射分量,PS=|SHH|2,其中PS表示表面散射功率
    2 DblFD Freeman-Durden极化分解中偶次散射分量,PD=|SVV|2,其中PD表示偶次散射功率
    3 VolFD Freeman-Durden极化分解中体散射分量,PV=2|SHV|2,其中PV表示体散射功率
    4 H 熵值,衡量散射过程中的极化程度;H/A/α分解的参数
    5 A 各向异性值,衡量第二与第三个散射机制的相对大小;H/A/α分解的参数
    6 α 极化散射角,对散射机制的物理解释,取0°,45°,90°时分别代表表面散射,体散射,偶次散射;H/A/α分解的参数
    7 Surfpauli Pauli极化分解中表面散射分量
    8 Dblpauli Pauli极化分解中偶次散射分量
    9 Volpauli Pauli极化分解中体散射分量
    10 T11 相干矩阵对角线分量,含有表面散射信息,T11 ∈ diag (T3
    11 T22 相干矩阵对角线分量,含有偶次散射信息,T22 ∈ diag (T3
    12 T33 相干矩阵对角线分量,含有体散射信息,T33 ∈ diag (T3
    13 Surfvan VanZyl极化分解中表面散射分量
    14 Dblvan VanZyl极化分解中偶次散射分量
    15 Volvan VanZyl极化分解中体散射分量
    16 Surfyama Yamaguchi极化分解中表面散射分量,T3=fsTsurface+ fdTdouble-bounce+ fvTvolume+fcThelix,式中Tsurface是表面散射拓展矩阵, fs为其拓展系数
    17 Dblyama Yamaguchi极化分解中偶次散射分量,T3=fsTsurface+ fdTdouble-bounce+ fvTvolume+fcThelix,式中Tdouble-bounce是偶次散射拓展矩阵, fd为其拓展系数
    18 Volyama Yamaguchi极化分解中体散射分量,T3=fsTsurface+ fdTdouble-bounce+ fvTvolume+fcThelix,式中Tvolume是体散射拓展矩阵, fv为其拓展系数
    19 Hlxyama Yamaguchi极化分解中螺旋散射分量,T3=fsTsurface+ fdTdouble-bounce+ fvTvolume+fcThelix,式中Thelix是螺旋散射拓展矩阵, fc为其拓展系数
    icon 下载:  导出CSV icon 下载:  下载表格图片

    3.2 神经网络分类

    3.2.1 输入数据处理

    输入数据处理如图2中蓝色虚线框图部分所示。采用直方图均衡化以增强输入图像的信息。采用RGI 6.0矢量数据作为冰川的标签数据,将标签与遥感影像裁剪为512×512像素大小的数据块(图3),然后对标签与影像进行水平、垂直以及对角线旋转增强数据以增加数据量(图4),并对增强后的数据进行线性归一化处理。按照1833∶611∶611即6∶2∶2的小训练集经典比例将数据集划分成训练集、验证集、测试集(图5)。

    fig

    图3  ALOS2-PALSAR影像及地形数据的合成与裁剪

    Fig. 3  Synthesis and cropping of ALOS2-PALSAR images and topographic data

    icon 下载:  原图 | 高精图 | 低精图
    fig

    图4  神经网络数据增强

    Fig. 4  Neural network data enhancement

    icon 下载:  原图 | 高精图 | 低精图
    fig

    图5  VGG16-unet训练、验证及测试数据分布

    Fig. 5  Regional distribution of VGG16-unet train, validation and test data

    icon 下载:  原图 | 高精图 | 低精图

    3.2.2 网络结构设计

    U-net网络呈U形结构,主要包括编码器和解码器部分,编码器通过卷积和池化对影像降维并提取特征,解码器采用上采样且与特征部分相同尺度的图像进行拼接,将浅层特征和深层特征结合起来,更有利于提取目标。为了使网络用于冰川识别,在U-net的基础上设计了VGG16-unet,并对其中的参数进行修改以确定最佳参数(表2)。选取T11T22T33这3个特征进行组合作为网络的输入数据,过程中发现多层卷积层配合小卷积核能够得到更高的精度,最终确定了如图7所示的VGG16-unet结构,具有4层池化层,卷积核大小为3×3,起始层卷积核数量32,编码器内部卷积层数分别为2,2,3,3,3。VGG16-unet编码和解码的结构是对称的,每个编码器都有一个对应的解码器。通过编码器提取的特征输入到解码器内进行分类。在编码器内部,存在卷积层、批标准化层、Relu激活函数层、最大池化层以及Dropout层,在解码器内部存在卷积层、上采样层。影像作为输入数据输入卷积层,输出特征图。输入层与输出层通过补零后具有相同的分辨率。卷积后得到的特征图传入批标准化层,以加快网络的学习速度,降低对网络初始化的敏感性。为防止网络中梯度的消失,对神经网络使用Relu函数进行激活,并引入Dropout层屏蔽参与训练的神经元,避免过拟合。编码器使用最大池化层(图6)以保持平移不变性(

    Badrinarayanan等,2017),解码器使用去池化层恢复到经过池化之前的大小(图6),输入值返回到其对应最大值的原始位置。不充足的池化层会提取无关的信息,过多的池化层会丢失部分信息。实验得到4层池化分类精度最高(表2)。

    表2  VGG16-unet神经网络测试参数
    Table 2  VGG16-unet neural network test parameters
    编号池化层数量卷积核大小编码器卷积层起始层卷积核数量整体精度(OA)
    1 4 5 2,2,2,2,2 64 0.8772
    2 4 5 2,2,2,2,2 32 0.8901
    3 4 5 2,2,3,3,3 64 0.8847
    4 4 5 2,2,3,3,3 32 0.8984
    5 4 3 2,2,2,2,2 64 0.8943
    6 4 3 2,2,2,2,2 32 0.8854
    7 4 3 2,2,3,3,3 64 0.8661
    8 4 3 2,2,3,3,3 32 0.9246
    9 5 3 2,2,2,2,2 64 0.9073
    10 5 3 2,2,2,2,2 32 0.8866
    11 5 3 2,2,3,3,3 64 0.9185
    12 5 3 2,2,3,3,3 32 0.9163
    13 6 3 2,2,3,3,3 32 0.8685
    14 2 3 2,2,3,3,3 32 0.8792
    icon 下载:  导出CSV icon 下载:  下载表格图片
    fig

    图6  VGG16-unet池化与去池化过程

    Fig. 6  VGG16-unet pooling and unpooling process

    icon 下载:  原图 | 高精图 | 低精图
    fig

    图7  VGG16-unet网络结构及其参数

    Fig. 7  Structure and parameters of VGG16-unet network

    icon 下载:  原图 | 高精图 | 低精图

    3.3 精度评价

    用于精度评价的冰川边界数据是在Landsat 8 5,4,3波段合成的影像上参考RGI 6.0边界进行目视解译修改得到。精度评价的方法都是基于冰川识别结果与目视解译冰川轮廓来进行对比分析,包括精确度(P)、召回率(R)、F1分数(F1)、交并比(IoU)、平均交并比(mIoU)、整体精度(OA)。

    P=TPTP+FP
    (4)
    R=TPTP+FN
    (5)
    F1=2×Precision×RecallPrecision+Recall
    (6)
    IoU=TPTP+FN+FP
    (7)
    mIoU=niIoUn
    (8)
    OA=TP+TNTP+TN+FP+FN
    (9)

    式中,TP是预测结果为正类,实际是正类;FP是预测结果为正类,实际是负类;TN是预测结果为负类,实际是负类;FN是预测结果为负类,实际是正类;n为类别总数,i为类别序号。

    4 结果与讨论

    4.1 极化分解特征比较

    将19个特征参数单独输入神经网络中进行识别对比整体精度(表3),发现散射功率较高的表面散射与体散射特征(

    Huang等,2014)在识别冰川时的整体精度高于散射功率较低的偶次散射特征。根据整体精度及召回率,选取Surfyama、Dblpauli、Volpauli作为新的特征组合(SDV)输入网络中。

    表3  19种极化分解特征整体精度及召回率对比
    Table 3  Comparison of the overall accuracy of 19 polarization decomposition features %
    序号特征参数整体精度(OA)召回率(Recall)
    1 SurfFD 81.65 46.68
    2 DblFD 78.1 45.76
    3 VolFD 80.78 59.17
    4 H 82.55 64.51
    5 A 81.21 55.35
    6 α 81.55 56.28
    7 Surfpauli 80.14 56.97
    8 Dblpauli 79.90 55.84
    9 Volpauli 83.26 59.09
    10 T11 80.12 50.48
    11 T22 79.77 41.46
    12 T33 80.59 53.97
    13 Surfvan 82.31 56.44
    14 Dblvan 79.47 52.86
    15 Volvan 80.61 51.58
    16 Surfyama 82.33 65.21
    17 Dblyama 77.65 50.48
    18 Volyama 81.18 52.14
    19 Hlxyama 75.54 52.97
    icon 下载:  导出CSV icon 下载:  下载表格图片

    利用SDV组合进行识别的整体精度最高,达到93.3%,平均用户交并比(mIoU)达到80.91%,召回率达到76.89%(表4)。基于物理散射机制的Freeman-Durden、Pauli、VanZyl、Yamaguchi极化分解特征与极化相干矩阵的T11T22T33整体精度均高于基于统计特征的H/A/α极化分解特征,其中广泛适用于许多不同类型地表(

    Huang等,2014)的Pauli分解特征精度最高,整体精度92.54%,平均用户交并比(mIoU)达到78.78%,召回率达到73.03%,虽然Yamaguchi有4个极化分解特征,但在基于物理散射机制的特征中精度最低,这可能是因为其第4特征表示的螺旋散射并不适用于自然地表的分类(Yamaguchi等,2005),加入第4特征会降低冰川识别的精度。虽然利用熵值(H),各向异性值(A),极化散射角(α)单独进行识别时的整体精度均大于81%,但H/A/α特征组合识别冰川时的精度最低,整体精度89.83%,用户交并比(mIoU)75.62%,召回率70.02%,这可能是由于熵值(H)与极化散射角(α)具有很高的相关性(Yao等,2020),组合输入时导致了特征的冗余。

    表4  7种极化特征组合冰川识别精度对比(不含地形数据)
    Table 4  Comparison of glacier recognition accuracy for seven combinations of polarization features (topographic data not included) %
    序号极化分解精确度召回率F1分数IoUmIoU整体精度
    1 H/A/α 80.85 70.02 75.05 60.06 74.59 90.65
    2 Yamaguchi 90.92 61.41 73.31 57.86 73.81 91.02
    3 VanZyl 75.94 84.13 79.83 66.42 78.07 91.46
    4 Freeman-Durden 89.42 69.1 77.96 63.88 77.38 92.15
    5 T_matrix 85.72 74.96 79.98 66.64 78.89 92.46
    6 Pauli 87.8 73.03 79.73 66.3 78.78 92.54
    7 SDV 88.22 76.89 82.17 69.73 80.91 93.3
    icon 下载:  导出CSV icon 下载:  下载表格图片

    为了进一步分析冰川识别精度与极化特征的关系,选取包含岩石、表碛、冰、雪多种地表类型的G1冰川区域作为样本,对该区域内多种极化特征进行分析(图8)。由于Yamaguchi分解中的螺旋散射特征不适用于自然地表的分类(

    Yamaguchi等,2005),因此仅计算4种地物类型的18个极化特征参数并生成散点图(图9)。在Freeman-Durden、Pauli、VanZyl、Yamaguchi与极化相干矩阵对角元素构成的散点图中,岩石与其余3种地物的点位分布具有明显的差异,而H/A/α构成的散点图中,4种地物的点位较聚集,无法进行清楚的区分,结合表5的结果显示,具有高分离度的Pauli分解特征与相干矩阵对角元素在冰川识别中也具有较高的精度,因此不同地物的特征分离度可能是影响VGG16-unet的因素之一。

    fig
    icon 下载:  | 高精图 | 低精图

    图8  18种极化特征实例及样本点分布

    Fig. 8  Examples of 18 polarization characteristics and sample point distribution

    fig
    icon 下载:  | 高精图 | 低精图

    图9  不同冰川地表类型中岩石、表碛、冰、雪的18个极化特征分布

    Fig. 9  Distribution of 18 polarization features of bare rock, debris, ice and snow in different glacial surface types

    表5  7种不同极化特征组合冰川识别精度对比(为地形数据)
    Table 5  Comparison of glacier recognition accuracy for seven different combinations of polarization features ( is topographic data) /%
    序号极化分解精确度召回率F1分数IoUmIoU整体精度
    不含不含不含不含不含不含
    1 T_matrix 91.36 85.72 74.77 74.96 82.24 79.98 69.83 66.64 81.1 78.89 93.51 92.46
    2 H/A/α 90.07 80.85 77.36 70.02 83.23 75.05 71.28 60.06 81.93 74.59 93.74 90.65
    3 Yamaguchi 89.07 90.92 79.02 61.41 83.74 73.31 72.03 57.86 82.35 73.81 93.84 91.02
    4 Freeman-Durden 89.64 89.42 80.13 69.1 84.62 77.96 73.34 63.88 83.18 77.38 94.15 92.15
    5 VanZyl 88.81 75.94 81.08 84.13 84.77 79.83 73.56 66.42 83.29 78.07 94.15 91.46
    6 Pauli 88.8 87.8 82.18 73.03 85.36 79.73 72.03 66.3 82.35 78.78 94.34 92.54
    7 SDV 89.05 88.22 85.54 76.89 87.26 82.17 77.4 69.73 85.67 80.91 94.98 93.3
    icon 下载:  导出CSV icon 下载:  下载表格图片

    4.2 地形数据对冰川识别结果的影响

    加入局部入射角、坡度、DEM数据后7组特征的冰川识别精度均有显著提升,选取一张512×512像素影像观察不同极化特征加入地形因子后的分类情况(图10)。通过表5可以看出,整体精度从90.65%—93.3%提升至93.51%—94.98%,平均用户交并比(mIoU)从73.81%—80.91%提升至81.1%—85.67%,召回率从61.41%—84.13%提升至74.77%—85.54%。具有最高精度的Surfyama、Dblpauli、Volpauli(SDV)组合整体精度从93.3%提升至94.98%,平均用户交并比(mIoU)从80.91%提升至85.67%,召回率从76.89%提升至85.54%,精度最低的组合由H/A/α变为极化相干矩阵。

    fig
    icon 下载:  | 高精图 | 低精图

    图10  不同极化特征组合冰川识别结果对比

    Fig. 10  Comparison of glacier identification results for different combinations of polarization features

    通过表5可以看出地形对冰川的识别精度有一定的影响,因此,选取地形变化明显的G1冰川进行剖面分析生成曲线(图11),其中P1位于裸岩部分,是剖面线终点;P2是裸岩与表碛的交界点;P3位于雪覆盖冰川部分,为剖面线起点。由于输入神经网络前对数据进行了归一化,图12中高程、坡度与局部入射角的范围均在0—1且无单位。图12中可以看出在冰川与非冰川部分曲线具有明显差异。高程值(DEM)曲线在P1—P3段呈稳定上升趋势,且P1—P2非冰川段高程值小于P2—P3冰川段高程值。在P1—P2非冰川段,局部入射角与坡度曲线波动较大,整体呈现先上升后下降的趋势,局部入射角总体分布约为0.36,坡度约为0.21。在P2—P3冰川段,局部入射角与坡度曲线比P1—P2段更加稳定,局部入射角总体分布约为0.29,坡度约为0.10。这些曲线的变化表明,非冰川区与冰川区的地形在数值与变化趋势上都存在差异,因此将地形数据作为辅助特征输入神经网络时不仅能够降低局部入射角、坡度等对地物后向散射强度造成的影响,还能扩大非冰川区与冰川区特征的差异,从而进一步提高冰川识别的精度。除此之外,结合图9可以看出,地形数据的加入还会降低特征分离度对冰川识别精度的影响,使具有高特征分离度相干矩阵的冰川识别精度最低。

    fig

    图11  G1冰川剖面线分布(背景数据采用Landsat 8 5,4,3波段)

    Fig. 11  Distribution of profile lines in G1 glacier (The background data were using the 5,4,3 bands of Landsat 8)

    icon 下载:  原图 | 高精图 | 低精图
    fig

    图12  G1冰川地形因子剖面分析曲线

    Fig. 12  G1 Glacier topographic factor profile analysis curve

    icon 下载:  原图 | 高精图 | 低精图

    4.3 冰川识别分类结果

    图13是SDV特征结合地形数据输入神经网络得到的冰川识别结果,可以看出,较大型纯净冰川内部的冰与雪能够很好的识别(图13Ⅱ区域),表碛型冰川中段与末端也能较为准确的识别(图13中区域Ⅲ—Ⅳ),面积小于0.1 km2的小型冰川与周围岩石具有相似的特征,识别的准确性较差(图13中区域Ⅰ—Ⅱ)。总体看来除部分面积较小的冰川外,表碛、冰、雪等具有显著纹理特征的大型冰川识别效果良好,VGG16-unet提取的冰川边界与验证数据边界基本一致。

    fig

    图13  基于深度学习的克什米尔ALOS2-PALSAR影像冰川识别分类结果

    Fig. 13  Deep learning based classification results for glacier identification in ALOS2-PALSAR images of Kashmir

    icon 下载:  原图 | 高精图 | 低精图

    4.4 机器学习与VGG16-unet冰川识别对比

    图14是SDV特征结合地形数据按照相同的样本输入VGG16-unet、随机森林、支持向量机得到的冰川识别结果,精度如表6所示。可以看出随机森林(图14(c))会将裸岩识别为表碛,并且对于小型冰川的识别结果较差,识别的总体精度为73.69%,平均用户交并比(mIoU)为58.28%,召回率为74.19%。支持向量机(图14(d))能够较好的区分裸岩与表碛,但对于小型冰川的识别结果很差,裸岩与冰川几乎无法区分,识别的总体精度为89.91%,平均用户交并比(mIoU)为60.89%,召回率为61.33%。VGG16-unet在冰川识别中相较于以上两种机器学习方法有显著的优势,除部分碎块冰川无法准确识别外,对冰川的表碛、冰、雪部分识别准确,总体精度为93.41%,平均用户交并比(mIoU)为87.58%,召回率为95.23%。

    fig
    icon 下载:  | 高精图 | 低精图

    图14  VGG16-unet与机器学习冰川识别结果对比

    Fig. 14  Comparison of glacier recognition results between VGG16-unet and machine learning

    表6  VGG16-unet与机器学习冰川识别精度对比
    Table 6  Comparison of glacier recognition accuracy between VGG16-unet and machine learning /%
    方法精确度召回率F1分数IoUmIoU整体精度
    随机森林 75.58 74.19 74.88 59.84 58.28 73.69
    支持向量机 89.91 61.33 72.92 57.39 60.89 75.93
    VGG16-unet 92.52 95.23 93.86 88.42 87.58 93.41
    icon 下载:  导出CSV icon 下载:  下载表格图片

    4.5 VGG16-unet方法可迁移性

    为了验证VGG16-unet方法在冰川识别上的可迁移性,选取位于藏东南地区左贡县旺达镇(图15)附近4景ALOS1-PALSAR全极化影像(3景2011年4月15日,1景2011年3月19日),按照与图2中ALOS2-PALSAR影像相同的处理步骤进行冰川边界提取,得到图16所示的结果。

    fig

    图15  基于ALOS1-PALSAR的VGG16-unet训练、验证及测试数据分布

    Fig. 15  VGG16-unet train, validation and test data distribution based on ALOS1-PALSAR

    icon 下载:  原图 | 高精图 | 低精图
    fig

    图16  基于深度学习的旺达镇ALOS1-PALSAR影像冰川识别分类结果

    Fig. 16  Deep learning based classification results for glacier identification in ALOS1-PALSAR images of Wangda town

    icon 下载:  原图 | 高精图 | 低精图

    冰川识别精度如表7所示,可以看到ALOS1-PALSAR比ALOS2-PALSAR整体精度(OA)降低1.74%,平均用户交并比(mIoU)降低4.45%,召回率(Recall)降低5.54%。这是由于ALOS1-PALSAR的几何畸变较严重,影像质量低于ALOS2-PALSAR影像质量,并且参与模型建立样本对数量仅为1027对。尽管如此,使用VGG16-unet基于ALOS1-PALSAR对冰川的整体精度(OA)仍能够达到93.24,平均用户交并比(mIoU)能够达到81.22%,这说明VGG16-unet结合全极化SAR数据中Surfyama、Dblpauli、Volpauli波段及地形因子进行冰川边界提取的方法具有良好的可迁移性。

    表7  ALOS2与ALOS1冰川识别精度比较
    Table 7  Comparison of glacier recognition accuracy between ALOS-2 and ALOS-1 images /%
    数据集精确度召回率F1分数IoUmIoU整体精度
    ALOS1 85.57 80.00 82.69 70.49 81.22 93.24
    ALOS2 89.05 85.54 87.26 77.4 85.67 94.98
    icon 下载:  导出CSV icon 下载:  下载表格图片

    5 结论

    本文基于ALOS2-PALSAR全极化影像数据,利用VGG16与全卷积神经网络模型U-net结合生成的VGG16-unet,对19个极化特征进行对比、分析与组合,并结合地形数据进行冰川边界的识别,得到的结果显示(1)VGG16-unet神经网络对冰川区地物物理特性的差异更加敏感,结合物理特性相关的Pauli、Freeman-Durden、VanZyl、Yamaguchi、T矩阵对角元素进行识别能够得到更高的冰川识别精度,通过筛选得到的SDV组合特征精度最高,加入地形因子后冰川的识别精度能够达到94.98%;将19种极化分解特征输入神经网络时,冰川散射机制中占主导的表面散射与体散射的识别精度高于偶次散射的识别精度,虽然与统计特性相关的H、A、α都能得到较高的精度,但进行组合输入时由于特征冗余,使得其冰川识别精度最低;将地形数据作为辅助特征与极化特征相结合输入神经网络能够大幅提升冰川的识别精度,但是会影响极化特征分离度在冰川识别中的作用;特征是冰川识别的关键,特征显著的表碛、冰、雪等大型冰川能够得到良好的识别,而与岩石相似的小型冰川识别效果较差。(2)综上所述,利用全极化SAR影像结合神经网络进行冰川边界的识别能够有效弥补光学影像受云层影响导致的云及云影下冰/雪信息的缺失。与

    Yao等(2020)在文中的实验相比较,本文在证实其提出的加入地形数据能够提升识别精度的观点的同时,采用了更加先进的深度学习方法,相较于其实验精度有1.2%的提升,并且本文实验方法具有更好的迁移性和普适性,为不同地区进行光学影像云下冰雪信息重建提供了可行的方案。(3)文中还存在一些不足,例如神经网络训练数据不足,仅使用两景SAR影像作为数据源;数据源单一,仅利用SAR影像与地形因子作为神经网络的特征输入;网络结构单一,在U-net框架下仅探究VGG16在冰川识别中的适用性。在以后的研究中可以尝试增加参与网络训练的数据量,提升网络的稳定性与准确性;使用多源遥感影像,扩大特征的数量与维度;基于更多样的神经网络模型如Deeplab、PSP-net等对数据集进行训练,更多元地提取影像中的特征,从而进一步提高冰川的识别精度。

    参考文献(References)

    Badrinarayanan V, Kendall A and Cipolla R. 2017. SegNet: a deep convolutional encoder-decoder architecture for image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(12): 2481-2495 [DOI: 10.1109/TPAMI.2016.2644615] [百度学术] 

    Brun F, Berthier E, Wagnon P, Kääb A and Treichler D. 2017. A spatially resolved estimate of high mountain Asia glacier mass balances from 2000 to 2016. Nature Geoscience, 10(9): 668-673 [DOI: 10.1038/ngeo2999] [百度学术] 

    Callegari M, Carturan L, Marin C, Notarnicola C, Rastner P, Seppi R and Zucca F. 2016. A Pol-SAR analysis for alpine glacier classification and snowline altitude retrieval. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 9(7): 3106-3121 [DOI: 10.1109/JSTARS.2016.2587819] [百度学术] 

    Cloude S R. 1985. Target decomposition theorems in radar scattering. Electronics Letters, 21(1): 22-24 [DOI: 10.1049/el:19850018] [百度学术] 

    Cloude S R and Pottier E. 1996. A review of target decomposition theorems in radar polarimetry. IEEE Transactions on Geoscience and Remote Sensing, 34(2): 498-518 [DOI: 10.1109/36.485127] [百度学术] 

    Freeman A and Durden S L. 1998. A three-component scattering model for polarimetric SAR data. IEEE Transactions on Geoscience and Remote Sensing, 36(3): 963-973 [百度学术] 

    Harris C, Arenson L U, Christiansen H H, Etzelmüller B, Frauenfelder R, Gruber S, Haeberli W, Hauck C, Hölzle M, Humlum O, Isaksen K, Kääb A, Kern-Lütschg M A, Lehning M, Matsuoka N, Murton J B, Nözli J, Phillips M, Ross N, Seppälä M, Springman S M and Vonder Mühll D. 2009. Permafrost and climate in Europe: monitoring and modelling thermal, geomorphological and geotechnical responses. Earth-Science Reviews, 92(3/4): 117-171 [DOI: 10.1016/j.earscirev.2008.12.002] [百度学术] 

    Huang L, Li Z, Tian B S, Zhou J M and Chen Q. 2014. Recognition of supraglacial debris in the Tianshan mountains on polarimetric SAR images. Remote Sensing of Environment, 145: 47-54 [DOI: 10.1016/j.rse.2014.01.020] [百度学术] 

    Immerzeel W W, van Beek L P H and Bierkens M F P. 2010. Climate change will affect the Asian water towers. Science, 328(5984): 1382-1385 [DOI: 10.1126/science.1183188] [百度学术] 

    Lee J S, Wen J H, Ainsworth T L, Chen K S and Chen A J. 2009. Improved sigma filter for speckle filtering of SAR imagery. IEEE Transactions on Geoscience and Remote Sensing, 47(1): 202-213 [DOI: 10.1109/TGRS.2008.2002881] [百度学术] 

    Nie Y, Zhang Y L, Liu L S and Zhang J P. 2010. Monitoring glacier change based on remote sensing in the Mt. Qomolangma national nature preserve, 1976-2006. Acta Geographica Sinica, 65(1): 13-28 [百度学术] 

    聂勇, 张镱锂, 刘林山, 张继平. 2010. 近30年珠穆朗玛峰国家自然保护区冰川变化的遥感监测. 地理学报, 65(1): 13-28 [DOI: 10.11821/xb201001003] [百度学术] 

    Parrella G, Hajnsek I and Papathanassiou K P. 2016. Polarimetric decomposition of L-band PolSAR backscattering over the austfonna ice cap. IEEE Transactions on Geoscience and Remote Sensing, 54(3): 1267-1281 [DOI: 10.1109/TGRS.2015.2477168] [百度学术] 

    Paul F, Bolch T, Briggs K, Kääb A, McMillan M, McNabb R, Nagler T, Nuth C, Rastner P, Strozzi T and Wuite J. 2017. Error sources and guidelines for quality assessment of glacier area, elevation change, and velocity products derived from satellite data in the Glaciers_cci project. Remote Sensing of Environment, 203: 256-275 [DOI: 10.1016/j.rse.2017.08.038] [百度学术] 

    Paul F, Bolch T, Kääb A, Nagler T, Nuth C, Scharrer K, Shepherd A, Strozzi T, Ticconi F, Bhambri R, Berthier E, Bevan S, Gourmelen N, Heid T, Jeong S, Kunz M, Lauknes T R, Luckman A, Boncori J P M, Moholdt G, Muir A, Neelmeijer J, Rankl M, Van Looy J and Van Niel T. 2015. The glaciers climate change initiative: methods for creating glacier area, elevation change and velocity products. Remote Sensing of Environment, 162: 408-426 [DOI: 10.1016/j.rse.2013.07.043] [百度学术] 

    Ronneberger O, Fischer P and Brox T. 2015. U-net: convolutional networks for biomedical image segmentation//18th International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich: Springer: 234-241 [DOI: 10.1007/978-3-319-24574-4_28] [百度学术] 

    Scherler D, Bookhagen B and Strecker M R. 2011. Spatially variable response of Himalayan glaciers to climate change affected by debris cover. Nature Geoscience, 4(3): 156-159 [DOI: 10.1038/ngeo1068] [百度学术] 

    Sharma J J, Hajnsek I, Papathanassiou K P and Moreira A. 2011. Polarimetric decomposition over glacier ice using long-wavelength airborne polSAR. IEEE Transactions on Geoscience and Remote Sensing, 49(1): 519-535 [DOI: 10.1109/TGRS.2010.2056692] [百度学术] 

    Shi J C and Dozier J. 1993. Measurements of snow-and glacier-covered areas with single-polarization SAR. Annals of Glaciology, 17: 72-76 [百度学术] 

    Simonyan K and Zisserman A. 2015. Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556 [DOI: 10.48550/arXiv.1409.1556] [百度学术] 

    Singh G, Venkataraman G, Yamaguchi Y and Park S E. 2014. Capability assessment of fully polarimetric ALOS-PALSAR data for discriminating wet snow from other scattering types in mountainous regions. IEEE Transactions on Geoscience and Remote Sensing, 52(2): 1177-1196 [DOI: 10.1109/TGRS.2013.2248369] [百度学术] 

    Takeuchi S and Oguro Y. 2003. A comparative study of coherence patterns in C-band and L-band interferometric SAR from tropical rain forest areas. Advances in Space Research, 32(11): 2305-2310 [DOI: 10.1016/S0273-1177(03)90558-8] [百度学术] 

    Thakur P K, Aggarwal S P, Arun G, Sood S, Kumar A S, Mani S and Dobhal D P. 2017. Estimation of snow cover area, snow physical properties and glacier classification in parts of western Himalayas using C-band SAR data. Journal of the Indian Society of Remote Sensing, 45(3): 525-539 [DOI: 10.1007/s12524-016-0609-y] [百度学术] 

    Usami N, Muhuri A, Bhattacharya A and Hirose A. 2016. PolSAR wet snow mapping with incidence angle information. IEEE Geoscience and Remote Sensing Letters, 13(12): 2029-2033 [DOI: 10.1109/LGRS.2016.2621891] [百度学术] 

    van Zyl J J, Arii M and Kim Y. 2011. Model-based decomposition of polarimetric SAR covariance matrices constrained for nonnegative eigenvalues. IEEE Transactions on Geoscience and Remote Sensing, 49(9): 3452-3459 [DOI: 10.1109/TGRS.2011.2128325] [百度学术] 

    Vijay S and Braun M. 2018. Early 21st century spatially detailed elevation changes of Jammu and Kashmir glaciers (Karakoram-Himalaya). Global and Planetary Change, 165: 137-146 [DOI: 10.1016/j.gloplacha.2018.03.014] [百度学术] 

    Yamaguchi Y, Moriyama T, Ishido M and Yamada H. 2005. Four-component scattering model for polarimetric SAR image decomposition. IEEE Transactions on Geoscience and Remote Sensing, 43(8): 1699-1706 [DOI: 10.1109/TGRS.2005.852084] [百度学术] 

    Yao G H, Ke C Q, Zhou X B, Lee H, Shen X Y and Cai Y. 2020. Identification of alpine glaciers in the central Himalayas using fully polarimetric L-band SAR data. IEEE Transactions on Geoscience and Remote Sensing, 58(1): 691-703 [DOI: 10.1109/TGRS.2019.2939430] [百度学术] 

    Zhao Q H, Guo S B, Li X L and Li Y. 2018. Polarimetric SAR sea ice classification based on target decompositional features. Acta Geodaetica et Cartographica Sinica, 47(12): 1609-1620 [百度学术] 

    赵泉华, 郭世波, 李晓丽, 李玉. 2018. 利用目标分解特征的全极化SAR海冰分类. 测绘学报, 47(12): 1609-1620 [DOI: 10.11947/j.AGCS.2018.20170551] [百度学术] 

    文章被引用时,请邮件提醒。
    提交

    相关作者

    暂无数据

    相关机构

    南京大学 地理与海洋科学学院
    西安理工大学 印刷包装与数字媒体学院
    中国科学院西安光学精密机械研究所 瞬态光学与光子技术国家重点实验室
    中国科学院西安光学精密机械研究所 光谱成像技术实验室
    西安交通大学 信息与通信工程学院
    0