1. 引言

土壤有机质是土壤中不可或缺的组成部分,为植物生长提供必要的养分,因此被视为评估土壤肥力水平的重要指标之一。传统土壤有机质含量测定常采用实验室理化分析方法,但存在时效差、费力、成本高且步骤繁琐等缺点,难以满足精准农业田间施肥管理的实用性和实时性需求。

相比之下,高光谱数据以其较高的光谱分辨率为优势,能够提供更详细、更精确的地表土壤信息,可以及时满足农业生产中多方面的需求。

近年来室内高光谱数据被国内外学者广泛应用于土壤理化属性估测研究中,以期为高光谱遥感技术在实际的应用中提供可靠的数据支持和科学依据。

在利用室内高光谱数据估测土壤化合物含量研究中,学者们发现有效选择土壤光谱的敏感特征是建立高精度土壤化合物含量反演模型的关键。周萍发现光谱微分处理技术是提取土壤成分信息的有效方法之一,可显著提高土壤有机质、氧化铁与土壤光谱之间的相关性。

然而,尽管高光谱数据在土壤有机质估测中具有潜力,但现有研究也面临着一些挑战。首先,传统的光谱变换方法在提高土壤光谱与化合物含量之间的相关性方面存在局限性,可能导致部分有用信息被剔除、噪声敏感、边界效应等问题。

其次,尚缺乏一种全面有效的方法来处理高光谱数据,消除干扰、滤除冗余共线信息,并有效的筛选出敏感波段。

技术流程

微分-瞬时频率变换方法技术流程

图1 微分-瞬时频率变换方法技术流程

数据预处理

对原始的室内土壤光谱数据进行预处理,包括有机碳含量和光谱吸光度的转换。

变换处理

对转换好的数据进行微分变换和希尔伯特变换,定义其光谱数据的解析信号,进一步求得光谱数据的瞬时频率。

建模分析

利用皮尔逊相关系数进行相关性分析,并基于精度评价指标进行特征波段的选择,构建估测模型。

2. 数据来源和研究方法

2.1 LUCAS光谱库数据集

LUCAS (Land Use Cover Area Frame Survey, LUCAS)是2009年采集的23个欧盟成员国地表土土壤数据,来自一项监测欧洲土地利用和土地覆盖的工程。LUCAS数据是目前最大的室内土壤可见光-近红外光谱库,包括19036个土壤样本点数据。

本研究选用位于罗马尼亚联邦共和国的土壤数据集,罗马尼亚气候温带大陆性,四季分明,夏季炎热,冬季寒冷多雨。土壤类型多样,包括棕色森林土、棕色土和黑色土,这些土壤具有较高的肥力,使得罗马尼亚成为农业生产的重要国家。

研究区域内土壤样本的离散光谱吸收度数据

图2 研究区域内土壤样本的离散光谱吸收度数据

研究区域内土壤样本的离散光谱反射率数据

图3 研究区域内土壤样本的离散光谱反射率数据

2.2 数据集预处理

首先,将每个土壤样本的光谱吸收度数据取两次测量的平均值,定义取平均值后的光谱吸收度数据集为{(aₘ,λ),m=1,...,M} = {(aₘₙ,λₙ),n=1,...,N}。为了更好的揭示土壤的光学特性,本文根据式(1)将光谱吸收度转换为光谱反射率:

rₘₙ = 10-aₘₙ

此外,将样本中总有机碳含量O= {oₘ,m=1,...,M}换算为更具有代表性的有机质百分含量S= {sₘ,m=1,...,M},即:

sₘ = oₘ × 1.724 × 10%

采用随机抽取的方法将光谱数据集划分为建模集和测试集,其中建模集样本738个,测试集样本323个,实验数据的有机质含量描述性统计结果见表1。

表1 研究区域内土壤样本的有机质百分含量描述性统计
数据集 样本数/个 最小值/% 最大值/% 平均值/% 标准差/% 变异系数/%
数据集 1062 0.24 11.94 3.60 1.86 0.517
建模集 738 0.24 11.94 3.59 1.87 0.521
测试集 323 0.29 11.75 3.63 1.84 0.508

2.3 微分-瞬时频率变换

经过微分变换处理后的离散光谱数据具有特征增强、消除基线漂移、平缓背景干扰等影响的优点,可显著提升光谱与有机质含量之间的相关性。光谱数据的频率信息能更敏锐地捕捉光谱的微小变化,可以更全面、深入了解土壤样本。

不同有机质含量的土壤一阶微分光谱反射率数据对比分析

图4 不同有机质含量的土壤一阶微分光谱反射率数据对比分析

不同有机质含量的土壤微分-瞬时频率光谱数据对比分析

图5 不同有机质含量的土壤微分-瞬时频率光谱数据对比分析

希尔伯特变换可以反映相邻2个波段间的变化,是一种有效求取瞬时频率的方法。所以结合微分变换和希尔伯特变换,本文提出微分-瞬时频率变换方法。首先,对土壤光谱进行一阶微分变换,随后对土壤微分光谱进行希尔伯特变换,并得到解析信号,进而得到微分光谱的瞬时频率信息。

2.4 敏感特征选择

在土壤有机质含量高光谱数据建模过程中,敏感特征的选择常采用土壤有机质含量与光谱反射率不同变换形式的相关分析进行确定,相关性越高,波段响应越敏感。因此,本文运用皮尔逊相关性分析方法进行敏感特征选择。

不同光谱变换方法与土壤有机质含量的相关系数矩阵

图6 不同光谱变换方法与土壤有机质含量的相关系数矩阵

为了更精准的选择出敏感波段,在相关性分析结果的基础上,以相关性最强的100个波段作为SVM估算模型的初始输入变量,采用二分法确定输入模型的最佳敏感波段数量,最终确定以相关性最强的200个波段作为估算模型的最佳输入变量。

2.5 估测模型建立

本文采用SVM算法构建有机质含量估测模型,并和PLSR进行对比。SVM作为一种非线性建模方法,在土壤参数估测中得到广泛应用,并取得了不错的效果。

基于微分-瞬时频率变换的SVM有机质含量估测模型构建过程如下:

  1. 对建模样本集和测试样本集进行归一化操作
  2. 以建模样本集为特征向量,对应实测的有机质含量样本作为目标变量
  3. 选择径向基函数作为SVM的核函数
  4. 采用建模集交叉验证和网格搜索法进行参数寻优

把测试集输入到训练好的模型中,通过计算每个土壤光谱的局部特征向量到超平面的距离,来预测输出值。

3. 结果及分析

3.1 基于微分-瞬时频率变换算法光谱特征分析

通过对一阶微分和微分-瞬时频率的光谱特征进行对比分析,发现本文提出的方法能够在较好的保持原曲线基本特征的基础上,进一步对原曲线较为平缓的区域进行区分,从而更好进行有机质含量敏感特征的选择。

经本文方法变换的敏感波长主要集中在2225nm、750nm附近,最为敏感的波长为1712nm。

在图4中存在的几处重要的水分吸收特征(1400nm、1890nm),在图5中仍然能够以显著的频率值体现出来;在图5的大多数波段中,曲线的变化相对平缓。然而,在图5中,可以明显观察到这些在图4平缓的波段内的曲线出现了明显的波动。

3.2 光谱与有机质含量相关性分析

本文采用传统光谱变换(对数的一阶微分、倒数的一阶微分、一阶微分、对数、倒数)、瞬时频率(直接对离散光谱进行希尔伯特变换)、微分-瞬时频率7类光谱处理方法对土壤有机质含量进行建模估测,用来对比分析微分-瞬时频率方法在提升土壤有机质含量估测精度的优势。

分析可知,原始光谱、对数、倒数(1/R)方法计算出的相关系数并不高。对数的一阶微分、倒数的一阶微分、瞬时频率、微分-瞬时频率均能明显提升光谱对有机质含量的敏感性。

整体分析可知,所有方法的敏感特征分布区域具有较强的一致性,并且在近红外波段(2200~2300nm)的相关性明显高于可见光波段(400~700nm)。

3.3 估测模型精度对比分析

表2 基于不同光谱处理算法与PLSR和SVM算法土壤有机质含量估测精度
模型 变换方式 建模精度 R² 建模精度 RMSE 测试精度 R² 测试精度 RMSE LCCC
PLSR 原始光谱 0.13 3.03 0.04 3.31 0.12
一阶微分 0.53 1.63 0.55 1.53 0.71
瞬时频率 0.60 1.38 0.55 1.52 0.71
微分-瞬时频率 0.66 1.17 0.64 1.23 0.80
SVM 原始光谱 0.78 1.19 0.70 1.30 0.67
一阶微分 0.89 0.83 0.80 1.13 0.80
瞬时频率 0.88 0.88 0.81 1.07 0.80
微分-瞬时频率 0.93 0.68 0.85 0.98 0.84
最佳估测精度

R² = 0.85

RMSE = 0.98

LCCC = 0.84

方法优势

高于其他对比算法

具有最佳估测能力

稳定性较优

模型对比

SVM模型优于PLSR

建模精度更高

测试精度更优

4. 结论与讨论

本文提出了一种基于微分-瞬时频率变换的土壤有机质含量反演方法,该方法首先对土壤光谱数据进行微分和希尔伯特变换,然后基于变换后的数据定义土壤微分光谱的解析信号,接着求出土壤解析信号的瞬时频率,得到土壤微分光谱的局部特征信息,最后基于局部特征信息建立估测模型。

主要结论

  • 微分-瞬时频率方法能够在保持原曲线基本特征的基础上,对平缓区域进行区分
  • 微分-瞬时频率变换算法的测试精度(R²=0.85,RMSE=0.98,LCCC=0.84)高于其他算法
  • SVM模型的建模精度和测试精度均优于PLSR模型

研究展望

  • 探索与高光谱影像技术结合的可能性
  • 实现对土壤有机质含量等关键参数的实时监测
  • 为精准农业和土壤肥力管理提供技术支持

由于微分-瞬时频率方法的核心是基于土壤光谱的局部特征去寻找和有机质含量之间的关系,所以对光谱的分辨率具有一定的要求,光谱分辨率过低的数据可能无法捕获到土壤光谱中的细微变化和局部特征。

但也正因为本方法侧重于捕捉土壤光谱中的局部特征,这些特征与土壤的基本性质和成分密切相关,而不受数据的整体特征影响。因此即使在不同的数据集、不同的土壤类型和地理环境下,这些局部特征仍然存在一定的规律性,并能够被本文的方法提取和利用。