研究背景与意义

黑土地是东北地区孕育粮食的重要土壤资源,土壤肥力高。黑土地得名于其深色的表土层,人们一般将其称为黑土层,黑土层含有大量有机质,在保水保肥和增加土壤肥力方面具有独特的优势。

然而,自20世纪50年代大规模开垦以来,东北黑土地一直处于高强度且不合理的利用状态,结合土壤侵蚀导致黑土地退化严重,造成黑土层出现变"薄"、变"瘦"、变"硬"问题。近年来,已有研究基于样点和小区域尺度表明黑土层变薄速率大约介于0.2~0.4cm/a,黑土层长期变"薄"是不可忽视的问题。

黑土层厚度与农田土壤肥力和质量密切相关,准确刻画东北松嫩典型黑土区耕地黑土层厚度的空间分布对黑土地保护和农业可持续发展具有重要意义。然而,常用的预测模型在平原漫岗地区进行数字制图具有较大的难度,如何准确预测黑土层厚度的空间分布特征是亟待解决的问题。

研究区概况

研究区位于中国东北松嫩典型黑土亚区,位于121°59′ E—128°12′ E,42°57′ N—49°59′N范围内,主要分布在黑龙江省以及吉林省,是中国8个重要农业区之一。

研究区内主要地形是平原和漫岗,海拔范围200~500m,地势平缓,其中漫岗地形位于研究区的东部。其面积约为1.65×105km2,年平均气温0~4°C,年均降雨量400~550mm。

研究区土壤类型主要以黑土、黑钙土为主,这2种土壤类型在土壤学发生分类中属于典型黑土,其主体自北向南呈弧形分布,黑土层厚度大于30cm的区域主要分布在该地区。研究区内的其他土壤类型还包括草甸土、白浆土和暗棕壤等。

研究区概况

研究方法

1. 数据来源与处理

黑土层厚度测定

基于106个剖面点的土壤分层符号、土壤颜色和有机碳含量信息,参考暗沃土的暗沃表层定义,从以下3个方面对黑土层厚度进行判断:

  • 土壤分层符号介于A层、AB层和B层范围内
  • 土壤润态的明度和彩度≤3
  • 土壤有机碳含量≥6g/kg
土壤剖面有机碳含量拟合曲线

环境变量获取

基于SCORPAN土壤景观模型,收集可获取的地形因子、气候因子、遥感因子、土壤因子及其他变量作为预测黑土层厚度的辅助环境信息。

地形因子(12个)

气候因子(4个)

遥感因子(19个)

土壤因子(6个)

环境变量筛选方法:
因子重要性排序 相关性剔除法

2. 模型方法

多元线性回归 (MLR)

通过一系列解释变量的线性组合来建立回归关系,使用最小二乘法估计系数,对线性数据具有较好的拟合效果。

随机森林 (RF)

通过构建多个决策树并随机选择特征和数据子集来进行学习,具有模型性能高、降低过拟合等优点。

梯度提升决策树 (GBDT)

基于梯度提升算法进行迭代,在每轮迭代中加入新的决策树来拟合损失函数的梯度,以实现损失函数的最小化。

极端梯度提升 (XGBoost)

相比GBDT加入并行化和正则化,支持自定义损失函数和分裂标准,具有运行速度快,降低过拟合等特点。

随机森林回归克里格 (RF-RK)

结合RF和普通克里格方法,首先利用RF建模预测,然后对残差项进行克里格插值,最终相加得到结果。

堆叠泛化模型 (Stacking)

组合多种基础模型(RF和MLR)的预测结果作为输入,使用岭回归作为元模型进行输出,得到更准确的预测结果。

3. 精度评价指标

决定系数 (R²)

衡量模型解释变量与目标变量之间关系的强度,值越接近1表示模型拟合越好。

平均绝对误差 (MAE)

预测值与真实值之间绝对误差的平均值,数值越小表示预测精度越高。

均方根误差 (RMSE)

预测值与真实值误差平方的平均值的平方根,对较大误差更敏感。

研究结果

1. 黑土层厚度描述性统计

黑土层类型 土层厚度(cm) 样点数量(个) 占比(%) 平均值(cm) 标准差(cm)
0 20 19 0 0
薄层 0~30 26 25 21.87 5.28
中层 30~60 28 26 47.96 8.84
厚层 >60 32 30 90.55 27.80

松嫩典型黑土区所有样点整体的黑土层厚度平均值为45.37cm,最小值是0cm,最大值是170cm,标准差是37.45cm,变异系数是82.55%,具有较强的变异程度。

2. 变量筛选效果

环境变量重要性排序

环境变量重要性排序

GPP、LS和LSTm是解释本研究区黑土层厚度空间分布的最优协变量,在平原漫岗地区遥感变量相比地形变量能够更好的解释黑土层厚度的空间分异特征。

变量筛选前后模型性能对比

模型 R²(筛选前) R²(筛选后) 提升幅度
MLR 0.07 0.39 +0.32
RF 0.40 0.44 +0.04
GBDT 0.36 0.41 +0.05
XGBoost 0.29 0.43 +0.14
RF-RK 0.42 0.46 +0.04
Stacking 0.40 0.47 +0.07

变量筛选后不同模型的预测性能均得到了一定程度的提升,其中MLR提升最为明显,R²提升了0.32,其他模型提升幅度相对较小,R²平均提高0.11。

3. 模型预测性能比较

模型 MAE(cm) RMSE(cm) 排名
Stacking 0.47 21.02 27.12 1
RF-RK 0.46 21.86 27.59 2
RF 0.44 22.09 27.99 3
XGBoost 0.43 22.57 28.33 4
GBDT 0.41 22.67 28.83 5
MLR 0.39 22.42 29.13 6

Stacking组合多种模型的优点,预测性能表现最佳(R²=0.47,MAE=21.02cm,RMSE=27.12cm),其次是RF-RK和RF。在平原漫岗地区,RF-RK和Stacking可以作为黑土层厚度预测的有效方法。

4. 黑土层厚度空间分布

松嫩典型黑土区耕地黑土层厚度分级

松嫩典型黑土区黑土层厚度分级图

主要发现:

  • 不同模型预测的松嫩典型黑土区黑土层厚度空间分布趋势基本一致,60cm以上的黑土层主要分布在研究区的东北部和东南部,而30cm以下的黑土层主要分布在研究区的西南部。
  • 东北黑土区中厚层黑土层主要集中在松嫩典型黑土区和三江典型黑土区,其中厚层黑土层主要分布在松嫩典型黑土区的东北部和三江平原的偏北部。
  • 薄层黑土层主要分布在东北黑土区的东南部,这是由于该区域黑土层厚度初始值本就偏低,再加上强烈风蚀的影响。

研究结论

主要结论

  1. 基于有效的变量筛选方法,不同模型的预测性能均有一定程度的提升,R²平均提高0.11。其中MLR提升幅度最大为0.32,而RF仅提升0.04。
  2. 基于有限样点,在平原漫岗地区比较了不同模型对黑土层厚度的预测效果,发现Stacking预测性能最佳,其次是RF-RK和RF,证实了混合模型相比单一的模型对于黑土层厚度的预测具有更优越的预测性能。
  3. 对于典型黑土区的黑土层厚度,不同模型的预测结果呈现出相似的空间分布格局。统计不同模型预测的黑土层厚度,得到其均值介于45.50~49.63cm范围。
  4. GPP、LS和LSTm是解释本研究区黑土层厚度空间分布的最优协变量,在平原漫岗地区遥感变量相比地形变量能够更好的解释黑土层厚度的空间分异特征。
  5. 基于Stacking和RF-RK模型,绘制东北黑土区耕地的黑土层厚度分级图,结果表明东北黑土区中厚层黑土层主要集中在松嫩典型黑土区和三江典型黑土区,薄层黑土层主要集中分布在东北黑土区的东南部。

研究意义

本研究为东北松嫩典型黑土区耕地黑土层厚度的空间分布提供了准确的数据支持,对黑土地保护和农业可持续发展具有重要意义。黑土层厚度的空间分布信息能为黑土区耕地黑土保护和农业可持续发展提供数据支持,为制定针对性的黑土地保护措施提供科学依据。