1 引言

新世纪以来,我国生态文明建设取得突出成就。随着"两山理论"被系统提出,生态旅游这种绿色环保的旅游方式日益受到社会各界的普遍关注。面对新时代人民群众日益增长的旅游休闲需求与生态旅游发展不平衡、不充分之间的矛盾,以及近年来国内外疫情对旅游市场的冲击,亟需通过生态旅游的高质量发展以平衡供需矛盾。

随着人们对气候变化、环境保护的日益关注,生态旅游作为一种将环境保护、可持续发展及社区参与相结合的旅游形式,自20世纪80年代系统提出以来,广受业界关注,有关的扩展研究也此起彼伏。与传统大众旅游所不同,生态旅游更加注重区域自然环境保护、游客教育与社会经济效益,力图使多方受益又不破坏自然环境,其发展理念与我国生态文明建设不谋而合。

国内外关于生态旅游的研究已成系统,国外学者起步最早并奠定了理论基础,逐渐发展出景观生态学、生态经济学、生态人类学、可持续发展理论、利益相关者理论等诸多分枝,现已成为生态学、旅游学、地理学、经济学、地理信息科学等多学科交叉问题。

研究方法也趋向于与其他因子评价方法结合,诸如层次分析法(AHP)、模糊层次分析法(F-AHP)、德尔菲法、问卷调查、多准则决策(MCDM)、有序加权平均算子(OWA)、GIS等方法被广泛应用于生态旅游适宜性评价研究。

国内关于生态旅游方面的研究最早是基于西方生态学及生态旅游相关理论而兴,并取得长足发展。20世纪90年代,国内生态旅游研究兴起,研究方向逐渐由基础理论研究转向案例分析。经过近30年的发展,研究方法也由最初的定性评价到定性定量结合再到定量评价方向转变。

近年来,随着数据挖掘和机器学习技术的进步以及多源空间数据的日益普及,生态旅游适宜性评价由案例研究逐渐转向数据驱动。当前,国内基于机器学习进行生态旅游适宜性评价的研究还极其有限,尚未有较多成果对其进行系统研究。

2 研究区概况、研究方法与数据来源

2.1 研究区概况

神农架林区位于湖北省西北部(图1),是国内首个同时获得联合国教科文组织世界地质公园、人与生物圈自然保护区和世界遗产3大保护制度共同录入的名录遗产地,拥有神农架国家公园、神农架国家级自然保护区及大九湖国家湿地公园等著名景点,有"中国天然氧吧"之称。

神农架林区地理位置及生态旅游景点空间分布

图1 神农架林区地理位置及生态旅游景点空间分布

神农架林区的地理位置介于109°56′ E—110°58′ E,31°15′ E—31°75′ E,总面积约3232.77km²,常住总人口(2020)约6.7万人,全区林地占比85%以上,最高峰神农顶(华中屋脊)海拔3105.4m,相对高差2707.4m,垂直地域分异明显。

2.2 研究方法

2.2.1 实验设计

本文融合多源地理空间数据进行生态旅游适宜性评价研究工作(图2),具体数据处理和建模流程如下:

生态旅游适宜性评价技术路线

图2 生态旅游适宜性评价技术路线

2.2.2 特征构建

为了将多源空间数据进行聚合,本文采用30m×30m的格网进行相应的数据处理与分析。根据特征选取的科学性、系统性、代表性与可获得性原则,构建本研究所需特征因子如表1所示。

表1 生态旅游适宜性评价因子选取

影响因素 特征选取 特征处理 特征释义
生态环境 土地利用 矢量底图掩膜提取地表覆盖数据 表征区域地表覆盖状况,可直观区分居民地与植被覆盖区
生态环境 NDVI NDVI=(NIR-R)/(NIR+R) 归一化植被指数,反映区域植被覆盖状况,表征区域生态环境质量
生态环境 年平均气温 提取年平均气温栅格值,再经克里金插值至30m空间分辨率 影响区域气候的重要指示因子,发展生态旅游与植被生长皆需适宜的温度
生态旅游适宜性特征因子

图3 生态旅游适宜性特征因子

2.2.3 XGBoost算法

XGBoost即极限梯度提升算法(eXtreme Gradient Boosting)是由Chen等在梯度提升决策树GBDT (Gradient Boosting Decision Tree)基础上所设计并优化的一种Boosting代表性算法,致力于让提升树突破自己的计算极限,以实现性能优秀、计算快速的工程目标。

XGBoost的目标函数包括损失函数和正则化项2部分:

L(φ) = Σi=1n l(ŷi,yi) + Σk=1K Ω(fk)

式中:i表示数据集中的第i个样本;n为训练样本数量;k为所有树(K)中的第k棵树;l(ŷi,yi)表示传统可微凸损失函数,衡量真实标签yi和预测标签ŷi之间的差异;Ω(fk)为正则项,有助于平滑学习权重,避免模型过拟合。

2.2.4 模型评估指标

混淆矩阵是二分类问题的多维衡量指标,是模式识别领域中呈现算法分类性能的常用方法,描绘了样本数据的真实属性与识别结果类型之间的关系。基于混淆矩阵可计算模型准确率(accuracy)、精确度(precision)、召回率(recall)、F1分数、特异度(specificity)、假正率(FPR)等多维衡量指标。

2.3 数据来源

本文涉及多源地理空间数据,涵盖了基础地理信息、生态环境、地质地貌、社会经济等诸多方面。具体数据来源如表2所示。

表2 本文数据来源

数据名称 数据来源 数据年份 数据说明
气象数据 国家地球系统科学数据中心-黄土高原分中心 2020 表征区域气候条件,包括全年平均气温和降水
Landsat8遥感数据 美国地质调查局 2020 空间分辨率为30m,用以计算NDVI、水体指数

3 结果及分析

3.1 模型评估

通过设置不同分类阈值,衡量不同阈值下的各分类指标(表3)并辅以可视化显示(图4)。随着阈值的增加,模型总体分类准确率先升后降并在0.6处达到峰值且此时F1值也表现最佳(0.9524)。

表3 不同阈值下模型各分类评估指标

概率阈值 准确率 精确度 召回率 F1 特异度 FPR
0.1 0.8567 0.7772 0.9932 0.8720 0.7246 0.2754
0.5 0.9500 0.9373 0.9627 0.9498 0.9377 0.0623
不同概率阈值下的混淆矩阵

图4 不同概率阈值下的混淆矩阵

为进一步优化模型,降低模型过拟合风险,本文使用10-折交叉验证综合评估模型分类性能。由表4可知,模型在10-折交叉验证下的总体分类准确率达89.44%,且对少数类(正类)样本的预测准确率达89.45%并兼有较高的召回率(89.68%)。

表4 10-折交叉验证下模型各评估指标均值

准确率 精确度 召回率 F1
0.8944 0.8945 0.8968 0.8745
模型拟合ROC曲线及AUC面积

图5 模型拟合ROC曲线及AUC面积

ROC曲线左上凸趋势明显且离纯随机分类器的ROC曲线(图中蓝色虚线)的距离较远,此时的AUC值为0.9593,表明模型分类性能良好,达到理想状态。

3.2 结果分析

将特征矩阵导入预先训练好的模型并进行分类预测,得到每个格网适宜开展生态旅游类概率,并将预测结果进行可视化得到区域生态旅游适宜性制图结果(图6)。

神农架林区生态旅游适宜性区域划分

图6 神农架林区生态旅游适宜性区域划分

生态旅游高度适宜区,其适宜性概率介于0.82~0.99之间,面积为1430.35km²,占林区总面积的43.97%,主要分布于木鱼镇东南部及中部关门山景区、天生桥景区、香溪源景区和神农坛景区等区域。

生态旅游中度适宜区,其适宜性概率介于0.53~0.82之间,面积为513.31km²,占林区总面积的15.78%,主要分布于高度适宜区的边缘且整体分布零散。

生态旅游边际适宜区,其适宜性概率介于0.21~0.53之间,面积为381.71km²,占林区总面积的11.73%,主要分布于不适宜发展区的边缘过渡区域。

生态旅游不适宜区,其适宜性概率介于0.00~0.21之间,面积为907.40km²,占林区总面积的27.89%,主要分布于下谷坪土家族乡神农溪流域居民点及高山区域等人类活动密集区域。

典型区域结果验证

图7 典型区域结果验证

选择神农顶、天燕和神农坛3个景区作为典型区域将预测结果与遥感影像叠加,分析发现典型区域内的适宜性概率整体较高,高度适宜区面积占比较大,符合区域发展实际。

3.3 驱动因素分析

通过对模型返回的特征重要性排序结果(图8)进行分析,生态环境因素对生态旅游适宜性模型有很大影响。其中,NDVI贡献率最高(26.86%),其次是年平均气温(11.61%)和土地利用(5.89%)。

特征重要性排序结果

图8 特征重要性排序结果

社会经济因素同样对模型有较大贡献率,其中贡献度最高的是距道路距离(8.90%),反映了区域交通通达性。地质地貌因子中,对模型贡献率最大的特征是坡度(6.10%),其余因子高程(3.94%)、地质(2.53%)、坡向(2.05%)等贡献率较低。

4 结论与讨论

4.1 结论

本文基于机器学习思想运用Boosting集成代表算法XGBoost对神农架林区的生态旅游适宜性进行实证研究,取得了良好的分类效果,得出如下结论:

  1. 基于XGBoost算法的生态旅游适宜性评价模型立足于数据挖掘思想和机器学习技术从已有数据样本中识别出潜在的模式或规律,从而避免了人为因素介入赋予特征权重,增强了评价结果的客观性。
  2. XGBoost生态旅游适宜性评价模型在测试集上10折交叉验证下的总体分类准确率为89.44%,召回率为89.68%,兼有较高AUC值(0.9593)的同时F1分数(0.8745)也较高。
  3. 特征重要性排序结果显示,生态环境因素中的NDVI(26.86%)与年平均气温(11.61%)和社会经济因素中的距道路距离(8.90%)特征对生态旅游适宜性模型的贡献率最大。

4.2 讨论

本研究综合机器学习技术和空间数据挖掘思想对生态敏感区的生态旅游适宜性进行了实证评价研究,取得了良好的分类效果,但也存在理论、数据和应用层面的优势及不足:

* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。