引言

近年来,传统旅游活动的范围和强度逐渐超出了自然环境的承载能力,破坏了旅游景点的生态环境,阻碍了旅游业可持续发展。生态旅游作为一种可持续的旅游形式,逐渐受到大众的关注。

生态旅游是依托于生态环境,致力于生态资源的可持续发展和生态知识与文化传承,并能给当地带来经济利益的旅游活动。生态旅游适宜性评价是对特定区域能否开发生态旅游地与开展生态旅游活动进行判断,对区域适宜性进行分区,从而为开发规划及区域可持续发展提供科学理论依据。

在研究方法上,现有研究从定性分析向层次分析法(AHP)、模糊层次分析法(FAHP)、灰色多层次分析法和神经网络等多种定量分析方法转变。生态旅游标准确定及潜在生态旅游地选址研究方面,国外多采用遥感(RS)与地理信息系统(GIS)相结合的方法,而在生态旅游开发适宜性评价方面,多将GIS与多标准决策分析方法(MCDA)相结合,最常用的方法为AHP。

在指标体系的构建上,现有研究多从自然环境、资源、经济3方面条件进行考虑。虽然国内外对生态旅游适宜性评价方面研究较为深入,但在研究区域方面,对于像武陵山片区这一典型山区区域的研究较少,在评价方法方面还是囿于现有方法,没有新的突破。

本文采用随机森林算法对湖南武陵山片区生态旅游适宜性评价展开实证研究,从自然环境、资源禀赋和开发条件三方面构建特征矩阵,运用随机森林算法得到适宜性程度,并对各不同适宜性程度的区域进行影响因素分析,可为湖南武陵山片区生态旅游开发和可持续性发展提供依据与支持,为巩固脱贫成果提供理论与技术指导。

研究方法

2.1 理论分析

机器学习方法通过非线性拟合建立特征变量与已知样本类别之间的关系,即建模过程,运用构建好的模型预测未知样本的分类结果。该方式进行预测不要求完备的指标体系,避开了数据量纲不一致、特征因子相关性和权重设置等问题,提升预测结果的可靠性。

机器学习基于特征矩阵得到预测结果的研究思路与传统方法基于构建指标体系并对指标赋值的研究方式具有相似性,将机器学习引入适宜性评价领域具有一定的理论可行性。

2.2 数据关系映射

将机器学习模型引入到生态旅游适宜性评价方面,需将适宜性评价中的评价指标与机器学习中的训练模型相结合,建立一种数据关系映射。生态旅游的适宜性程度即评价结果映射为机器学习中已知样本的标签或未知数据的预测分类结果,所有对生态旅游适宜性产生影响的因子映射为机器学习中的特征变量。

2.3 随机森林算法

随机森林(Random Forest, RF)算法是一种以决策树为基本单元的集成学习Bagging算法,通过非线性拟合建立特征与样本类别之间的关系。

在构建决策树时,有放回的在训练数据中抽取部分特征样本进行K轮训练,每棵树使用的特征样本不同,可得到不同的训练结果,得出不同的训练模型,即基评估器。进行预测时,在分类问题中选择多数分类结果,在回归问题中取多个回归结果的平均值作为集成评估器的预测结果。

本研究将影响生态旅游适宜性的因子作为随机森林算法中的特征因子,将生态旅游适宜性结果作为随机森林算法最终预测结果,本研究使用Python中的scikit-learn库开展相关实验。

湖南武陵山片区生态旅游适宜性评价技术路线

图1 湖南武陵山片区生态旅游适宜性评价技术路线

实证分析

3.1 研究区概况

武陵山片区是长江流域重点水源涵养、水土保持和生态安全屏障功能区,也是国家重点生态功能区和生物多样性保护区,包括湖北、湖南、重庆、贵州四省市相交地带的71个县(市、区)。

湖南武陵山片区包括湘西州、张家界市、常德市、怀化市、邵阳市、娄底市和益阳市部分所辖37个县(市、区),总面积9.49万km²,占湖南省总面积的43.8%。区内自然生态旅游资源丰富,有2处世界自然遗产,9个国家级自然保护区、22个国家森林公园、3个5A级景区以及38个4A级景区。

湖南武陵山片区地理分布

图2 湖南武陵山片区地理分布

3.2 数据来源

本文涉及到多源异构地理空间数据,涵盖遥感、气象、基础地理数据等,具体包括POI、DEM、人口、遥感影像、路网、河流水系、土地利用、气象、行政区划和生态系统服务价值数据等。

表1 数据来源

数据类型 数据年份 数据来源 数据描述
景点、居民点POI数据 2022 百度地图API数据开放接口 经数据清洗得到255个景点
DEM数据 2019 地理空间数据云 ASTER GDEM V3 30m空间分辨率,反映区域高程信息
人口数据 2020 WORLDPOP全球高分辨率人口计划项目数据集 空间分辨率为3弧度,在赤道处约为100m
遥感数据 2020 地理空间数据云 30m Landsat8OLI_TIRS数据,用以计算归一化植被指数(NDVI)
路网数据 2020 OSM 反映交通状况,计算道路密度与距道路距离

3.3 特征矩阵构建与数据处理

生态旅游适宜性评价结果受到多因素影响,在选择影响适宜性的因素时,需综合考虑选择的特征指标,不仅要全面也要避免选择相关性高的特征,同时也要充分考虑特征的可获得性。

自然环境

自然生态环境是进行生态旅游的前提条件,限制着旅游开发方向与承载力水平。自然环境主要表现在地形、地貌、坡度、植被、气候、水系等方面。

资源禀赋

资源禀赋是一个地区进行生态旅游的基础条件,制约着生态旅游的发展。土地利用类型不同,直接影响到其环境承载力。

开发条件

生态旅游开发条件是进行生态旅游的必要条件。为生态旅游的开发提供资源,并促进生态旅游稳定发展的外部支撑。

表2 湖南武陵山片区生态旅游适宜性特征选择

影响因素 特征选取 特征说明
生态旅游自然环境 NDVI 反映区域的植被覆盖程度,值越大表示自然环境越好
地形起伏度 影响自然景观形态特征
坡度 影响植被生长,坡度越缓越适宜
坡向 影响自然生态景观格局
高程 影响气候因子与人类活动
水系密度 水系是构成自然生态景观的重要元素
距水域距离 反映利用水源的便利程度,对休闲旅游有重要作用
气温 多年平均气温,影响舒适度及停留时间
降水 多年平均降水,影响停留时间与路线选择
湖南武陵山片区生态旅游适宜性评价部分特征因子

图3 湖南武陵山片区生态旅游适宜性评价部分特征因子

结果与分析

3.4.1 模型可靠性评估

混淆矩阵是二分类问题的多维衡量指标,直观的描述了模型预测结果类型与测试数据真实属性之间的关系,是评估分类器可靠性的一种常用方法。基于混淆矩阵选择精确度(Precision)、召回率(Recall)和F1分数来评估模型性能。

86.49%

十折交叉验证平均精确度

88.28%

召回率

87.56%

F1分数

模型ROC曲线图及AUC面积

图4 模型ROC曲线图及AUC面积

3.4.2 生态旅游适宜性分析

利用训练好的随机森林模型对湖南武陵山片区特征因子进行预测,得到各网格预测概率值,概率值的大小代表每个网格进行生态旅游的适宜性程度,值越大生态旅游适宜性越高,反之,概率值越低,生态旅游适宜性越低。

湖南武陵山区生态旅游适宜性等级分布

图5 湖南武陵山区生态旅游适宜性等级分布

生态旅游高度适宜区

  • 适宜性概率0.69~0.90,面积38679.73km²,占研究区总面积的44.96%
  • 空间分布上,高度适宜区分布均衡,研究区北部、中部和南部均有成片分布
  • 旅游资源分布方面,高度适宜区分布着张家界、天门山等高级别旅游景区
  • 高度适宜区植被覆盖度高,水资源丰富,气候适宜,生物多样性高

生态旅游适度适宜区

  • 适宜性概率位于0.53~0.69,面积为23714.77km²,占总面积的27.57%
  • 空间分布上,主要分布于高度适宜区邻近区域,与高度适宜区交替分布
  • 该区内有着常德石门文庙、龙王洞等3A级及以上旅游景区
  • 这些区域植被覆盖度较高,但其较高度适宜区来说,坡度较大

生态旅游边际适宜区

  • 适宜性概率位于0.36~0.53,面积为13550.4km²,占总面积的15.75%
  • 主要分布于北部、中部及东南部,分布较为稀疏
  • 区域植被覆盖度较低,气温较高,降水较少,水源不足
  • 优秀生态旅游资源较少,分布分散,知名度不高

生态旅游不适宜区

  • 适宜性概率位于0.15~0.36,面积为10079.13km²,占总面积的11.72%
  • 主要分布于研究区北部,西部以及东南方向
  • 区域植被覆盖率低,包括了大部分城镇区域及永久基本农田
  • 生态旅游资源匮乏,品位低,生态环境脆弱
湖南武陵山片区生态旅游开发策略

图6 湖南武陵山片区生态旅游开发策略:"两中心一带一板块"示意图

各特征重要性度量

图7 各特征重要性度量

结论与讨论

4.1 结论

本研究以湖南武陵山片区为研究对象,融合多源空间数据,创新地将机器学习算法应用到生态旅游适宜性评价方面,利用随机森林模型对湖南武陵山片区生态旅游适宜性开展实证研究,得出以下结论:

  1. 将机器学习算法引入到区域生态旅游适宜性评价领域作为一种新方法,规避了传统评价方法中权重设置的主观性与计算的复杂性,在客观性与准确性上有着巨大的优势。这是本文最大的创新之处。
  2. 随机森林算法可以有效应用在区域生态旅游适宜性评价方面,可作为适宜性评价方面的一种新方法。通过构建19维特征矩阵,利用随机森林模型对已知的生态旅游景点进行建模,经过模型训练与优化,得到每个网格生态旅游适宜性概率。
  3. 湖南武陵山片区生态旅游开发潜力巨大。适宜性结果划分为高度适宜、适度适宜、边际适宜和不适宜4个等级,面积分别占总面积的44.96%、27.57%、15.75%和11.72%。
  4. 土地利用类型是影响湖南武陵山片区生态旅游适宜性程度最大的特征因子,占比达到28.98%。人口密度、距景点距离和生物丰富度等因子的影响也较大,分别为16.34%、12.2%和10.65%。
  5. 根据适宜性评价结果,提出生态旅游开发方向。研究区两处世界自然遗产以及多个国家级自然保护区、森林公园、湿地公园和高级别景区都分布在高度适宜与适度适宜区。

4.2 讨论

随机森林算法应用在生态旅游适宜性评价中,克服了传统方法中权重设置的主观性干扰因素,利用已知样本实现对未知大规模样本的预测,符合适宜性评价的工作实际。且基于数据映射,有着较强的可行性,评价结果可为域内生态旅游开发布局提供支撑。

同时,本文也存在以下不足及改进之处:

  • 由于数据的可获取性,本文构建的特征矩阵还需进一步完善
  • 可探索欠发达山区生态旅游适宜性的关键影响因素,筛选出重要关键的特征因子
  • 不局限于空间尺度的分析,可加入时间维数据,探索生态旅游适宜性的时空演变规律
  • 目前基于机器学习方法的生态旅游适宜性评价研究还有待深入,未来可进行不同机器学习方法之间的对比分析

* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。