随着全球信息技术与工业化的发展与融合,物联网、云计算应运而生,传感器技术与移动定位技术飞速发展,人类对地表系统的刻画能力空前提升,位置感知技术等大数据正在改变我们捕捉和分析人类活动的方式。地理信息相关数据的多源性与海量性逐步凸显,数据稀缺环境转变为数据丰富环境,数据驱动地理学的新模式已经出现,地理大数据也为地理现象的分布格局、相互作用及动态演化提供了前所未有的社会感知手段,使空间人文学与社会科学研究结合更加紧密。
涉及地理大数据聚类分析方法、地理大数据异常探测、地理大数据预测建模等多方面的地理分析技术不断发展,在城市规划、智能交通、环境保护、公共安全等领域研究应用成果不断涌现。尤其在旅游领域,海量地理信息与游客行为等数据的结合拓展了旅游地理的研究空间。
地理大数据与旅游统计数据、问卷数据等数据相比,涉及地理现象的时间、空间和属性维度,能够更加细致地刻画时空粒度、时空广度、时空密度、时空偏度和时空精度等"5度"特征。目前研究方法在大数据挖掘技术、时空分析方法、地理情感特征挖掘、地理大数据聚合、地理事件建模等方面已有较多探索,研究内容在旅游活动模式、旅游流动、社交媒体中的旅游偏好等方面已有涉猎,但地理大数据在旅游领域的数据分类和应用场景有待进一步梳理、使用挑战有待进一步明晰、研究内容也有待进一步拓展。
地理大数据的应用为旅游研究提供了新数据和技术,进而拓展了旅游相关理论的广度和深度。旅游作为多学科交叉融合的新兴学科,地理大数据融合能为包括旅游地理学在内的旅游学科底层理论构筑提供新的思路和范式。地理大数据数据和方法的多应用凸显了该领域的新兴,但也反映了旅游现象的复杂性。
目前国际上比较认可的旅游大数据分类模式是以数据来源分为3类:①UGC数据(用户生成数据,User Generated Content),包括在线文字数据和在线照片数据;②设备数据(按设备),包括GPS数据、移动漫游数据、蓝牙数据等;③交易数据(按操作),包括网络搜索数据、网页访问数据、在线预订数据等。也有学者分为UGC数据、位置数据、事务数据3类或者UGC数据、操作数据(网络搜索)和物联网数据。
分类标准 | 维度 | 举例 |
---|---|---|
数据来源 | UGC数据(用户生成) | 在线文字数据和在线照片数据等 |
设备数据(按设备) | GPS数据、移动漫游数据/基站定位数据、蓝牙定位数据、Wifi定位数据等 | |
交易数据(按操作) | 网络搜索数据、网页访问数据、在线预订数据等 | |
数据存储 | 本地数据 | 市政公共服务数据、目的地及景区自有数据、本地设备收集数据等 |
外部数据 | 电信运营商数据、互联网在线数据、其他行业(非本地)数据等 |
UGC数据涉及数字视觉、文本和音频数据等,微博、抖音、Facebook、Instagram、Twitter、YouTube、Flickr等多个社交媒体平台成为获取UGC数据的重要来源。UGC数据驱动了地理空间语义、旅游目的地感知、情感体验等方面研究。
随着物联网的蓬勃发展,各种设备和传感器被开发和使用来追踪游客的行动,如GPS数据、移动漫游数据(手机信令数据)、蓝牙数据、RFID数据和WIFI数据。这些数据能精准感知游客时空活动模式,为旅游管理者提供更高效的决策依据。
交易数据帮助旅游研究者洞察游客消费行为特征和旅游市场趋势。在旅游领域,交易数据记录涉及旅游者进行旅游消费的相关操作(如网页搜索、网页访问、在线预订和购买等)和旅游市场供应商之间的交易、活动和事件等。
以兴趣点(POI)为主的数据为旅游研究提供了多元场景。POI是一种数据集合的点数据,单体POI数据包含了实体名称、经纬度、地址等信息。作为一种主客共享的空间数据,POI能够反映旅游要素的空间格局。
客观环境数据主要通过遥感影像、街景图片、气候气象等数据对旅游地环境进行深度刻画,为旅游地理环境和旅游人地关系的研究提供了数据支撑。随着大数据时代的到来以及计算机处理技术的发展,遥感影像、街景图片、气候气象等多源数据大量介入。
地理大数据聚合的本质就是不同类型大数据的信息互补、增强与催生。地理大数据形式与结构多样的特征决定了数据融合存在多方面挑战,目前多源地理信息融合技术主要集中在矢量信息融合、地址信息一致化、同名实体识别与语义对齐、地理实体关系构建等方面。
渠道划分 | 数据类型 | 举例 |
---|---|---|
人类旅游活动/行为数据 | UGC数据 | 网络文本的在线签到数据、用户属地信息、自然语言文本的地理信息等;网络图像的地理标签信息等;音频数据的地理语义数据等 |
设备数据 | 与旅游者位移相关的GPS数据、移动漫游数据、蓝牙数据、RFID数据和WIFI数据等 | |
交易数据 | 交通消费数据、不同地区和时间的在线预订数据和消费数据等 | |
旅游地理环境数据 | POI数据 | 工作、旅游、娱乐和寻路等目的地活动数据等 |
客观环境数据 | 气象数据、地质地貌数据、卫星遥感数据、无人机影像等 |
大数据不仅仅是一种技术手段,也成为了一种自下而上的研究范式。在大数据视角下,世界由相关关系而非因果关系主导,这导致未来可以在旅游大数据研究中而无需依赖底层的结构化原理或机制,这种现象超出了旅游和地理研究中强调的传统科学范式。
基于前人的研究,人类旅游活动/行为数据和旅游地理环境数据的分类涵盖了绝大多数的数据类型,但仍有一些其他渠道的大数据因场景不同而具备多种属性,较难准确归类,地理大数据数据分类体系有待进一步优化。
随着自然语言处理、深度学习、空间分析、地理数学模型等数据分析技术的不断引入,基于地理大数据的大规模、高精度的旅游现象定量化感知逐渐成为旅游研究中重要的研究方法。
旅游学、地理学、社会学、心理学等学科理论的引入和发展不仅丰富了地理大数据在旅游学研究的角度和思路,还为旅游现象以及旅游活动的现象解释提供了支撑。尽管与社会科学中公认的理论相比,地理大数据的理论发展非常有限,在解决数据与理论之间的关系问题上仍有很大差距。
基于以上的研究挑战,地理大数据的融合既要注重多源数据样本的获取,也要建立数据获取规范和评价体系。在研究样本方面,未来可以基于大数据的时间信息、空间信息和属性信息,对旅游行为时间演变、旅游景区游客感知等社会人文特征进行机制揭示和规律挖掘。
未来地理大数据分析技术的创新在旅游领域可以从时间信息分析、空间信息分析、属性信息分析3个方面进行突破。在对地理大数据的时间信息分析方面,连续时间序列下的旅游事件分析、客流预测、长期趋势变动已被广泛应用,但是仍需加强旅游事件的非平稳时间序列及预测精度的相关研究。
首先在理论方面,通过介绍人类旅游活动/行为数据和旅游地理环境数据的相关文献和案例,参考旅游地理学、旅游行为学等研究梳理了地理大数据在旅游领域(人类旅游活动、旅游地理环境、旅游人地关系)的理论支撑重点。其次,在应用层面概括阐述了UGC数据、设备数据、交易数据、POI数据、客观环境数据等地理大数据在旅游领域的创新应用。最后,从理论研究更新、多源数据融合、分析技术突破3个方面阐述了研究展望。
在理论上需将自下而上的科学研究范式标准化系统化,结合不同的事件和场景探索丰富旅游学的理论边界,数据上有待向大数据与其他数据的互补结合转变,分析技术有待向提高分析方法自适应性、涉入旅游现象特殊性变量的方向转变。
免责声明
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。