Quality Evaluation Method of We-Map Road Network Based on Spatial Similarity
微地图是一种面向大众的新型地图,是传统地图在自媒体时代下的发展和补充。针对微地图数据来源广泛,质量参差不齐的问题,本文提出了一种基于空间相似性的微地图道路网质量评价方法。首先,将上下文信息与形状、方向、距离、拓扑关系以及一维线特征5个空间特性结合,计算微地图数据与参考数据的空间相似性;然后,对样本数据组合,并利用熵值法计算客观权重,取平均值作为各评价指标的权重系数;最后,采用可拓云评价法完成对微地图数据定量计算与定性分析结合的综合评价。本文使用9组不同质量的微地图道路网数据进行实验,结果表明,本文方法符合微地图精度低、内容少的特点,质量评价结果与实际更为符合。相较于模糊综合评价法,本文将精度低,但内容与参考数据一致的微地图数据评价等级提升为优;相较于现有的线要素空间相似性评价法,本文将精度低,但根据用户需求制图,且有重要地标参与计算的微地图数据评价等级提升为良。本文方法对微地图数据有较强的适用性,为微地图道路网质量评价提供了可行方法。
微地图是自媒体时代下产生的面向大众的新型地图,能够有效弥补传统地图在制作与传播上的不足。区别于传统地图,微地图具有制图精度低、数据量小、表达内容少等特点。但由于微地图对制图者无门槛要求,数据来源广泛,导致地图质量参差不齐,严重影响了微地图应用的普及度和可信度。
目前,常用的矢量地图数据质量评价方法有对比参照法、匹配评价法、可信度度量等。对比参照法是根据选取的评价指标,构建合理的评估模型,实现地图数据的质量评价。例如,朱富晓等基于空间相似性理论,利用模糊综合评价法构建了用于评价OSM路网数据质量的评估模型。匹配评价法是根据地图数据的匹配结果,建立同名实体间的对应关系,结合选取的评价指标来分析同名实体间的差异,实现地图数据的质量评价,但对于微地图这类非系统性变形的地图数据,传统的地图匹配方法会出现匹配精度较低的问题。基于可信度度量的方法是通过挖掘地图数据的相关信息,来反映数据值得信任的程度,完成地图数据的质量评价,但该方法仅适用有一定历史版本的地图数据,微地图作为新出现的地图数据,不能满足该条件。综上所述,根据微地图数据的特点,对比参照法是一种简单而有效的地图数据质量评价方法。
空间相似性定义为空间实体对象在一个或多个方面的相同程度,在空间认知中扮演着重要角色。目前,评价线要素质量的空间相似性计算方法,多面向不同尺度综合前后的地图数据。刘涛等提出了一种包含拓扑、方向、距离以及线特征的空间相似性计算模型,采用不同尺度下综合的线要素验证了模型的可行性。褚天舒等提出了一种顾及线要素的拓扑、距离、线几何结构特征相似性计算方法,完成了多尺度综合前后道路网数据的质量评价。上述2种方法未顾及线要素的形状相似性对数据质量的影响。
形状是道路网数据最直观的特征,在道路网的质量评价中存在重要作用。现有的线要素形状相似性评价方法主要用于单条形状复杂的线要素。刘鹏程等从面状要素的形状描述模型导出了线状要素的相似性评价模型,用于评价曲线化简前后的数据质量。李兆兴等提出一种基于双侧弯曲森林形状表示模型的线要素形状相似性评价方法,能够对综合中保持完整性的线要素进行评价。微地图道路网数据不符合上述2种方法对数据的要求。形状上下文是一种形状描述子,多用于图形轮廓的形状相似性度量,兼具形状轮廓的整体信息与局部信息,且形状上下文特征对于局部变化较小的数据不敏感。
为此,本文将微地图道路网矢量数据作为研究对象,根据形状上下文的基本思想,选取了线要素的形状、方向、距离、拓扑关系以及一维线特征5个空间特性,构建了顾及上下文信息的空间相似性度量模型,并在其基础上提出了微地图道路网质量评价方法。
本文顾及研究要素的上下文信息,主要从形状、方向、距离、拓扑关系以及从一维线特征5个方面完成微地图道路网数据的空间相似性度量。将道路段端点数据作为采样点,完成形状、方向、距离相似性度量,道路段数据作为研究对象进行拓扑相似性的计算,从道路线的方向、长度及顶点数量进行线特征相似性计算。
形状作为空间实体的重要视觉特征,对于空间实体的表达与分析有着重要作用。Belongie等提出了形状上下文,该方法通过计算某个点的形状上下文来捕获其他点相对位置的分布,从而在局部描述符中汇总全局形状。具体计算步骤:取点集P={p1,p2,⋯,pn}中任意点pi作为原点,建立对数极坐标系,计算除pi点外其余点在该坐标系下的极角和极径,将角度划分为12等分,半径划分为5等分,获得60个区域,记录其余点在这60个区域的分布数目,将该数目作为点的形状上下文,公式表示为:
式中:i = 1,2,⋯,n;k = 1,2,⋯,60;#操作表示除pi点外其余点p落入第k个区域(bin)的数目;hi(k)表示点pi的形状上下文。
本文根据形状上下文特征矩阵,通过统计落入各区域点数目的概率计算微地图数据与参考数据的形状相似性。
方向关系描述为目标空间分布的基本约束,基本方向关系主要分为东、南、西、北、东南、东北、西南、西北。为此,本文选择八方向锥形模型,将空间区域划分为{E、S、W、N、SE、NE、SW、NW}8个主方向以及同位{SAME},计算各点的方向上下文,统计落入各方向区域点数目的概率计算微地图数据和参考数据的方向相似性。
距离可以描述空间对象的远近程度。本文将采样点间的相对空间关系作为上下文信息,计算点对间的曼哈顿距离完成距离相似性计算。
拓扑关系常用于描述几何要素的空间关系。由于微地图数据简单、精度不高的特点,过于细致的拓扑关系定义可能会导致微地图质量评价结果不准确。因此,本文将微地图线要素拓扑关系粗略描述为4类:相交、相离、相邻、重合。
为避免采用道路段端点作为采样点进行相似性计算丢失道路网的一维线特征,本文选择道路线的方向、长度以及顶点数量计算线特征相似性。通过计算各道路线的最小面积外接矩形,将最小面积外接矩形的旋转角度和长轴作为线要素的方向θ和长度x,结合线要素的顶点数量n描述道路网的一维线特征,用三维向量(θ, x, n)表示,通过计算描述各线特征的三维向量间的曼哈顿距离,完成线特征相似性度量。
评价指标权重系数的确定是综合评价中的重要步骤,权重分配的合理性直接影响评价结果的可靠性和有效性。由于客观权重法主要依赖于样本数据,数据波动越大,得到的权值差异越大,对评价结果的影响也就越大。因此,本文为了合理分配2.1节计算的各空间相似性度量值在微地图道路网质量评价所占的比重,选用对样本数据组合的方式,采用熵值法计算权重,帮助解决数据波动过大时,造成权值差异较大的问题,在一定程度上提高计算结果的可信度。
熵值法是基于信息熵的指标权重确定方法,信息熵越小表示数据的离散度和信息量越大,评价指标的权重系数也就越大,对评价结果的影响也就越大;反之,信息熵越大表示数据的离散度和信息量越小,评价指标的权重系数也就越小,对评价结果的影响也就越小。
针对单一的评价方法不能全面反映地图数据质量评价过程中出现的随机性与模糊性的问题,本文选用可拓云评价法来实现微地图数据定量计算与定性分析结合的综合评价。将2.1节计算的空间相似性度量值作为评价指标,建立微地图数据质量评价等级,利用可拓云模型计算微地图数据各评价指标与不同评价等级的关联度,完成微地图道路网数据的质量评价,帮助解决评价过程中存在的模糊性、随机性以及不相容性问题。
物元理论是可拓评价法的基础,物元模型可以充分反映事物本质与量的关系,描述客观事物的发展程度,解决事物的不相容问题,是定量计算与定性分析结合的综合评价模型。可拓云评价法将云模型与物元分析理论融合,结合云模型具有的不确定性特征,利用正态云模型(Ex,En,He)代替可拓物元模型Q=(N,C,V)中的事物特征值V,有效规避物元模型把事物当作定值描述的弊端,改善物元理论中没有考虑事物模糊性和随机性的缺点,实现了定量计算与定性分析的结合。
为验证本文方法对微地图道路网数据质量评价的有效性,选择兰州交通大学北校区部分区域作为实验区域,道路网参考数据来源于百度地图,如图6所示。
图7所示为实验的9组微地图数据,主要分为与原地图相似但存在道路段拓扑错误、方向描述错误、距离间隔错误、形状绘制错误,如图7(a)—图7(d);以及以用户需求为目的绘制路线图,主要描述路线为从北校医务室依次到韵达快递站、圆通快递站、百世快递站及中通快递站,如图7(e)—图7(i)。图7(i)在相似性计算过程中,将该数据的重要地标参与计算。
根据2.1节所描述的空间相似性度量模型,计算微地图数据在形状、方向、距离、拓扑关系以及一维线特征5个方面与参考数据的空间相似性,结果如表1所示。
数据 | 形状相似性 | 方向相似性 | 距离相似性 | 拓扑相似性 | 线特征相似性 |
---|---|---|---|---|---|
微地图1 | 0.79 | 0.94 | 0.99 | 0.95 | 0.89 |
微地图2 | 0.85 | 0.93 | 0.83 | 0.86 | 0.84 |
微地图3 | 0.85 | 0.95 | 0.93 | 0.96 | 0.71 |
微地图4 | 0.85 | 0.94 | 0.97 | 0.88 | 0.94 |
微地图5 | 0.75 | 0.66 | 0.95 | 0.83 | 0.97 |
微地图6 | 0.79 | 0.68 | 0.49 | 0.75 | 0.77 |
微地图7 | 0.6 | 0.54 | 0.69 | 0.86 | 0.71 |
微地图8 | 0.77 | 0.74 | 0.89 | 0.88 | 0.86 |
微地图9 | 0.79 | 0.84 | 0.74 | 0.72 | 0.92 |
本文实验数据共有9组,从中选取4组数据进行组合,组合结果共有126种;根据2.2节所述步骤,利用熵值法计算不同组合结果的权重系数,求平均值确定各评价指标的权重系数W=[0.18, 0.17, 0.24, 0.22, 0.19]。接着,建立微地图质量评判集,划分为差、良、优3个等级,分别对应1~3级,建立各评价指标的等级区间如表2所示。
评价指标 | 1级 | 2级 | 3级 |
---|---|---|---|
形状相似性 | [0, 0.65] | [0.65, 0.85] | [0.85, 1] |
方向相似性 | [0, 0.65] | [0.65, 0.85] | [0.85, 1] |
距离相似性 | [0, 0.65] | [0.65, 0.85] | [0.85, 1] |
拓扑相似性 | [0, 0.65] | [0.65, 0.85] | [0.85, 1] |
线特征相似性 | [0, 0.65] | [0.65, 0.85] | [0.85, 1] |
评价指标 | 1级 | 2级 | 3级 |
---|---|---|---|
形状相似性 | [0.325, 0.276, 0.010] | [0.75, 0.085, 0.010] | [0.925, 0.064, 0.010] |
方向相似性 | [0.325, 0.276, 0.010] | [0.75, 0.085, 0.010] | [0.925, 0.064, 0.010] |
距离相似性 | [0.325, 0.276, 0.010] | [0.75, 0.085, 0.010] | [0.925, 0.064, 0.010] |
拓扑相似性 | [0.325, 0.276, 0.010] | [0.75, 0.085, 0.010] | [0.925, 0.064, 0.010] |
线特征相似性 | [0.325, 0.276, 0.010] | [0.75, 0.085, 0.010] | [0.925, 0.064, 0.010] |
数据 | 关联度 | 可信度 | 评价等级 | 模糊综合评价法评价等级 |
---|---|---|---|---|
微地图1 | [0.111 7, 0.249 3, 0.679 6] | 0.019 3 | 3 | 3 |
微地图2 | [0.156 9, 0.455 1, 0.524 7] | 0.031 5 | 3 | 2 |
微地图3 | [0.152 6, 0.310 1, 0.667 9] | 0.016 5 | 3 | 2 |
微地图4 | [0.105 6, 0.202 7, 0.775 3] | 0.020 0 | 3 | 2 |
微地图5 | [0.209 1, 0.437 8, 0.437 4] | 0.025 6 | 2偏3 | 2 |
微地图6 | [0.437 2, 0.688 3, 0.043 9] | 0.024 7 | 2 | 1 |
微地图7 | [0.448 5, 0.482 0, 0.126 6] | 0.034 0 | 2偏1 | 1 |
微地图8 | [0.189 9, 0.558 6, 0.493 2] | 0.024 1 | 2 | 2 |
微地图9 | [0.247 7, 0.723 6, 0.289 0] | 0.020 5 | 2 | 2 |
微地图5数据精度与参考数据较为接近,本文方法对微地图5的等级评价结果为2级偏向3级。微地图6和微地图9两组道路网数据较为相似,但由于微地图9重要地标参与计算,其数据质量比微地图6高,从2组数据与等级2的关联度中可以得出此结论。微地图7数据过于简单,对于该区域陌生的行人使用帮助较小,本文方法对微地图7等级评价结果为2偏1。与模糊综合评价法相比,可拓云评价法的评价结果与实际更为符合,验证了该方法对本文的适用性;且可拓云评价法能够提供更多有用信息,不仅揭示出处于同一评价等级上的微地图数据质量的高低,还反映了评价结果的可信度。
本文结合微地图数据简单、面向大众用户的特点,提出了一种顾及上下文信息的空间相似性度量模型,计算样本数据不同组合结果的客观权重,采用可拓云评价法完成微地图道路网数据的质量评价。实验结果表明:
本文提出的空间相似性度量模型符合微地图精度低、内容少的特点,能够有效地计算微地图数据与参考数据的相似性,为微地图道路网质量评价提供了可靠的评价指标。
通过对样本数据组合,并采用熵值法计算客观权重,有效解决了数据波动过大时权值差异较大的问题,提高了计算结果的可信度。
可拓云评价法能够实现微地图数据定量计算与定性分析结合的综合评价,不仅能够揭示出处于同一评价等级上的微地图数据质量的高低,还能反映评价结果的可信度,对微地图道路网质量评价具有较强的适用性。
相较于模糊综合评价法,本文将精度低,但内容与参考数据一致的微地图数据评价等级提升为优;相较于现有的线要素空间相似性评价法,本文将精度低,但根据用户需求制图,且有重要地标参与计算的微地图数据评价等级提升为良。本文方法对微地图数据有较强的适用性,填补了微地图质量评价的空白,为微地图道路网质量评价提供了可行方法,有利于微地图的广泛应用。