空间数据库中的模糊可靠性

摘要

目前，空间数据库的质量评价非常困难，主要是因为输入数据的异质性。我们定义了一个评价空间数据库可靠性的模糊过程:将研究区域划分为等可靠区，根据数据质量和环境特征将其定义为同质区。在专题数据集中建立空间数据库模型;每个专题数据集涉及一个特定的空间领域，包括一组层。我们估计了每个专题数据集的可靠性，从而估计了空间数据库的总体可靠性。我们在意大利Cava de' Tirreni镇的空间数据集上测试了这种方法。

1.介绍

基于规则的模糊模型应用于地理信息系统(GIS) [1- - - - - -3.我们使用以前的方法[4，5]来估计空间数据库的可靠性。在分析数据不确定性和质量的基础上，引入了地理数据“可靠性”的概念，作为衡量地理数据质量的模糊指标。严格地说，在[5]作者实现了一种叫做(模糊空间可靠性分析)的工具。6[研究通过利用GIS封装的剧烈模型研究含水层的内在脆弱性的可靠性;在 [4Fuzzy-SRA用于估计普罗西达岛(意大利那不勒斯附近)和[7将fuzzy - sra应用于GIS工具中，实现了基于规则的著名火山维苏威火山爆发风险分析系统。

作为第一步，我们需要将研究的地理区域划分为等可靠区，即数据质量和地理特征(准)相同的区。专家设置与每一层的质量相关的特征(例如，未编码的斑点高程特征的百分比)。每一个被称为“参数”的特征都是可以影响数据集质量的可测量的实体。在计算参数值后，应用模糊化过程来估计层集的质量，其中每个模糊集由一个三角形模糊数(TFN)给出，该模糊数由语言标签识别。换句话说，等可靠区是研究区的一个分区，在该分区中，地理数据的质量是均匀的;也就是说，参数的值是相似的，具有相同的地理特征(例如，一个平坦的国家)。

专家创建一个模糊分区，给tfn贴上语言标签(比如)(见,例如,表3.)。等可靠区与对应TFN的语言标签相关联，该参数的隶属度最高。对每一层的每个参数进行迭代。与每个参数相关联的fuzzy - sra元素是用字符串表示的模糊属性。为了阐明这些弦是如何组成的，现在我们假设，作为一个例子，我们已经将研究领域划分为5个可靠的区域，；因此，我们创建了参数域话语的模糊划分在6个带有语言标签的模糊集中，．在模糊处理过程之后，我们将每个可良好的区域与表格中显示的TFN相关联1．


Isoreliable区	语言标签

O1
O2
O3.
O4
O5

为参数创建一个字符串形式如下: 其中符号“−”表示没有与相应TFN相关联的isreliable zone。

现在我们假设在第二个属性的域的四个tfn中创建一个分区，获取相应的字符串．两个字符串的组合和通过新的经营方式”是一个字符串(详情载于[6]并在部分2．1)定义为

在此字符串中，新TFN，标记为，也可以得到。一般来说,如果（resp。，)是该字符串的tfn个数（resp。，)，然后是字符串包含(）TFN。每层获得的弦被重新组合（2)，以获得用于评估整套地层可靠性的最终串。例如，我们可以考虑(见[4)四层航空摄影测量层，见下表2．


层	参数

现货海拔(SE)	非编码SE的密度
	每公顷编码硒的密度

轮廓线	等高线平均密度为公顷/平均坡度
	面积/平均坡度等高线的标准差

建筑物	周长绝对值的平均值
	形状面积绝对值的平均值

网络的街道	建筑物所覆盖缓冲区的平均密度
	建筑物覆盖缓冲区的标准开发


标签	描述

	最优可靠性	0．80	0．90	1．00
	良好的可靠性	0．65	０．７５	0．80
	足够的可靠性	0．55	0.60	0．65
	平庸的可靠性	0.45	0．50	0．55
	缺乏可靠性	0.35	０．４０	0.45
	坏的可靠性	0．20	0．30	0.35
	空的可靠性	0．00	０．１０	0．20

计算完每一层的字符串后，使用operator (2)以获得最后一个字符串。在这种计算中，权重与每一层关联，与该层在空间数据库中的角色关联。例如，“建筑”一层可能与“基础设施”一层更相关;因此，第一层的质量对空间数据库可靠性的影响大于第二层。

还有一个需要考虑的问题，即与属性相关的权重可能会因不同的等可靠性区域而改变。例如，“点高程”数据集的质量对强坡度区域空间数据库的可靠性的影响大于平滑区域。在分配权重之后，最后的字符串将被重新计算，如Section所示2．3．要分配给每个可靠区域的可靠性指标，由该区域在最终字符串中出现的TFN的中心值给出。

在我们的方法中，我们将空间数据库分为三个层次:空间数据库、专题数据集和层。空间数据库由若干专题数据集(如地质、水文等)组成。每个专题数据集包含更多的专题层(图1）.

我们的方法开始考虑层层，为每个层分配单个参数。在确定主题数据集的每一层的字符串之后，将它们与公式(2)获取专题数据集的最后字符串;通过考虑分配给每个层的权重，这个字符串依次被重新计算。在计算完每个专题数据集的最终字符串后，我们再次使用公式(2)，得到整个空间数据库的最终字符串。该字符串将通过考虑分配给每个专题数据集的权重重新计算。

对于每个等可靠区域，我们通过取最终字符串中与该区域相关的TFN的中心值来获得相应的等可靠指数。考虑到意大利萨莱诺附近的卡瓦德蒂勒尼镇的空间数据库，我们测试了我们的方法。

节2我们给出[6]．部分3.包含我们的Section方法4给出我们的测试结果，并且Section5是结论。

2.代数结构的定义

2．1.的操作

我们回顾在[6]．让成为话语的宇宙一个有序-语言标签的元组，每个由一个或多个语言修饰符和一个变量组成，例如，= False”、“或多或少好，“…”=好”、“= Very Good， "…"=完全好，”，每个用合适的tfn表示，也用，(见,例如,表3.）.让是一个模糊属性，即一幅地图，由以下类型的字符串表示: 在哪里是，在续集中也被称为“class”。如果，然后我们写．让是另一个由以下字符串表示的模糊属性: 所使用的符号与上述符号有相似含义的。按照[6，则定义操作之间的和通过设置在那里,通过假设不失一般性，子集是由下列公式给出的：

如[6，子集c_我可以用一个简单的规则计算，基于通常的算术乘法。的tfn的,因为，确实是由用上述系数,因为,定义为

该指数（resp。，)表示子集的数目（resp。，)的字符串（resp。，)，它涉及到为获得子集而执行的并运算由此产生的模糊属性，而指数（resp。，)表示子集的总数的（resp。，的)涉及到交集的运算，交集给出了子集的．

２.２.属性的权重

第一步是在上述对字符串的操作之前，确定连接到固定区域的每个属性的权重，因为它们可以随着区域的变化而变化。严格地说，上面的模型意味着有必要建立属性中具有相同语言标签的区域权重的平均值。这个平均值应该是该语言标签的权重，然后乘以代表同一标签的TFN的中点，给出一个数字，我们考虑其中最小的整数，即，．在同一个语言标签的右边，因此我们创造-语言标签“近似”的部分程序2．3．例如，我们考虑六个区域其中模糊属性是否已收到6个具有相关权重的值按照表3.．如果，然后是模糊属性是由以下字符串表示的: 再看看语言上的标签．为简单起见，我们用W表示_1我属性的权重的区域与．然后是平均值为= 2，乘以1.0 (cf. Table2)给的右边插入的新语言标签的数目．在剩下的三个标签的右边不得插入其他新的语言标签，因为我们已经有了象征意义明显的，，,获得，,．然后我们获取以下属性的以下更精细的字符串：

这种方法有助于改善对象(在我们的案例研究中是isreliable zone)在属性集中的位置，只要记住可以与对象关联的新语言标签即可。表示新语言标签的tfn的隶属函数的计算方法如下。

让是属性中考虑的语言标签,让为通过上述步骤获得的新语言标签的数量。让成为紧随其后的语言标签在语言标签中．对于每一个,我们把而且类似地和．然后TFN是语言标签的代表吗．

２.３.语言标签的近似

在最终的模糊属性中得到的一些tfn，经过几个字符串的连续组合后，必须在语言标签中重新转换，这些语言标签可以近似为已知的tfn，步骤如下。

让为拟合的TFN，已知的tfn(即已知其语言标签的含义)，以便．通过设置而如果，然后我们放入；如果，然后我们说“下一个是我们写；如果，然后我们说“包括之间的和我们写；如果，然后我们说“之前我们写；如果，然后我们放入．例如，考虑表的tfn3.,让在节2．1．自和，这是显而易见的．

我们注意到无论之间都有比较，,而且类似地，,是本程序所要求的。

3.空间数据库的模糊可靠性

我们的模型空间数据库在如图所示的三层层次结构中1．空间数据库由专题数据集称为特定的空间域。每个主题数据集由层，即地理参考向量或栅格主题。

在[4]，对每个参数对应的字符串应用代数结构，并考虑给参数分配的权重重新计算最终的字符串，我们重用代数结构运算符，将其应用到专题数据集各层关联的最终字符串中，并根据各层关联的权重重新计算得到的最终字符串。为了获得空间数据库的可靠性指标，我们将代数结构的算子应用于与每个专题数据集相关联的最终字符串，并考虑到每个专题数据集的权重，重新计算得到的最终字符串。因此，我们估计每个可靠区域的空间数据库的可靠性，并将微积分应用于本节所述的代数结构上2在空间数据库模型的每一层中。下面我们将描述构成我们方法的单个步骤。(1）领域专家将研究领域划分为可靠区域;每个可靠区都是一个地理区域，在数据质量和环境特征上都是同质的。（2）对每一层进行参数识别，即对影响层质量的可观测值进行赋值;对于每个isreliable zone，分配相应tfn的标签和各参数的权重。专家对各参数域的tfn进行模糊划分。（3)对于每一层，代数结构的算子[6应用于参数，获取要重新计算的最终字符串（如部分所述2．2)，通过考虑分配给相同参数的权重。我们获得指数的可靠性每一层;我们称之为这个索引的映射可靠性的地图的层。(4）在每个专题数据集中，其层次被确定为参数;与一层相关联的字符串由为该层计算的最终字符串给出。对于每一个可靠区域，专家会考虑到每一层对其专题数据集质量的影响，为每一层分配权重。（5)对于每个专题数据集，代数结构的运算符[6，通过获取一个将要重新计算的最终字符串来应用于相关字符串(如章节所述)2．2)，通过考虑分配给相同层的权重。我们获得指数的可靠性以及专题数据集的相应可靠性图。（6)现在我们将参数识别为空间数据库的主题数据集;与主题数据集关联的字符串由针对此主题数据集计算的最终字符串给出。考虑到层对空间数据库的质量的影响，专家分配了每个Insomeliable区，每个主题数据集的权重。（7）代数结构的算符[6]应用于分配给每个专题数据集的字符串，获得重新计算的最终字符串(如节所述2．2)，以考虑分配给同一专题数据集的权重。我们获得指数的可靠性以及空间数据库的相关可靠性图。

节4在基于模糊- sra工具的空间数据库上给出了该方法的应用结果。

4.测试结果

在我们的试验中，研究区域由意大利的卡瓦德蒂勒尼镇确定。考虑到数据质量和环境气候特征，将研究区域划分为5个可靠区，如图所示2．

我们考虑空间数据库的最重要的主题数据集和层。在我们的测试中，我们考虑5个主题数据集。在表5我们显示专题数据集和为每一层选择的参数。

在参数的选择中，特别关注与地理实体相关的主要信息的缺乏(例如，建筑的高度或点的海拔高度)。

其他影响层质量的特征包括几何和拓扑类型的误差(孤立的街道线或在它们之间相交的粒子)。

为了简化计算，我们为每个参数在五个tfn中创建一个模糊分区，如表所示3.．为简洁起见，我们仅展示了1.1层街道参数“孤立线密度”和2.1层地形地块参数“相交多边形密度”的tfn设置。

对于每个可靠区域，由专家分配参数权重。为简便起见，我们显示了分配给每个可靠区域的前两个参数的权重。

将与每一层的每个参数相关的字符串组合在一起后，我们得到了一个最终的字符串，该字符串考虑到给同一参数分配的权重而重新计算。利用该字符串，我们得到了该层的可靠性映射。为了简洁起见，考虑一下表格4，6，7，8，9，我们向图层1.1显示了Isorelibility映射（图3.)和2.1(图4)和最后的字符串，分别给出


ID

O1		3.
O2		1
O3.		2
O4		1
O5		1
O6		1


主题数据集	层	参数

航空摄影测量数据	(1.1)的街道	密度分离线
		未标记线的密度
	(1.2)建筑	相交多边形的密度
		具有未编码高度值的多边形密度
		多边形的密度与错误的高度值
	(1.3)海拔	未编码点的密度
		高程值错误的点密度
	(1.4)轮廓	非编码行密度
		高程值错误的线密度

(2)地籍数据	(2.1)地形包裹	相交多边形的密度
		未编码多边形的密度
	(2.2)建筑包裹	相交多边形的密度
		未编码多边形的密度
		不重叠建筑物的多边形密度
	土地使用(2.3)	相交多边形的密度
		未标记多边形的密度

(3)水文	(3.1)河流	未标记线的密度
		交叠线密度
	(3.2)湖泊	相交多边形的密度
		未标记多边形的密度
	（3.3）含水层	测压标高值错误的多边形密度

（4）地质学	(4.1)表面地质	相交多边形的密度
		未标记多边形的密度
	(4.2)土地幻灯片	相交多边形的密度
		未标记多边形的密度
	(4.3)冲积区	相交多边形的密度
		未标记多边形的密度

(5)基础设施网络	（5.1）道路网络	交叠线密度
		未标记弧的密度
	(5.2)排水系统	交叠线密度
		未标记弧的密度
	(5.3)供水管网	交叠线密度
		未标记弧的密度
	(5.4)电网	交叠线密度
		未标记弧的密度


标签	描述

	最优可靠性	0．00	０．００５	0．01
	良好的可靠性	0．01	0.015	０．０２
	足够的可靠性	０．０２	0.03	0.04
	平庸的可靠性	0.04	０．０５	0．06
	缺乏可靠性	0．06	0．08	０．１０
	坏的可靠性	０．１０	0．20	0．30
	空的可靠性	0．30	0.60	1．00


标签	描述

	最优可靠性	0．00	０．００５	0．01
	良好的可靠性	0．01	０．０２	0.03
	足够的可靠性	0.03	0.04	０．０５
	平庸的可靠性	０．０５	0.07	0.09
	缺乏可靠性	0.09	0．12	0．15
	坏的可靠性	0．15	0.18	0.21
	空的可靠性	0.21	0.70	1．00


区	重量

O1	4
O2	4
O3.	4
O4	3.
O5	3.


区	重量

O1	5
O2	5
O3.	4
O4	4
O5	4

在这些地图中，我们注意到两个不太可靠的区域和；事实上，在这些区域的数据是不精确的。在得到专题数据集每一层的最终字符串后，将它们进行组合，得到专题数据集的最终字符串。然后，考虑为每个可靠区域分配给各层的权重，重新计算最终的字符串。在表10我们展示了为等可靠区域分配给每一层的权重．


主题数据集	层	重量

航空摄影测量数据	(1.1)的街道	4
	(1.2)建筑	4
	(1.3)海拔	3.
	(1.4)轮廓	3.
(2)地籍数据	(2.1)地形包裹	4
	(2.2)建筑包裹	4
	土地使用(2.3)	3.
(3)水文	(3.1)河流	3.
	(3.2)湖泊	3.
	（3.3）含水层	2
（4）地质学	(4.1)表面地质	4
	(4.2)土地幻灯片	3.
	(4.3)冲积区	3.
(5)基础设施网络	（5.1）道路网络	4
	(5.2)排水系统	3.
	(5.3)供水管网	3.
	(5.4)电网	2

数字5显示专题数据集“航空摄影测量数据”的专题地图。我们将最终字符串中形成的TFN的中心值视为等可靠性值。

在图6我们展示专题数据集“地籍数据”的专题地图。

两幅信度图显示出在等信度区和数据的质量很差。这一结果在所有专题数据集上得到了验证。在表11我们给出了五个专题数据集在每个专题可信区域的信度值。


Isoreliable区	依据。价值1	依据。价值2	依据。价值3.	依据。价值4.	依据。价值5.

O1	0．90	0.87	0.85	0.85	0.87
O2	0.86	0.85	0．82	0．82	0.85
O3.	0.67	0.74	0.74	0．71	0．71
O4	0.44	0.53	0.53	0．50	0.44
O5	０．４７	0．57	0．57	0.53	０．４７

计算出每个专题数据集的最终字符串后，将它们进行组合，得到意大利Cava de’Tirreni (Italy)空间数据集的最终字符串。通过考虑为每个可靠区域分配给专题数据集的权重，重新计算最后的字符串。5个可靠区域的权重如表所示12．


Isoreliable区	数据集1的权重	数据集2的权重	数据集3的权重	数据集4的权重	数据集5的权重

O1	5	5	3.	4	3.
O2	5	5	3.	4	3.
O3.	5	5	3.	4	3.
O4	5	5	4	5	3.
O5	5	5	4	5	3.

空间数据集3和4的异形数据集的权重和与分配给等可靠区域的数据是否不同，,．确实是在可靠的地区和地表地形坡度显著，有许多水文特征。最后在图7给出了空间数据库的可靠性图。

图中的结果7确认与单个专题数据集对应的前一项。在等可靠区可靠性指标较好和，在等可靠区表现良好而在可靠地区则比较贫穷和．

5.结论

空间数据库的可靠性评价是一个复杂的问题，因为空间数据集缺乏同质性，而且研究区域的数据质量存在一定的变化。因此，使用模糊逻辑方法来测量空间信息的质量是足够的。在本研究中我们采用模糊代数结构[6]和应用于[4，5，用于评估空间数据集的可靠性，从而估计整个空间数据库的可靠性。

我们将空间数据库划分为三个层次，分别对单层、专题数据集和空间数据库进行可靠性评估。我们在意大利Cava de’Tirreni(意大利)的空间数据库上测试了我们的方法。专家识别出等可靠区域，并为每个参数、各层和专题数据集分配权重。我们给出了得到的结果和研究区域空间数据库的最终可靠性图。

承认

这项工作是在“Polo delle Scienze e delle tecologie”dell 'Università degli Studi di Napoli Federico II的赞助下，在FARO 2010-2013项目的背景下进行的。

参考

A.巴多西和L.达克斯坦，基于规则的模糊建模及其在地球物理、生物和工程系统中的应用， CRC出版社，1995年。
F. Di Martino和S. Sessa，“基于模糊关系方程系统的GIS工具的空间分析”，刊于计算科学及其应用：ICCSA 2011，第6783卷计算机科学课堂讲稿，第15-30页，2011。视图:谷歌学者
F. Di Martino和S. Sessa，《空间分析和模糊关系方程》，模糊系统的研究进展，卷。2011年，第429498号，14页，2011年。视图:出版商的网站|谷歌学者
F. Di Martino, V. Loia, S. Sessa, M. Giordano，“基于具体案例研究中的模糊逻辑的GIS可靠性评估”，刊于地理问题的空间信息模糊建模F. E. Petry, V. B. Robinson, M. A. Cobb, Eds。，页185-208，施普林格，2005。视图:谷歌学者
F. Di Martino, S. Sessa和V. Loia，“一种基于模糊的工具，用于建模和分析含水层的脆弱性:一个案例研究，”国际近似推理杂志第38卷第2期1，页99-111,2005。视图:出版商的网站|谷歌学者
A. Gisolfi和V. Loia，“一个完整的，灵活的基于模糊的分类问题的方法”，国际近似推理杂志，第13卷，第2期3，第151-183页，1995。视图:谷歌学者
F. di Martino，V.Loia和Sesessa，“通过模糊规则，在VESUVIAN地区的风险分析，”现代工程科学，第4卷，第4期。2, pp. 55-78, 2011。视图:谷歌学者

模糊系统的研究进展

地理信息系统中的模糊方法与近似推理

摘要