研究文章|开放获取
Di·马蒂诺,罗伯塔Mele Umberto e . s . Barillari玛丽亚蔷薇花坛Barillari, Irina Perfilieva,塞布丽娜Senatore, ”探索疾病的演变的时空热点分析:应用程序Oto-Laryngopharyngeal疾病”,模糊系统的进步, 卷。2013年, 文章的ID385974年, 7 页面, 2013年。 https://doi.org/10.1155/2013/385974
探索疾病的演变的时空热点分析:应用程序Oto-Laryngopharyngeal疾病
文摘
本文提出了一种基于时空热点分析领域扩展的模糊c均值方法在地理信息系统中实现。这种方法已被用于检测空间区域高浓度的事件和测试研究它们之间的进化。相对应的数据包括地理模式病人的居住地区的那不勒斯(意大利)谁oto-laryngopharyngeal的外科手术设备进行了2008年和2012年之间。
1。介绍
GIS,现象的影响在一个特定的区域由于邻近的事件(如地震地区的影响的研究,或约束在流域面积)是使用缓冲区执行地理处理功能。给定一个地理空间事件拓扑表示为地理坐标守时,线性的,或面积元素,原子缓冲区是由圆形区域集中在元素。例如,如果事件是地震的震中,地理坐标点,一组缓冲区域是由同心圆形点周边地区;每个循环缓冲区域的半径是预先定义的。
当不可能定义静态的影响,我们需要确定面积的影响存在一组一致的事件,我们面对的问题检测这一领域作为集群的地理事件也增厚。这些集群的地理坐标,在地图上表示为多边形,叫做热点地区。
研究的热点领域是至关重要的在许多学科如犯罪分析(1- - - - - -3),研究刑事事件的地区传播,火分析(4),分析森林火灾蔓延的现象,和疾病分析(5- - - - - -7),研究疾病的主要定位及其演化。聚类方法主要用于检测热点区域是基于密度的算法(见[8,9]);他们可以检测的准确几何热点,但非常昂贵在计算复杂性方面,在绝大多数情况下,没有必要确定集群的形状。其线性多聚类算法用于计算复杂度是模糊c均值算法(FCM) [10),一个区分的模糊聚类方法,使用欧氏距离来确定原型集群作为点。
让是一个数据集组成的模式,在那里是组件(特性)的模式。FCM算法最小化目标函数如下: 在哪里是集群的数量、固定先天的、的隶属度模式吗到th集群,是给定的点集的中心集群(原型),fuzzifier参数,中心之间的距离吗的th集群和th向量,计算欧几里得范数: 使用拉格朗日乘数方法最小化目标函数(1),我们得到以下解决方案中心的每个集群原型: 在哪里和隶属度, 受到的约束:
最初,的和在每个迭代中随机分配和更新。如果是矩阵计算的th一步,迭代过程停止时 在哪里是一个前缀的参数。
这个算法有线性的计算复杂度;然而,敏感噪声和异常值的存在;此外,集群的数量先天是固定的,需要使用一个有效性指数来确定一个参数的最优值吗。
为了克服这些缺点,在11,12),EFCM算法,集群原型超球面的欧几里得度量。像FCM, EFCM算法的特点是一个线性计算复杂度;此外,它是健壮的噪声和异常值的存在,最后确定数量的集群在迭代过程。
在[13,14),作者提出使用EFCM算法检测热点地区。最后的热点地区被确定为检测集群原型和圆形区域显示在地图上。在[4),作者分析的热点火的时空演化分析。事件数据分区模式的时间事件的检测;所以每个子集是对应于一个特定的时间间隔。作者比较热点在连续两年获得通过研究他们的地图上的十字路口。通过这种方式,可以遵循一个特定的进化现象。
集群原型从EFCM方法发现地图上的圆形区域,可以近似一个热点区域。图1显示了一个示例的两个圆形热点地区,获得集群。
图1显示了三个不同的区域。(我)在这一领域的热点不是交叉的热点(对应于):这个区域可以被认为是一个地理区域提前检测到事件先后消失。(2)相交的两个热点的地区:这个区域可以被视为一个地理区域的事件继续持续下去。(3)在这一领域的热点不是交叉的热点(对应于):这个区域可以被认为是过早的地理区域未被发现的事件传播先后。我们可以研究的热点地区的时空演化分析相应的循环集群之间的交互原型获得连续的时期,和检测的新热点地区则为热点地区和热点的absebce以前空间包含在热点地区。
在这个研究中,我们提出一个方法为研究热点地区疾病的时空演变分析;我们应用EFCM算法比较,在连续几年,事件数据集对应oto-laryngopharyngeal疾病诊断中发现的那不勒斯(我)。每个事件对应的住所病人感染这种疾病。
我们研究热点的时空演变分析热点对应连续两年的十字路口,质心的位移,增加或减少的热点地区,和新出现的热点。
节2,我们给EFCM算法的概述。节3,我们提出我们的方法在疾病研究热点的时空演变分析。节4,我们现在的时空演化的结果otolaryngologist-laryngopharyngeal疾病诊断的热点事件中发现的那不勒斯(我)。我们的结论部分5。
2。EFCM算法
EFCM算法,我们考虑聚类原型的超球面维特性的空间。的th超球面的特点是一个重心和一个半径。
事实上,如果的半径,我们说属于如果。
半径考虑协方差矩阵获得的吗相关的th集群定义为 行列式的给的体积集群。自是对称的和积极的,它可以分解以下形式: 在哪里是一个标准正交矩阵和是一个对角矩阵。半径由以下公式给出(见[12): 最小的目标函数如下: 的隶属度更新为
我们设置数量和定义对于任何;因此,我们获得
然而,使用(12)产生的负面影响减少目标函数(10)当一个有意义的特性被放置在一个集群中,这一事实可以防止集群的分离。然后解决这个问题在于一小起始值的假设然后它是逐渐增加的因素,在那里集群的数量吗th迭代和是递归地定义为,通过设置 和对称矩阵,在那里被定义为好。如果是矩阵在th迭代和阈值介绍了极限,那么两个索引和确定这样因此和合并通过设置 的行可以从矩阵中删除。换句话说,EFCM算法可以归纳为如下步骤。(1)用户分配初始数量的集群(通常是),的初始值,。(2)会员度随机分配。(3)中心的集群计算了使用(3)。(4)集群的半径计算通过使用(9)。(5) 计算通过使用(12)。(6)索引和决心以这样一种方式呢假设的可能的最大价值迭代。(7)如果和,那么th和通过(th簇合并14)和行删除。(8)如果(6)是满意,那么过程停止;否则,去一步为迭代。
3所示。热点检测疾病分析和演化
每个模式是由事件对应于特定的病人疾病的住所已被检测到。模式的两个特点是住宅的地理坐标。
我们的过程的第一步是一个地理编码活动获取所需数据集开始的事件患者的街道地址。
以确保准确匹配的geopositioning事件,我们需要拓扑正确的道路网络和相应的完整的toponymic数据。
开始数据包括街道名称和门牌号码的病人的住所。匹配过程后,每个事件中被转换的数据点在地图上地理坐标。
在图2那不勒斯的道路网区显示;街道的名称是在地图上标记;地理坐标为点在地图上的事件。
图3显示了数据对应一个事件在地图上选择。
已然采用每个事件后,事件数据集可以分裂,分区通过时间间隔。例如,在图3可以分割领域“年”。
对于每个子集的事件,我们EFCM算法应用于检测最终集群原型。
在这个研究中,我们指出的时间演化和传播的分析oto-laryngo-pharyngeal疾病检测在那不勒斯的地区。数据集,除以时间序列对应于时间的一年,是由模式不同的事件相对应的地理坐标中遇到疾病患者进行干预和随后的组织学检查也指出。事件是指geopositioning病人的位置。
数据进一步划分了疾病的类型分析每个特定疾病的分布和演化的区域研究。
EFCM算法已经被封装在ESRI ArcGIS的GIS平台。图4显示了面具为设置的参数创建和运行EFCM算法。
我们可以设置其他数值字段添加其他功能的地理坐标。
最初,我们设置了初始数量的集群,fuzzifier m,误差阈值停止迭代。运行EFCM后,迭代的数量,最终数量的集群,错误报告在最后迭代计算。由此产生的集群在地图上显示为圆形区域,可以保存在一个新的地理层。
最后过程关注热点的比较分析得到相对应的集群事件的每个子集。
图5显示了一个示例显示在地图上的热点作为最终获得集群事件的连续两个子集。
为了评估一个热点的扩张和位移,我们测量的半径的热点和质心之间的距离两个相交的热点。
在下一节中,我们提出通过应用该方法获得的结果数据对应的外科干预oto-laryngo-pharyngeal装置的患者在那不勒斯地区居民在2008年和2012年之间。
我们把每年的数据集和分析各种类型的疾病。
类型中最常见的疾病,以下分析:(我)癌,(2)双边Reinke水肿,(3)肥大的下鼻甲,(iv)鼻息肉病,(v)两国声襞脱垂。在下一节中,我们将展示最重要的结果通过将这种方法应用到每个分区数据集的事件。
4所示。测试结果
我们获得的结果在上述事件数据集在2008年和2012年之间的时期。
我们首先考虑数据的子集对应于两国Reinke水肿疾病。
我们修复fuzzifier参数至0.1,集群的初始数量15,最后迭代误差1×10−2。
表1显示了每年获得的结果。
|
|||||||||||||||||||||||||||||||||||||||||||||
我们提出相关的细节考虑获得的热点事件的比较2011年和2012年的数据。
数据6和7分别显示,通过使用获得的热点模式的子集的事件发生在2011年和2012年。
图8显示了重叠的热点地区获得两年:红色,2011年相对应的热点;蓝色的,对应于2012年。
表2显示前两列标签的热点地区在2011年和2012年,在第三(分别地。、第四)列在2011年(resp获得的半径。,2012年),和the distance between the centroids is given in the fifth column.
|
||||||||||||||||||||||||||||||||||||||||
结果表明,只有热点3获得了2011年2012年仍然几乎不变。相反,似乎热点1和2合并成一个较大的热点(hotspot 1获得了2012年),和热点,转变约1公里,是扩大;这个热点的半径约为6.5公里(2012年热点3获得了2012年在图8)。
现在我们的结果显示疾病鼻息肉病。
图9显示了重叠的热点地区获得两年,2011年和2012年。
在表3比较的结果报道。
|
||||||||||||||||||||||||||||||
结果在图9显示,2011年和2012年有两个热点:占地面积的城市那不勒斯的和其他许多火山的城镇。这两个热点地区,在2011年的一个圆形区域,覆盖半径约为3和5公里,分别在2012年覆盖半径的圆面积约5和7公里,分别。
图的直方图10显示了这一趋势的半径的两个热点的时间。
这是近年来有关传播的热点围绕着火山的城镇(这个热点的半径,从2008年约2公里,约7公里在2012年)。
另一个重大趋势关注的热点地区获得癌疾病。
同时,在这种情况下,两个主要hotsposts覆盖城市那不勒斯和许多火山的城镇。在这种情况下,我们有一个非常高的传播热点覆盖的城市那不勒斯(病死率。图11);近年来,这个热点的半径增加了9.5公里。
5。结论
获得的超球面作为集群(圆圈的两个维度)通过使用EFCM可以代表热点地区热点分析;这种方法有一个线性计算复杂度和健壮的噪声和离群值。在热点分析,模式是二维的,特点是由地理坐标;集群原型是圆圈,可以代表一个好的近似的热点区域,可以在地图上显示为圆形区域。
在本文中,我们提出一个新方法使用EFCM算法为研究热点在疾病的时空演化分析。
我们考虑住宅的信息的病人在那不勒斯(意大利),外科干预的oto-laryngo-pharyngeal装置进行了2008年和2012年之间。一个地理编码过程用于已然采用数据;地理数据集是每年分区和类型的疾病;我们比较连续每一对年获得的热点和分析每个热点的趋势随着时间的测量半径的变化和交叉聚类质心之间的距离有关连续两年。
结果显示一致的传播在鼻息肉病疾病的最后几年热点覆盖的一些火山的城镇和癌疾病热点覆盖城市那不勒斯的。
引用
- s . p . Chainey s•里德和n·斯图尔特,”一个热点热点是什么时候?创建统计的程序健壮的犯罪热点geo-graphic地图,”创新GIS 9:社会经济地理信息科学的应用d . Kidner, g·希格斯,美国白人,Eds。泰勒和弗朗西斯,伦敦,英国,2002年。视图:谷歌学术搜索
- k·哈瑞斯,地理映射犯罪:原理和实践国家司法研究所,华盛顿,美国,1999年。
- a·t·默里McGuffog, j .美国西部和p .马林斯”探索性空间数据分析技术考察城市犯罪,”英国犯罪学杂志》上的第41卷。。2、309 - 329年,2001页。视图:出版商的网站|谷歌学术搜索
- f . Di马蒂诺和s Sessa”扩展的模糊c均值算法在时空GIS热点,”专家系统与应用程序,38卷,不。9日,第11836 - 11829页,2011年。视图:出版商的网站|谷歌学术搜索
- r . m . Mullner k .钟k·g·克罗克和e . k . Mensah”简介:地理信息系统在公共卫生和医学,”医疗系统杂志,28卷,不。3、215 - 221年,2004页。视图:出版商的网站|谷歌学术搜索
- k . Polat”应用程序的属性权重方法基于聚类中心歧视线性不可分的医学数据集,“医疗系统杂志,36卷,不。4、2657 - 2673年,2012页。视图:出版商的网站|谷歌学术搜索
- c·k·魏、美国苏和m . c .杨”的应用数据挖掘的高品位的疾病分布图筛选了社区居民在台湾台北县,”医疗系统杂志,36卷,不。3、2021 - 2027年,2012页。视图:出版商的网站|谷歌学术搜索
- 即迦特和a . b . Geva“无人监督的最优模糊聚类,IEEE模式分析与机器智能,11卷,不。7,773 - 780年,1989页。视图:出版商的网站|谷歌学术搜索
- r . Krishnapuram和j·金,“聚类算法基于体积标准,”IEEE模糊系统,8卷,不。2、228 - 236年,2000页。视图:出版商的网站|谷歌学术搜索
- j . c . Bezdek模式识别与模糊目标函数算法,充气出版社,纽约,纽约,美国,1981年。
- Kaymak, r . Babuska m . Setnes h·维尔布鲁根b和h . m . van Nauta Lemke,“模糊模型的简化方法,”智能混合系统Ed,阮,页91 - 108,Kluwer学术出版商,多德雷赫特,荷兰,1997年。视图:谷歌学术搜索
- Kaymak和m . Setnes“集群与体积模型和自适应模糊聚类合并,“IEEE模糊系统,10卷,不。6,705 - 712年,2002页。视图:出版商的网站|谷歌学术搜索
- 诉Loia f . Di马蒂诺,s . Sessa”扩展热点事件的模糊c均值聚类算法在空间分析,“混合智能系统的国际期刊4卷,页1 - 14,2007。视图:谷歌学术搜索
- f . Di马蒂诺和s . Sessa”实现的扩展模糊c均值算法在地理信息系统中,“《不确定系统,3卷,不。4、298 - 306年,2009页。视图:谷歌学术搜索
版权
版权©2013·马蒂诺et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。