文摘

随着云计算的发展,大数据和人工智能(AI)技术,越来越多的“文化分析的兴趣。“文化分析需要不同类型的数据,如文本,图片,和视频。在文化领域资源的丰富性和差异导致不同的文化模式的数据。传统的文本分析方法不再能满足当前的数据分析需求的多媒体文化资源。本文从文化开始数据的特征信息来解决异构性问题所面临的巨大的多通道文化数据分析。分析从地理、时间、艺术、和主题特征、分类和聚合形成多元文化特征信息矩阵。对应的相关测量方法提出了不同的矩阵从上面的尺寸,反过来,解决和替换到优化训练反向传播(BP)神经网络来获取最终的关联度。改进的模糊c均值(FCM)聚类算法用于聚合文化数据基于程度高度相关。在这项研究中提出的算法比现有算法。实验结果表明,优化后的BP神经网络比当前至少58%更准确计算方法不同矩阵的关联程度。在准确度方面,改进的模糊c均值算法有效地降低了随机干扰的选择初始聚类中心,这是明显高于其他聚类算法。

1。介绍

术语“文化分析”于2007年提出的Lev Manovich,指的是使用计算,分析当代和历史文化数据可视化,和大量的数据方法(1]。皮埃尔·布尔迪厄的历史调查的20世纪中叶的巴黎人的文化消费“分化”打开了一种研究文化和美学与大量的数据集,然后,佛朗哥莫雷蒂的“图表、地图、树:一个抽象模型的文学历史”展示了大规模文化分析数据的好处(2]。近年来,研究人员在各个领域已逐渐使用术语“文化分析。“文化分析的杂志出版于2016年。许多大学在文化分析逐步发展研究计划,如麻省理工学院的专著”文化分析”,发表在2020年的秋天。传统的人性分析侧重于研究文本数据。不过,文化研究也关注大量的多媒体数据集,包括数字视觉产品和当代视觉和互动媒体3]。到目前为止,文化分析技术已经应用到电影,动画,视频游戏,漫画,杂志,书籍,和其他印刷出版物、艺术作品、照片、和各种其他媒体的内容。在过去的几年中,数字和公开的艺术藏品的数量一直在增加。等的出现,大量的数字艺术作品,面临巨大的文化的数字资源,如何探索其丰富内容在最大的程度上已经成为一个巨大的挑战在艺术领域的研究。

当研究一件艺术品,我们做一些推断。例如,除了理解主题,我们也将根据时期,风格,和艺术家。所以,计算机算法可以“理解”一件艺术品一样深刻的人类和快速类型吗?Babak萨利赫和艾哈迈德Elgarmar艺术和罗格斯大学的人工智能实验室数据库收集了成千上万的绘画在过去六世纪艺术史研究并提出了基于领域知识的解释。的优化方法测量绘画之间的相似性使算法的精度分类图片风格60% (4,5]。然而,这种算法的应用场景更有限,只能归类为一个类型的数据,如绘画和文化不适合多通道数据。因为只有三个指标的风格、流派和艺术家被认为是在分类、算法的分类效果不令人满意。

由于文化的相似性之间的模糊关系数据,使用硬聚类算法的效果并不理想。针对现状,现有的多通道集群和融合算法不能充分利用文化数据信息,从文化特征信息数据,本研究提出了一种模糊多元文化融合策略基于BP神经网络和FCM的数据。主要贡献如下:(1)多元文化数据中提取的特征信息维度的分类和总结地理、时间、艺术、和主题人物形成多元文化特征信息矩阵(MCM)。(2)多通道之间的相关性度量标准文化来自多个维度定义的数据,以及数据集替换成优化的BP神经网络进行训练得到最终的关联度。(3)模糊c均值聚类策略,聚集强烈文化相关数据,解决了数据的障碍和问题提供了更好的多元文化融合的数据融合策略。

本文的组织如下。部分2简要介绍了相关的工作。第三和第四部分呈现出多元文化数据融合策略。部分3介绍了多通道的建立文化特征信息矩阵的数据集,反水雷舰之间的文化关系的量化方法,BP神经网络的优化和调整。部分4介绍了改进的模糊c均值聚类算法。实验部分5证明了融合策略的有效性。部分6总结了全文。

了解世界,人类必须区分不同的事物和认识事物之间的相似之处,而对于计算机,他们需要使用非监督学习方法来决定的事情。从汉谟拉比法典》到《蒙娜丽莎》,从披头士到阿甘,文化数据源多。他们以不同的形式进行如文本、图片、音频和视频。其他形式之间的数据集成是一个多通道数据融合的问题,集信息从不同的方法提取到一个稳定的多通道表示。近年来,国内外学者广泛关注多通道融合。各种基于model-independent多通道融合的方法,提出了图模型和神经网络。学者如夏提出了一个散列算法集成多通道视觉特征到内核二进制代码和计算图像特征(6]。然而,该算法很难融合其他模型数据的特征信息除了图片和视频。江等人认为,不同形式的数据共享潜在结构和学习这种潜在的通过多通道数据共享结构之间的联系和矿业结构和类别之间的交互信息,适用于分类任务(7]。然而,在分类需要先验知识作为参考,而且计算复杂度相对较高。俄南等人提出了一个学期加权神经语言模型处理社交媒体数据,取得了好的结果(8,9]。上述结果的应用程序完全认为社交媒体数据之间的关系,但不考虑文化特性。然而,它仍然提供了一个很好的参考文化的特点分析数据。金等人提出了一种递归神经网络的关注机制,它使用LSTM网络融合和社会环境特征的文本。然后,它使用注意机制与图像特征进行端到端连接的谣言预测(10]。融合机制依赖于文本和图像之间的对应关系,这是很难处理的无序多通道数据。传统的集群已经成功的解决了低维数据的聚类问题。然而,由于实际应用中数据的复杂性,现有的算法经常失败在处理许多问题时,特别是对于高维数据和大型数据。因为传统的聚类方法聚类高维数据集时主要遇到两个问题,一个是有大量的不相关的属性在高维数据集,使集群在所有维度的可能性几乎为零(11,12];第二,高维空间中的数据应该分散在低维区域,和数据之间的距离几乎相等13]。然而,传统的聚类方法是基于距离集群(14,15),所以是不可能构建团体基于高维空间中的距离。

大规模的多通道的无序特征文化数据已经成为一个挑战挖掘其共同特征的主题(16,17]。为了解决这个问题,我们从数据的特征信息和其文化特征信息从多个维度进行分类,形成多元文化特征信息矩阵包含各种不同的细节。地理、时间的相关性、艺术和主题角色从每个维度对MCM使用各自的相关性计算公式计算,和最后的轴承是手动标记通过经验形成了MCM关联数据集和测试集18- - - - - -20.]。他们用BP神经网络训练数据集。神经网络输出的关联度与关联度手动校准的测试集,通过调整和优化等参数的迭代的数量和学习速率21,22]。的准确率达到96%以上。因此,我们可以作为BP神经网络的输出最后的反水雷舰之间的文化关系,形成一种多元文化数据之间的相关性。

反水雷舰的程度之间的联系作为集群的基础,模糊c均值聚类算法,广泛应用于实际应用,尤其是在多通道领域的学习(23),是所有MCM用于集群。模糊c均值聚类算法对初始聚类中心的选择更敏感(24]。确保聚类结果满足同一类别的紧张和确保每个类的分离,初始聚类中心的选择是受限制的。欧氏距离表达传统的FCM的隶属度25]。本文使用的文化相关性输出训练BP神经网络作为FCM的隶属度,限制初始聚类中心之间的隶属程度,并要求对方归属感。度大于阈值的约束,这里的反向执行分析实验结果。实验结果证明,基于BP神经网络的改进的c均值聚类策略可以收集高度相关的多元文化和解决大规模多通道数据障碍(26]。它是与经典的聚类算法相比,证明了这一策略的优越性。图1清楚地显示了该方法。

3所示。相关性程度的多元文化特征信息矩阵

3.1。建立一个多元文化特征信息矩阵

多元文化的四个最具代表性的特性数据、地理特征、时间特征、艺术特征,和主题特征特性,用于描述文化的特征数据,并获得相应的特征信息来表达分类的多元文化数据在一个统一的形式,如以下所示的矩阵, 代表了多元文化的地理特征信息数据, 代表时间的特征信息, 代表艺术特征信息, 代表主题性格特征信息。

地理特征信息指的是国家,城市,等等,相关的数据,如艺术品的位置创建的网站现有的博物馆。时间特性信息的相关数据,如雕塑的创作时间,文本的创作,历史时期反映。艺术特征信息包括macro-art形式和micro-art形式,其中macro-art形式包括九个类别,如绘画和雕塑。主题人物的特征信息由两部分组成:文化主题和人物。文化的概念是由美国学者首次提出M·E·奥普莱(27]。他认为,对于任何民族文化,其行为是遵循价值。对于多元文化数据,文化主题的范围更广泛,如宗教、民族习俗、文化符号;性格特性包括作者和人民文化相关的数据。以上四种类型的特征信息,形成多元文化特征信息矩阵进行了总结。

图中的例子2显示了MCM的图式数据。地理特征信息的当前位置工作,在法国卢浮宫,和作者的国家,意大利。信息的时间特性是作品完成于1503年和公元1507年。绘画和油画艺术特征信息,和主题性格特征信息是文艺复兴时期,《蒙娜丽莎》,作者列奥纳多·达·芬奇。MCM划分文化特征信息和过滤噪音信息与文化无关的领域,这对后续的相关测量中扮演一个重要的配角和集群融合。

3.2。协会量化

多元文化特征信息矩阵包含地理特征信息,时间特性信息,艺术特征信息,主题性格特征信息。从我们得到的四种特性,地理相关性 ,时间相关性 ,艺术相关 ,和主题特征的相关性 四个相关性度加权和总结得到的相关性 反水雷舰之间。

地理相关性:根据第一和第二地理规律、特性与距离之间的关系,和空间隔离导致组件之间的差异(28,29日]。一般来说,越近的空间,更重要的特征之间的相关性;之间的距离越远,越不同特性。谷歌地理编码API (30.)用于MCM的地理特征信息转换为地理坐标。例如,卢浮宫转换为(48.860611,2.337644) 使用纬度和经度坐标找到两者之间的平均距离地理特征信息,和平均距离转换为地理协会学位 在[0,1]。在这里,反水雷舰之间的经度和纬度之间的距离由半正矢计算公式: 在哪里R地球的半径,平均值是6371公里, 代表的纬度, 代表了不同经度。地球的赤道的周长是40076公里,南北两极的边缘是39900公里。在这里,l= 20000公里。因此,地理协会的程度的计算公式 如下:

在“世界文化报告文化多样性、冲突和共存的文化(2000)“联合国教科文组织编制的世界上的国家分为八个地区31日]。根据维基百科,世界上有197个国家。为了避免等因素的大小太大的国家,地理相关性的程度是修正:如果是在同一地区,轴承是8 ;如果是在同一个国家,相关性是16

时间相关性:在多元文化特征信息矩阵MCM, 是它的时间特性信息矩阵和 是它的时间特性序列。为 ,介绍了皮尔森相关系数来确定时间相关的程度。时间相关程度 反水雷舰之间的信息反映了关联度的时间特性,和它的计算公式如下:

艺术的相关性:艺术的相关性 是由macro-art类别和micro-art类别。在宏观层面,分为九类,包括八个传统艺术和第九艺术。八个传统艺术主要是指社会的意识形态,用影像来反映现实但比现实更典型,包括八个类别:文学、音乐、舞蹈、绘画、雕塑、戏剧、建筑、和电影。随着科技的发展,艺术表达也不断发展,如电视艺术、电视连续剧,漫画书和视频游戏。这些艺术形式难以分为上面的八个州,所以他们统称为第九艺术。

在微观层面以绘画为例:从地理的角度来看,绘画可以分为东方绘画和西方绘画;从工具和材料的角度看,绘画可分为水墨画、油画、壁画、版画、水彩画、水粉画绘画、等;绘画从题材内容,可分为图油画、风景画、静物画、动物画,等;从作品的形式的角度来看,绘画可以分为壁画、年画、连环画、漫画,宣传绘画,油画,吹画,插图等等。 ,通过从宏观和micro-art类别先后,艺术的相关性 是获得。计算公式如下。例如,当比较艺术相同的宏观信息,但是不同的微观的价值 是0.7。

主题特征相关性:多元文化数据,主题性格特征信息包括两个部分:主题和人物,都是基于名词。主题和人物的关系是解决通过比较同一名词的数量出现在特征信息。的计算公式如下年代代表同一名词的数量n1n2主题角色特征信息的数量吗 ,分别。

在获得地理相关性 ,时间相关性 ,艺术相关 ,和主题特征的相关性 ,有必要进行加权计算找到最终的文化相关性(32]。传统的加权方法如AHP层次分析法更加依赖专家评分;相比之下,评论家加权法是客观的。不过,它只适用于数据样本的情况下是固定的,和模型需要不断更新的可伸缩的数据。因此,时间复杂度比较大。BP神经网络不需要确定输入和输出之间的映射关系的数学方程。只学习一个特定的规则通过培训和获得的结果最接近期望输出值,当输入值。因此,最终确定关联度的横切。BP神经网络。

3.3。BP神经网络训练
3.3.1。建立数据集

在执行BP神经网络训练之前,定量分析和比较不同的聚类算法的性能,有必要尝试真正的文化的数据集,包括创建培训所需的训练数据集和测试数据集所需的验证。然而,随着集群文化研究数据仍处于起步阶段,现有的主流文化领域的数据集是少,不能满足实验的要求。在此基础上,我们称之为世界上主要的博物馆网站API接口编写网络爬虫来构造实验数据集,如图3多元文化,在这里,大量的代表收集数据时,上述两个数据集,其中包括约28644来自世界30博物馆的艺术作品,700年代表数据集和相应的文化特征信息手动选为实验数据对BP神经网络的来源,和每组数据包含两个多峰文化数据和相应的多通道特性信息矩阵。700套的数据分为两个部分,500套作为BP神经网络的训练数据集和200集作为测试数据集。

对于各种各样的多通道文化收集的数据,我们采用第三方手动标签数据集的特征信息。在标签的过程中,我们要求四个涂画者进行kappa测试标签一致性的结果。测试结果如表所示1。互补的原则是用来标记的结果,和高原则投票是用于标识信息的矛盾。

上面的四个相关程度的量化方法。相应的四个相关度可以通过计算机编程计算,和最终的相关性程度的训练和测试数据集手动标记。这里,绝对的相关性分为20的水平,其中1表示最重要的相关性和20展示了相关性最低。把“蒙娜丽莎”和“创世纪”为例,他们的地理相关性 ,时间相关性 ,艺术相关 ,和主题特征的相关性 都是由计算机根据计算公式计算提出了在前一篇文章中,分别为0.445032,0.9325,0.7和0.938616。最后一个程度的相关性是人为的。因为他们都是欧洲文化作品在文艺复兴时期,艺术形式都是画,和达芬奇和米开朗基罗也被称为三大复兴,所以最终决定3程度的相关性。“拉赫玛尼诺夫第二钢琴协奏曲”非常类似于“拉赫玛尼诺夫第三钢琴协奏曲,”及其相关的最高价值是1;而电影《教父》的区别和胡夫的金字塔是巨大的,因此,其最终价值相关性是20。

3.3.2。BP神经网络训练

数据集和测试集建立之后,BP神经网络用于训练和验证。BP神经网络是一个概念Rumelhart为首的一群科学家和麦克勒兰德在1986年提出的。这是一个多层前馈神经网络训练根据误差反向传播算法,是应用最广泛的神经网络。BP神经网络的非线性映射能力和强大的自学习和自适应能力使它能够自动提取四个文化相关性特征的内在关联功能通过学习来获取最终的关联度。

训练一个神经网络时,许多参数需要调整。学习速率,时代(培训时间),和mini-batch大小参数用来调整对象。在改变的过程中神经网络的参数,精度是主要的目标。训练神经网络,最初的学习速率显著影响精度,所以它被选中作为主要参数调整。在调整的过程中,训练数据集选择训练数据建立的所有500套以上,和其余的参数在默认状态。所有200的测试数据集选择验证精度。

如图4横坐标是学习速率,纵坐标是测试精度。可以看出,随着学习速率的增加从0.00001到0.1,测试的准确性也线性增加,最高精度达到0.925 0.1附近。然后,随着学习速率的增加,准确率会略微下降,所以选择0.1作为神经网络的学习速度。在确定学习速率,调整学习速率保持在0.1时代。

如图5横坐标是时代,纵坐标是测试精度。从20时代开始成长,准确率也显著提高。当时代是220,94.5%的准确率。时代达到220时,准确率不再提高,甚至开始减少,出现过度拟合,所以220是选为时代的价值。

如图6,横坐标是mini-batch大小,纵坐标是测试精度。从图可以看出,批量大小对测试精度的影响不明显。当mini-batch大小50到125年,准确率超过95%,当mini-batch大小是100,准确率为96.5%。

总之,当学习速度设置为0.1,时代和mini-batch大小设置为100,最高的准确率是96.5%,这是非常接近关联度手动给定,就稍微的过程中手动给关联度。一些主观色彩,BP神经网络的关联度输出可以用作聚类标准,实现两个文化之间的相关性量化多通道数据。

4所示。模糊c均值聚类

4.1。初始聚类中心的约束

获得相关学位后的两个多峰文化特征信息矩阵通过BP神经网络,需要集群整个矩阵。模糊c均值算法(FCM)是一种基于目标函数的模糊聚类算法。它主要用于数据聚类分析。它被广泛使用,因为它效率和简单。在这里,我们介绍它的聚类方法,集群的多元文化特性信息矩阵。经典的FCM聚类算法有两个问题:过度依赖算法的初始聚类中心;另一个是集群的算法需要知道实际的数量。专家可以给组织的数量在文化领域通过分析具体的应用场景,所以初始聚类中心的随机性需要改善。在这里,模糊阈值 设置和初始聚类中心之间的相关性是受限制的。

的原则选择初始聚类中心的距离大于设定阈值不同的初始聚类中心 在接下来的聚类算法,聚类中心可以在多个领域的可行性进行分析。避免计算的情况,该算法容易收敛到局部最小值,FCM随机计算初始聚类中心。模糊阈值 是很难获得通过评估或公式,它需要通过大量的调整试验。

4.2。模糊c均值聚类

与传统方法相比,改进的模糊c均值算法在这项研究增加了初始聚类中心的限制。算法步骤如下:首先,k多元文化特征信息矩阵 从整个多通道随机选为集群文化特征矩阵的信息 集群中心是区分矩阵的矩阵,和集群中心的关联度矩阵记录为每个集群中心应该大于模糊阈值 是j样本的隶属函数对应于第i个类别,和集群损失函数的隶属函数表示如下: 在哪里 指的是加权指数,也称为平滑因子,控制模糊类之间共享的程度。最好的价值b没有相同的标准,价值是2在正常情况下。 表示程度的相关性(距离)之间的多元文化特征信息矩阵是集群和集群中心矩阵。我们的偏导数 是0,必要条件获得最小公式值(7)。

迭代法是用于解决(8)和(9),隶属度 和聚类中心 更新,直到满足收敛条件时停止。 ,在哪里 是终止判据在0和1之间,k是迭代步骤。聚合的局部最小值 ,无序多通道文化特性矩阵完成集群通过相互关系的信息。

改进的模糊c均值的伪代码1限制初始聚类中心如下:

(1) 初始化MCM,输入c, b
(2) 设置模糊阈值 , 由模糊阈值限制。
(3) 获得k-step:计算中心的向量模型(k)与罗马数字(k)
(4) 更新密度(k)、密度(k+ 1)
(5) 如果 然后停止;否则,返回步骤3。

5。实验

实验的目的是测试数据聚类融合技术的有效性提出了以上的环境下模拟大量的多通道文化数据。实验环境设置上面的BP神经网络训练和下面的集群效应是一个单一的个人电脑;CPU配置英特尔酷睿i7 - 8700 3.20 GHz, 32 gb内存,用MATLAB R2017b和编程。用于实验的数据使用多通道文化数据处理。来验证提出的聚类算法的效果在这项研究中,三种聚类算法进行比较,即k - means算法(33],density-based空间聚类的应用程序与噪声(DBSCAN) [34]算法和FCM算法[35]。

FCM算法需要事先确定集群的数量和初始簇中心的随机性的问题。实验包括三个部分:实验1确定最优数量的集群,实验2分析其影响聚类结果通过调整模糊阈值 确定最佳值;与传统聚类算法和实验3进行基于模糊阈值确定 在实验2中。

5.1。聚类数目的影响

达到一个更好的聚类效果,有必要确定集群的数量。均方误差值作为一个客观指标来评价聚类的效果(36]。在统计,MSE计算之间的错误的方块安装数据和原始数据的对应点。MSE可以评估的程度的变化数据。值越小,更好的预测模型的准确性来描述实验数据。在实验中使用的数据是多元文化数据,及其特征信息矩阵用于BP神经网络的训练和测试。以确保实验结果的可靠性,五组实验相同的测试环境下进行。

如图7,横坐标是聚类数,纵坐标是MSE。均方误差值与集群中心的数量变化。当聚类数量很小,每个类的内部的歧视很低。聚类数量太大时,随机选择的集群中心将增加每个类的内部集群的不稳定。上述两种情况下会减少聚类结果的准确性。选择合适的聚类数目,我们进行了许多实验。我们随机将实验所需的数据分成五组,每组改变集群数量和五组进行比较实验。如图7,可以看出,当它是8,聚类效果是最好的,因此聚类数是8。

5.2。的影响 在集群效应

实验2比较了不同模糊阈值的影响 的聚类结果。如图8,(a)、(b)和(c)的实验结果 , , ,分别。不同的 带来不同的聚类效果。随机性的影响降到最低的初始聚类中心的集群效应,我们通过实验确定最佳值和均方误差值作为选择的依据。

如图9横坐标是模糊阈值,纵坐标是MSE。如果模糊阈值太低,这将导致低数据歧视不同的集群。如果模糊阈值过高,则会产生聚类不平衡,影响集群效应。像上面的实验中,选择最佳的聚类数,我们随机将实验所需的数据分成五组。每组改变了模糊阈值 和五组进行比较实验。如图9模糊阈值的选择 有相同的影响集群作为集群数量的准确性。可以看出,当它被7,聚类效果是最好的,所以模糊阈值的值 是7。

5.3。聚类算法的比较

实验3比较了模糊c均值聚类策略与初始聚类中心与k - means聚类约束提出了研究策略,density-based聚类策略,与传统模糊c均值聚类策略。在这里,k - means和分区模糊c均值聚类算法,在k - means硬聚类和FCM建议软聚类。density-based集群战略也广泛应用于多维数据处理领域,及其经典DBSCAN算法。四个聚类算法的实验结果如图所示10

如图10(a)、(b) (c)和(d)的实验结果是k - means, DBSCAN,传统的FCM,和改进的FCM分别。k - means聚类算法是一种最经典的迭代聚类算法。它被广泛使用,因为它的简单性和效率的37]。然而,多元文化数据的聚类是不敏感的实时性能,和集群效应主要是用作标准。然而,随着硬聚类算法,k - means聚类效果具有显著差异和糟糕的鲁棒性。DBSCAN是density-based空间聚类算法。算法将区域有足够的密度划分为集群(即。,the number of objects contained in a specific site in the clustering space is not less than a given threshold) and finds clusters of arbitrary shape in a noisy spatial database. It defines clusters as the most extensive collection of points connected by density [38]。可以看出,DBSCAN取得一个更好的比k - means聚类效果。传统的FCM在这里使用的FCM算法MATLAB,可以看到,它有一个更好的比k - means聚类效果和鲁棒性。我们可以看到改进的FCM取得了更好的聚类效果比其他三个从集群效应图聚类算法。然而,实验效果的评价图仍然是主观的。这里,迭代次数和均方误差值作为一个客观指标评估聚类的效果。

实验结果得到的四个聚类算法如表所示2。可以看出,改进的模糊c均值算法,约束的初始聚类中心取得了更好的聚类结果比传统的模糊c均值算法。因为k - means聚类算法,聚类效果是完全不同的,鲁棒性很差。Density-based DBSCAN是更敏感的稀疏集群。因为在实验中使用的数据集是用于BP神经网络训练,其稀疏相对统一。因此,它还获得实验结果接近改进的模糊c均值算法,但它是具有挑战性的应用当密度不是常数。总之,在这项研究中,提出的改进的模糊c均值算法的约束的初始聚类中心,取得最好的集群效应,具有良好的鲁棒性。

6。结论

针对的问题障碍注入引起的多元文化的丰富性和多样性数据,量化的方法之间的相关性数据基于BP神经网络和多元文化提出了一种改进的模糊c均值聚类融合策略。在这个战略,文化特征信息提取的多通道数据的分类和集成来自多个维度形成多元文化特征信息矩阵。基于矩阵的特征信息,提出量化方法的文化相关性的多元文化特征信息矩阵。多元文化的一部分数据,世界知名博物馆作为训练样本,放入调整BP神经网络进行训练,并输出最终的程度的相关性。以反水雷舰之间的相关程度为集群的基础,模糊c均值聚类方法,提高了随机化的初始聚类中心,用于集群和数据融合多元文化。实验表明,在这项研究中提出的数据融合算法可以总高度相关数据,取得了更好的聚类结果比传统多维数据聚类的方法。

数据可用性

多元文化数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关这项研究的出版物。

确认

这项工作是支持中国国家重点研发项目的一部分(2019 yfb1406002)。