无线通信和移动计算

在这一页上

文摘介绍相关的工作结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

信道估计和智能传感反射表面(IRS)资助建设通信系统

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID3795183| https://doi.org/10.1155/2022/3795183

信用基于距离决定冲突检测模型和概率矩阵

小东张,¹ Congdong Lv ,¹ 和Zhoubao太阳²

学术编辑器: Chunguo李

收到了 2021年9月17日

接受 2021年11月25日

发表 2022年1月07

文摘

考虑到信贷指数计算差异,语义差异,错误数据,互联网和其他平台之间的问题,如金融、电子商务、健康和老年保健,导致信贷偏离的可信范围信贷对象和信贷的缺乏相关信息的主题,在这篇文章中,我们提出一种基于crossplatform服务信用冲突检测模型的距离决定支持迁移和应用crossplatform信用信息传输和整合。首先,我们给一个得分表的影响因素。得分的概率是这个因素的影响。通过这个概率矩阵生成影响因素之间的距离。第二,相似矩阵的计算距离矩阵。第三,通过相似度计算支持向量矩阵。第四,信贷支持向量的向量计算。最后,信贷向量和可信度计算的概率。

1。介绍

近年来,随着互联网的发展,在各行各业的在线服务。利用互联网的优势,用户可以获得所需的服务通过简单的流程在不同的环境中,但同时,由于网络的虚拟化,欺诈是很容易发生。这构成了挑战,每个平台的信用评价体系。加快社会信用体系建设的要求是“十二五”规划提出,这是更清楚地解释了在14五年计划。加强收集、共享、信息披露、信用信息和应用程序;提升信贷产品和服务,使人民受益,促进企业;建立一个公共信用信息共享和集成机制和金融信息;培养具有国际竞争力的企业信用调查机构和信用评级机构;加强信用调查监督;,促进信用服务市场的健康发展。 In the environment where big data technology is widely used, in order to meet the following challenges, each platform organization uses the data collected by the platform to calculate credit indicators and build its own credit evaluation system. However, there are many problems in this process: for example, the collected information cannot fully evaluate and describe the credit indicators, and the information is collected and entered in the process. Errors and deficiencies and the focus on credit and evaluation models are different. There will be differences in the information and evaluation results of the same object on different platforms, and there is no good coordination mechanism. The data are scattered, heterogeneous, and low-quality, which is difficult to be directly applicable to judge the overall credit level of an object. The outline of the plan for the construction of social credit system issued by the State Council (2014-2020) puts forward that “accelerating the construction of credit information system and improving the recording, integration and application of credit information are the basis and premise for the formation of trustworthy incentive and dishonest punishment mechanism.” From this point of view, to solve the data problem in credit evaluation, it is necessary for all platforms to establish a perfect information exchange mechanism, gradually form a credit service network with wide coverage and complete categories, and build an objective, fair, reasonable and balanced international credit rating system model.

构建的核心内容crossplatform信贷指数评价模型是融合多源异构的信贷数据,和信息冲突造成的数据融合研究的重点:有属性相同的信息之间的差异和各平台的数据属性之间的不同的名称,有相同的属性数值差异不同的来源,和由于数据收集方法总结,冲突检测模型的目的是匹配属性,解决冲突问题,清理虚假数据,并获得数据和统一标准,可靠的来源,和强大的真实性,从而达到高效和真实性后续建设的信贷模式。

在冲突中相同属性的描述多源数据,模式匹配技术是用来解决问题的不同的源属性1,2]。模式匹配技术分为两个levels-pattern级别和实例级别。模式水平的方法分析了相应的属性描述不同的源数据之间的关系,如属性名称,缩写,或属性存储类型(3]。相似性分析范围的优点是简单和直观的和较低的时间成本,但属性描述信息的数量很小,所以很难直接使用4- - - - - -6]。有必要建立一个统一的标准,最有效的使用。在实例级、特征提取和相似性进行分析数据从不同的来源获得不同属性之间的映射关系。这样做的优点就是它可以减少对领域知识的依赖。然而,良好的数据需要有足够的规模7]。在相关的研究中,从三个层次:基于模式的解决方案被认为是更直观的语言水平,研究主要考虑属性的语义描述(8- - - - - -10]。例如,昏迷系统决定了各种属性通过构造属性语言协会之间的关系图,输入属性配对使用,并返回一个0和1之间的测量确认属性相似度;更多的研究进一步考虑属性约束水平和属性结构水平(11]。例如,洪水相似性算法构造属性描述和数据类型图中根据输入信息和获得通过多个属性之间的映射迭代定点计算(12]。然而,数据描述信息缺乏一个统一的标准,很难获得,识别、和使用数据描述信息很少,不利于广泛应用。现在,基于案例分析的解决方案主要是用于获得属性之间的映射关系通过特征提取和来自不同来源的数据进行比较分析。情绪失调方法使用神经网络技术找到相似的元素集分布定律根据数据实例信息,计算并返回匹配的结果相似(高13]。Mehdi等人分析了不同类型的数据的相似性,可以减少相似矩阵的规模,并介绍谷歌相似距离字符类型数据之间的语义关系在任务(14]。周等人建立了一个基于匈牙利算法的模式匹配系统分析源数据和获取的特征映射关系,提高了模型的泛化能力。的研究、自然语言处理技术也越来越多的用于相似度分析(15,16]。例如,Nozaki等人使用word2vec工具来比较和分析字符串的相似属性的语义关系的数据集,和诺等人使用Bert-based语义相似度计算来调整知识库索引(17,18]。

检测数据的多源数据融合的冲突,冲突被视为离群值的异常点,和异常点检测技术是用来检测和处理冲突19- - - - - -22]。在传统数据挖掘工作,异常检测是通过使用统计数据,进行集群、分类、接近,和其他方法23- - - - - -29日]。这些方法是强大的,简单和直接,但需要依靠一定的先验知识,和处理效果直接影响知识的水平。一些研究这个领域也应用机器学习机器学习的属性冲突产生和使用结果预测取代冲突。基于孤立点检测的数值冲突检测方法是找到数据对象从其他数据分布明显不同。传统的统计方法是通过在已知的数据分布的前提下,不符合的数据分布划分为异常值,但它需要很难获得先验知识,这是不利于工作。在实际工作中,更多的基于聚类的孤立点检测的方法或分类,和常见的聚类算法可以更好地应用于异常检测:如DBSCAN [30.,31日和桦树32,33]。聚类算法需要数据来源的真实性。贾等人clustering-based异常值检测算法用于清理错误和缺失数据在医学数据库,显示出更好的性能比基于距离的算法。另一个想法是离群值测试距离的基础上,通过计算或数据点的密度,确定异常值的距离(34]。Riahi-Madvar等人使用lof(局部离群因子)来衡量;它代表了当地的偏差度的对象,决定了 - - - - - -距离附近计算物体的局部密度可达性,并获得数据点的偏差度(35]。该算法使用lof测量也有许多应用程序(36,37]。基于工作,刘et al .,基于lof挖掘异常值,构造局部偏差度测量方法,降低了算法的复杂性并避免误判在一定程度上取决于当地的特点(38,39]。由于不考虑整体数据分布的特点,非常适合于异常检测的数据具有不同的密度分布40]。

2.1。信贷冲突检测模型

为了有效地应用决定距离测量和概率距离矩阵来处理多源证据冲突,有必要将多源证据冲突转化为距离测量值和概率距离矩阵决定。相似矩阵,在此基础上,支持向量,可靠性和平均得到了信任函数。治疗过程如下。

信贷数据的每个记录由公司表示属性或属性,个人信息如年龄。我们使用一个多源组来表示

对于任何记录 ,我们需要计算它的基本的概率:

所示的算法是算法1根据表,判断条件1。

要求:
信贷数据的集合,y;
确保:米(y)
1:如果然后
2: ;
3:如果
4:如果然后
5: ;
6:如果
7:如果然后
8: ;
9:如果
10:如果然后
11: ;
12:如果
13:……
14:返回 ;

获取基本概率向量后,我们需要计算距离矩阵:

计算如下:

所示的算法是算法2。

相似矩阵如下:

所示的算法是算法3。

要求:
的一组基本的概率, ;
确保:D(y)
1:为每一项做
2:为每一项做
3: ;
4:结束了
5:结束了
6:返回D(y)

要求:
距离矩阵, ;
确保:年代(y)
1:为每一项做
2:为每一项做
3: ;
4:结束了
5:结束了
6:返回年代(y)

相似矩阵的列细胞总结得到支持向量。计算公式如下:

所示的算法是算法4。

要求:
相似矩阵,年代(y);
确保:吃晚饭(y)
1:为每一项做
2:为每一项做
3: ;
4:结束了
5:结束了
6:返回吃晚饭(y)

信誉向量可以通过正则化的支持向量。计算公式如下:

所示的算法是算法5。

要求:
支持向量,吃晚饭(y);
确保:Crd(y)
1:为每一项做
2:
3:结束了
4:为每一项做
5: ;
6:结束了
7:返回Crd(y)

的平均信任值证据。计算公式如下:

所示的算法是算法6。

要求:
支持向量,Crd(y);
的一组基本的概率, ;
确保:Crd(y)
1:为每一项做
2:
3:结束了
4:返回 ;

最后,我们有我们的信用冲突检测模型。给定阈值 ,如果 ,记录没有冲突。否则,记录有冲突。所示的算法是算法7。

要求:
的平均信任值, ;
确保:冲突
1:如果然后
2:返回真正的;
3:如果
4:返回假;

3所示。结论

在今天的生活中,每天都产生大量的新数据。信贷研究的方向,每个信贷的信用评估主体也与新数据动态变化。在未来的研究中,冲突的检测和处理动态数据的及时性和准确性,提高模型操作将成为冲突模型建设的关键问题。因为检测方法的多样性,没有一般模型可以应用到所有的数据,因此,扩大新技术的使用也将一个集中的冲突检测。

在本文中,我们分析集群中,异常值检测,机器学习,和其他技术和设计crossplatform,多层次、多维、multigranularity服务信贷冲突检测模型。模型用于处理语义差异,计算差异,错误的数据,和其他问题的信贷指标在平台等互联网金融、电子商务、健康养老。预计能够有效地检测并处理信用信息冲突,如信用偏差和缺乏信用主体信息。

在未来,在特定的前提下识别样本,人工智能可以发挥更好的作用。这是一个非常有价值的研究内容。

数据可用性

数据不能充分披露目前因为它包含私有数据。数据结构及其实现的代码已经被上传到GitHub;请访问https://github.com/juckylv/Credit-data。

的利益冲突

没有利益冲突有关的出版。

确认

这项研究得到了国家重点研发项目(批准号2019 yfb1404602)和江苏省高校自然科学研究项目(第21号kjb520022)。

引用

m·李,“塑料污染减排——净塑料循环通过标准化的信用体系在亚洲,“海洋和沿海管理,卷210,不。1,第105733条,2021。
视图: 出版商的网站 | 谷歌学术搜索
r·伊克巴尔f .医生,b,马哈茂德,美国优素福,“大数据分析和计算智能cyber-physical系统:最近的趋势和先进的应用程序,“未来一代计算机系统卷,105年,第778 - 766页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
j . Travniček j . Janoušek b Melichar,并革罗罢l .,“修改Boyer-Moore-Horspool的树模式匹配算法使直线化树,”理论计算机科学卷,830 - 831年60 - 90,2020页。
视图: 出版商的网站 | 谷歌学术搜索
克鲁斯和a .•阿吉亚尔”MagLand:道路车辆定位、磁地标”IEEE车辆技术,卷69,不。4、3654 - 3667年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
g .叮,金黄色的太阳,g . Wang“基于SQL语句,模式匹配”分布式和并行数据库,38卷,不。1,第226 - 193页,2020。
视图: 出版商的网站 | 谷歌学术搜索
m·c·弗洛伊德、J·a·埃特泽尔和t . s .勇敢的“认知控制的神经编码:表征相似性分析方法[J],”认知科学趋势,25卷,不。7,115 - 136年,2021页。
视图: 谷歌学术搜索
张x r·李,张,y, j .郭和x,“一个基于实例的学习推荐算法的不平衡处理方法,”应用数学和计算卷,351年,第218 - 204页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
美国歌曲,g .顾c . Ryu s法t . Lecroq和k .公园,“快笛卡尔树匹配算法对单个和多个模式,”理论计算机科学卷,849年,页47 - 63,2021。
视图: 出版商的网站 | 谷歌学术搜索
汗姆尼尔,f和m . a . Riaz来说,“不透明的数据库模式之间的一个基于实例模式匹配,”诉讼的第四届国际会议在工程技术和Technopreneuship吉隆坡,页177 - 182年,2014年。
视图: 谷歌学术搜索
h .赵和s . Ram”结合模式和实例集成异构数据源的信息,“数据与知识工程,卷61,不。2、281 - 303年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
p·a·伯恩斯坦,j . Madhavan和e·拉姆“通用的模式匹配,十年后,”美国第37国际会议上非常大的数据基础西雅图,页695 - 701年,2011年。
视图: 谷歌学术搜索
h·杨,l .沈董x,问:叮,p,和g .江“低复杂度反恐组分区结构决定和快速内部通用的视频编码模式决定,”IEEE电路和系统视频技术,34卷,不。4队,2019页。
视图: 谷歌学术搜索
m . Shrestha t . x Tran b·巴特·m·l·蒲赛和r s Aygun”模式匹配和数据集成与一致的命名在蛋白质结晶屏幕上,“IEEE / ACM事务计算生物学和生物信息学,15卷,不。39岁,1 - 1,2019页。
视图: 谷歌学术搜索
吴z高,y、m . Harandi和y,”一个健壮的距离测量对于社民党歧管相似性分类,“IEEE神经网络和学习系统,16卷,不。29日,页1 - 15,2019。
视图: 谷歌学术搜索
周t . m . Chen和j .邹”基于强化学习的多传感器数据融合方法。”IEEE / CAA自动化杂志》上》第六卷,第149 - 128页,2020年。
视图: 谷歌学术搜索
f . y . Rao j .曹e . Bertino和m . Kantarcioglu“混合的私人记录链接,”ACM事务信息和系统安全,22卷,不。3,1-36,2019页。
视图: 出版商的网站 | 谷歌学术搜索
k . Nozaki t Hochin h . Nomiya,“语义模式匹配的字符串属性词向量及其评价,“国际期刊的网络化和分布式计算7卷,第106 - 100页,2019年。
视图: 谷歌学术搜索
j·a·诺和a . Papandreou-Suppappola”计算高效的复合K-distribution估计海面回波在热噪声及其应用海洋回波反射率的观察,“IEEE航空航天和电子系统卷,56号3、2340 - 2350年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
李x, z . j . Li张,和h·陈,“基于学习生物医学关系提取,”《美国社会信息科学和技术卷,59号5,756 - 769年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
w·廖,曾庆红b、x阴和p,“一种改进的体范畴情绪分析模型基于罗伯塔的文本情感分析,“应用智能4卷,1 - 12,2020页。
视图: 谷歌学术搜索
杨和c . Tan“检测资源授权规则之间的冲突可扩展访问控制标记语言基于动态描述逻辑,“Ingenierie des系统d信息,25卷,不。3、178 - 201年,2020页。
视图: 谷歌学术搜索
l·李·朱,h .太阳,y, y,和d·金,“多源信息融合和deep-learning-based特征测量为探索同行参与对股价同步性的影响,“信息融合,卷69,不。3、21、2021页。
视图: 出版商的网站 | 谷歌学术搜索
l, l . Junting, g . Fuxiang”罗切斯特自适应冲突检测算法基于软件事务性内存,”物理学杂志》:会议系列,卷1746,不。1,p。012050年,2021。
视图: 出版商的网站 | 谷歌学术搜索
y, w .曹、吴m .和y元,“简化孤立点检测的改进模糊模型的鲁棒性,”中国科学,卷63,不。4、2020。
视图: 出版商的网站 | 谷歌学术搜索
x秦,j·李,w·胡,j .杨“机器学习为添入的k - means聚类算法分离密度拟合加速混合功能与原子轨道数值计算,”《物理化学》杂志上,卷124,不。48岁,10066 - 10074年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
h·h·Pajouh r . Javidan r . Khayami A . Dehghantanha k . k . r . Choo,“一个两层的降维,双层anomaly-based入侵检测的分类模型物联网骨干网络,”IEEE新兴主题计算,7卷,不。2、314 - 323年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
l .隶属和z . Wenjuan研究恒星光谱异常挖掘基于模糊大利润和最小球分类模型,”光谱和光谱分析,36卷,不。4、1245 - 1248年,2016页。
视图: 谷歌学术搜索
Cai, r .太阳,s, s, g .元,“一个有效的异常检测方法基于最小罕见的加权数据流模式挖掘,”中国通信,16卷,不。10日,83 - 99年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
问:聚氨酯,刘贤Ng, m .周和j·王,“流氓接入点本地化和异常值检测方案利用稀疏恢复技术,”IEEE车辆技术,卷70,不。2、1866 - 1877年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
l . Zhang y谢,x的菜肴和x张“多源异构数据融合”2018年国际会议上人工智能和大数据(ICAIBD)IEEE 2018。
视图: 谷歌学术搜索
j . Li Tobore, y, a . Kandwal l . Wang和z聂,“非侵入性监测三个葡萄糖范围基于心电图利用DBSCAN-CNN,”IEEE生物医学和卫生信息学杂志》上,25卷,不。9日,第3350 - 3340页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
k·j·s . Lee Jung,公园公园,和d s . Kim“深度学习和相似性层次聚类方法预测乳头状肾细胞癌的病理阶段,“计算和结构生物技术杂志,18卷,不。2、2639 - 2646年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
l .宇j . h .田l .忌用l . Xiaozhong美国了,和l . Min”MR-BIRCH:一个可伸缩的MapReduce-based桦木聚类算法”,《智能与模糊系统,40卷,不。3、1432 - 1451年,2021页。
视图: 谷歌学术搜索
p .贾、王x和k .郑”基于智能集群的分布式时钟同步在当地工业物联网系统中,“IEEE工业信息,16卷,不。6,3697 - 3707年,2020页。
视图: 谷歌学术搜索
m . Riahi-Madvar A·阿克巴里Azirani b . Nasersharif b . Raahemi,“一个新的density-based子空间选择方法对高维异常值检测,使用互信息”以知识为基础的系统,卷216,不。2、106733 - 106733年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
o . Alghushairy r . Alsini x马,t·苏尔”会增加当地异常因素有效的数据流处理的算法,”国际会议上计算和数据分析(Iccda 2020)2020年,硅谷、钙、美国。
视图: 谷歌学术搜索
m·杨和d . Ergu车辆数据基于LOF算法的异常检测,”在信号处理领域,4卷,不。1,第694 - 678页,2020。
视图: 谷歌学术搜索
p . y . f . Liu Yu歌,y的粉丝,和x通,“可伸缩KDE-based头n个地方在大规模的数据流异常检测,”以知识为基础的系统,卷204,不。9日,第106186 - 106186页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
江j .江问:妈,x, j .马”排名保护特性匹配。”模式识别,卷111,不。8,107665 - 107665年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
l . Chen w·王,杨y”CELOF:有效和快速记忆高效地方孤立点检测的高维数据流,”应用软计算,卷102,不。12日,第129 - 107页,2021年。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

289年

下载

312年

引用