复杂性
复杂性
1099 - 0526
1076 - 2787
Hindawi
10.1155 / 2021/9426547
9426547
研究文章
相互影响的标准:升级的信息质量比率
https://orcid.org/0000 - 0003 - 4414 - 6119
罗西
里卡多。
1
https://orcid.org/0000 - 0001 - 5158 - 7292
Gelfusa
Michela
1
https://orcid.org/0000 - 0002 - 5055 - 2036
德马西
菲利波
1
https://orcid.org/0000 - 0001 - 8320 - 2844
Ossidi
马特奥
1
https://orcid.org/0000 - 0002 - 3932 - 3865
Murari
安德里亚
2
德•阿吉亚尔
M。
1
工业工程系
罗马Tor Vergata大学
通过德尔Politecnico 1
00133年罗马
意大利
uniroma2.it
2
INFN Consorzio改进(CNR ENEA,意大利的帕多瓦迪,Acciaierie Venete SpA)
Corso Stati Uniti 4
35127年帕多瓦
意大利
2021年
12
8
2021年
2021年
23
4
2021年
12
7
2021年
3
8
2021年
12
8
2021年
2021年
版权©2021里卡多。罗西et al。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
理解和量化系统之间的相互影响在任何科学事业仍至关重要但有挑战性的任务。皮尔逊相关系数,互信息,信息质量比率是使用最广泛的指标,只有最后两个被有效的非线性相互作用。鉴于其局限性,提出了一个新的标准,相互影响的标准,这是非常简单的概念上,不做任何假设随机变量的统计数据。除了正常的信息质量比,它提供了一个更好的韧性噪音和更高的稳定性问题的确定涉及的概率分布函数。有条件的版本,来抵消混杂变量的影响,也被开发出来,显示相同的优势相比传统的指标。一系列系统的测试与数值例子报道,比较的属性与更传统的新指标,证明其在几乎所有方面明显的优势。
1。确定统计量之间的依赖性
系统之间相互影响的调查是一项重大的科学目标几乎所有学科。线性和非线性效应可能是重要的,后者经常成为占主导地位的复杂现象(
1 ]。与测量获得的信息系统通常是受到各种形式的不确定性的影响。被测变量可以因此被视为随机变量,和他们的相互影响在一定程度上是确定的,部分概率。
量化随机变量之间的依赖关系是一个重要的对二元和多元数据统计的任务。最受欢迎的两个量之间依赖皮尔逊积差相关系数或“皮尔逊相关系数”(PCC) [
2 ]。减轻其局限性(见部分
2 ),上个世纪初,开发各种替代指标排名基于变量,比如枪兵
ρ 或斯皮尔曼等级相关系数
3 )和等级相关系数或假象
τ (
4 ]。第二次世界大战后信息理论标准,如互信息,成为很受欢迎的
5 ]。在新世纪的曙光,很多工作是致力于巩固距离相关,表明是零只有当两个变量不相关
6 ]。在过去的年里,遗传学的进步也推动发展的各种技术分析向量之间的依赖在高维度。对于这个多变量推理,提出了非常复杂的方法,从投影相关(
7 )球协方差(
8 和布朗的距离
9 ]。所有这些技术都是基于特定假设随机变量的统计特性的向量需要考虑。他们也很相关,在概念上和数值。
本文旨在提出的指标只处理二维情况下,之前的信息是知道数据的统计,所以完全通用技术要求。有条件的版本来抵消混杂变量的影响也被开发出来。指标也非常简单的背景从概念的角度,解释结果和实现要求。
关于论文的结构,部分
2 介绍最统一的指标,通常用于评估两个变量之间的依赖。部分
3 讨论了拟议的替代指标的主要原理:相互影响标准。系统测试,比较RIC PCC和差的特性,在部分报道
4 和
5 ,分别为功能性和非功能性的依赖关系。对噪声的鲁棒性的统计,不同于高斯和离群值,讨论了部分
6 。里克节中介绍的有条件的版本
7 ,结论是在部分
8 。
2。传统和替代标准量化数量之间的相关性
为了充分升值的潜力提出新的指标,值得开始讨论与评论的传统和替代工具所使用的大多数从业者分析二元的依赖。两个量之间的线性相关性通常计算皮尔逊相关系数(PCC)。的随机变量
X 和
Y ,表明与协方差和浸
σ 计算标准偏差,PCC (
10 ]
(1)
PCC
=
浸
X
,
Y
σ
x
σ
y
。
即使是非常有用的在实践中,PCC的一些限制,特别是其易受噪音,经常被忽视。在任何情况下,检测两个变量之间的非线性相关性是一个更严重的问题。量化非线性相关性,从历史上看,第一个技术开发是基于变量排名(见部分
2.1 )。第二次世界大战后,指标基于数据的概率分布函数(pdf)开发;特别是,信息理论标准很受欢迎(部分
2.2 )。最近距离的相关性是一个更加发展,于2005年首次推出,补救的办法,皮尔森相关系数可以为因变量(部分是零
2.3 )。
2.1。Rank-Based标准
摘要象征
ρ
年代 显示扩展的查尔斯•斯皮尔曼皮尔逊相关系数。斯皮尔曼的
ρ
年代 是一种非参数的统计排名的两个变量之间的依赖;因此,它如何量化两个变量之间的关系可以模仿一个单调函数
11 ]。斯皮尔曼的
ρ
年代 计算之间的皮尔逊相关涉及的数量和评估的等级值单调它们之间的关系是如何(是否线性)。如果没有重复的数据值,
ρ
年代 假设值+ 1或−1的两个变量是完美的单调函数。
斯皮尔曼的计算
ρ
年代, 原始数据
X
我 和
Y
我 转化为排名第一:排名
X 和等级
Y ;排名这两个变量的标准差与符号表示
σ
排名
X
和
σ
排名
Y
。斯皮尔曼的
ρ
年代 然后,定义为
(2)
ρ
年代
=
浸
排名
x
,
排名
y
σ
排名
x
σ
排名
y
。
肯德尔秩相关系数,莫里斯·肯德尔的名字命名,是30年代末开发的,通常是用希腊字母表示
τ 。它是为了测量等级相关,即。,the similarity of the ordering of the data when ranked. Intuitively, the higher the Kendall correlation between two variables, the more similar their rank; the Kendall
τ 也正常,它范围1 -−1 (
11 ]。
在数学上,肯德尔秩相关系数计算
(3)
τ
=
数量的整合对
−
许多不和谐的双
n
2
,
分母是二项式系数在哪里
n
2
=
n
n
−
1
/
2
。
2.2。信息理论的标准
一种广泛使用的指标调查非线性相互作用是互信息,量化信息共享的两个系统。香农或离散的版本被定义为(
12 ,
13 ]
(4)
心肌梗死
山
=
∑
∑
p
x
y
日志
p
x
y
p
x
p
y
,
在哪里
p
x 和
p
y 两个随机变量的离散概率吗
X 和
Y 和
p
xy 是他们的联合概率。
一个微分版本的指标可以制定的概率密度
f
x 和
f
y :
(5)
f
x
=
p
x
Δ
x
,
f
y
=
p
y
Δ
y
,
f
x
y
=
p
x
y
Δ
x
Δ
y
,
Δ在哪里
x 和Δ
y 箱子的尺寸。互信息差,MIdiff ,被定义为
(6)
心肌梗死
Diff
=
∫
∫
f
x
y
日志
f
x
y
f
x
f
y
d
x
d
y
。
它可以很容易地证明了两个关系(
4 )和(
6 )是等价的;互信息是,因此,称为MI的纸。MI各种积极的属性,但不正常的主要限制。排除这个缺点,互信息通常是除以联合熵获取所谓的信息质量比率(差)
14 ]:
(7)
位差
=
心肌梗死
H
X
,
Y
。
这个量是正常的,因为它假定只有0和1之间的值。重要的是要记住,在方程(
7 ),离散或香农版本的联合熵是用来:
(8)
H
年代
,
X
Y
=
−
∑
∑
p
x
y
日志
p
x
y
。
香农熵是较差,这也可以认为消极的价值观:
(9)
H
D
,
X
Y
=
−
∫
∫
f
x
y
日志
f
x
y
d
x
d
y
。
方程(
7 )是普遍接受的版本信息质量比,通常采用因为微分版本的联合熵可以是负的,有明显的相关问题和困难。
不幸的是,主要由于分母,差年代 有一些局限性,特别是缺乏鲁棒性噪声和强大的垃圾箱的选择的依赖。
2.3。距离相关
的目标距离相关性(
D 相关系数 )由量化两个随机向量之间的依赖,也不需要一定维度。
D 相关系数 有明显的优势,PCC相比,人口距离相关系数假设一个零值只有在两个随机向量是独立的。因此,距离相关性是为了量化两个线性和非线性两个随机变量或随机向量之间的联系(
5 ]。
的计算
D 相关系数 需要一些初步量的定义。指示(
X
k ,
Y
k ),
k = 1,2,…
n ,样本实值或向量值随机变量(
X ,
Y )的元素
n 通过
n 距离矩阵(
一个
j ,
k )和(
b
j ,
k )都是成对的距离:
(10)
一个
j
,
k
=
X
j
−
X
k
,
j
,
k
=
1、2
,
…
,
n
,
b
j
,
k
=
Y
j
−
Y
k
,
j
,
k
=
1、2
,
…
,
n
,
在| | | |表示欧几里得范数。定义
一个
¯
j
和
一个
¯
k
随着
j 行均值和
k th列的意思是,分别
一个
¯
第一个向量相互距离的总平均
X 矩阵,然后计算所有双中心距离(使用相同的符号
Y 向量矩阵):
(11)
一个
j
,
k
=
一个
j
,
k
−
一个
¯
j
−
一个
¯
k
+
一个
¯
,
B
j
,
k
=
b
j
,
k
−
b
¯
j
−
b
¯
k
+
b
¯
。
所需的样本协方差距离是那么简单的算术平均产品
一个
j, k
B
j, k :
(12)
d
浸
n
2
X
,
Y
≔
1
n
2
∑
j
=
1
n
∑
k
=
1
n
一个
j
,
k
B
j
,
k
。
表明随着距离的方差,
(13)
d
Var
n
2
X
,
X
≔
1
n
2
∑
k
,
l
=
1
n
一个
k
,
l
2
,
最后,距离相关性
(14)
d
天哪
X
,
Y
≔
d
浸
X
,
Y
d
Var
X
d
Var
Y
。
的主要属性
d 软木是它假设值在0和1之间,它是零只有两个向量是独立的。距离相关软件用于这项工作是由沈刘(
15 ]。
3所示。相互影响的标准:基本原理
将论文的其余部分所示,所有标准总结在前一节中有几个缺点。在这个工作中,一个新的指标,能够量化线性和非线性变量之间的相关性,介绍。数量的新指标,基于信息理论和命名标准(RIC)相互影响,设计有以下属性。
3.1。属性1
指标范围从0(没有关系)1(完全相关)。这个指标的相关性的定义是这样的。
两个变量
我 和
j 相关的知识吗
我 有助于预测
j 和
反之亦然 。相关指标往往当的不确定性
我 (
j 已知)
j (
我 )趋于零。相关的不确定性时,必须等于零
我 (
j )时不会改变
j (
我 )是已知的。注意,在这个定义中,对称方程无法达到的价值;例如,对于函数
y
=
x
2
,因为
y 是已知的,有两种有效的值
x (排除
x = 0和
y = 0)。
3.2。属性2
指标没有变化的函数使用的装箱或概率密度分布函数的计算,例如,
(15)
Δ
N
本
N
本
≫
Δ
里克
里克
,
在ΔRIC表示指标计算值之间的差异,没有离群值。
3.3。财产3
指标可以计算地为离散的或连续的随机变量。
3.4。性质4
小敏感异常值量化
(16)
N
离群值
N
≫
Δ
里克
里克
。
里克的配方确保前者属性
(17)
里克
=
1
−
一个
H
x
y
一个
H
x
+
H
y
=
1
−
一个
H
x
y
一个
H
x
+
H
y
=
1
−
1
一个
心肌梗死
。
RIC指标是基于信息量之间的比例(不确定性)共享的两个变量对个人信息(不确定性)的总和。在某些方面,它的定义非常类似于差指标,与里克的主要区别是基于熵的指数
一个
H 。这种方法允许获得更可靠指标,满足上述四个可取的属性,如下面所示,这提供了一些额外的积极品质,即对称,渐近一致性,和无偏性,讨论了在附录a。
关于自由参数,其数值的选择可以优化,根据数据的性质和目标的调查。结果,在本文的其余部分,报告已经获得的设置
一个 = 10,最大化里克的连贯性与PCC的线性相关性;下面的方程也particularised数值。详细讨论的RIC行为参数在附录B提供。
一些可以分析证明了上述四个属性。首先,财产1可以证明如下。不相关的变量,
H
x
+
H
y
=
H
x
y
和
心肌梗死
⟶0;因此,
(18)
lim
心肌梗死
⟶
0
里克
=
lim
心肌梗死
⟶
0
1
−
10
H
D
,
x
y
10
H
D
,
x
+
H
D
,
y
=
lim
心肌梗死
⟶
0
1
−
1
10
心肌梗死
=
0。
在部分相关量的情况下,里克总是正的,对于高互信息,它往往比一。更具体地说,它是已知的,高度的相关性水平,联合熵往往最低熵两个变量(
H
x
y
⟶
最小值
H
x
,
H
y
)[
16 ),这意味着
心肌梗死
⟶
马克斯
H
x
,
H
y
。假设
H
y >
H
x ,它是
(19)
lim
H
x
y
⟶
H
x
R
我
C
=
lim
H
x
y
⟶
H
x
1
−
10
H
x
y
10
H
x
+
H
y
=
lim
H
x
y
⟶
H
x
1
−
10
H
x
10
H
x
+
H
y
=
lim
H
x
y
⟶
H
x
1
−
1
10
H
y
>
0。
财产3也可以证明。事实上,写作RIC使用微分信息理论数量和记住熵之和等于之和互信息和联合熵,可以证明里克D 里克是一样的吗年代 :
(20)
里克
D
=
1
−
10
H
D
,
x
y
10
H
D
,
x
+
H
D
,
y
=
1
−
1
10
米
我
=
1
−
10
H
年代
,
x
y
10
H
年代
,
x
+
H
年代
,
y
=
里克
年代
。
此外,里克是直接相关的互信息值;同时,产权2预计将满足(节中进行验证
4 )。
在解释方面,里克仍然是一个信息的理论指标,因为它依赖于互信息。相反,单调的变换(
15 )提供了一个几乎正常指标而无需求助于联合熵。这样一个再形成的优势将会详细说明,借助数值测试,在接下来的部分。
4所示。相互影响的标准:数值测试函数依赖
在本节中,里克的属性研究的帮助下合成一系列数值试验数据。基准性能的参考指标里克的综述部分
2 最常用的实践者。只有二元依赖性由于功能关系被认为是;非功能依赖关系的主题部分
4.1 。首先提供了一个总体概述结果和一些具体的方面讨论了专用的部分。
4.1。比较概述
第一次比较里克和其他标准进行函数依赖线性,二次,正弦和指数。一系列的结果代表了病例报告表格
1 。中提供了一个图形化的概述图
1 。高斯分布的随机噪声标准差等于10%的数量值,添加了所有变量。
表1
各种指标的值图的情况下
1 。
y
=
x
y
=
x
2
y
=
e
x
y
=
罪
3
x
皮尔森
0.99
0.03
0.93
0.01
斯皮尔曼
0.99
0.03
0.98
0.03
肯德尔
0.93
0.02
0.90
0.01
距离相关
0.99
0.49
0.96
0.35
位差
0.47
0.35
0.46
0.33
里克
0.97
0.93
0.96
0.90
图1
功能测试的主要类。(一)合成数据的例子。(b)的数值指标。
(一)
(b)
表的值
1 并检查图
1 显示,里克从未执行明显比其他标准线性依赖关系。里克开始超越其他所有指标的非线性函数。此外,正如所料,里克提供更加可靠和合理的结果只要功能依赖非单调甚至当失败的排名方法。基于pdf的指标,相关性差,距离显示重大困难提供可接受的结果非依赖性。这些都是一般性质不仅适用于报告的例子也证实在所有情况下进行测试。
4.2。线性相关性:高斯噪声的影响和装箱
这一节中,图的帮助下
2 ,只是针对支持声明,里克PCC的可以复制的值线性相关性。的行为的其他指标也显示完整性。块图
2 参考的情况下完美的量之间的线性相关性:
y =
x 。在
x 设在,添加剂噪声的标准差和零均值和报告从高斯分布进行随机采样。结果是完全通用。RIC繁殖相当PCC的值,而差更容易受到噪声和装箱。类似的分析表明,里克也更健壮的异常值的存在;事实上,它可以容忍甚至比差一个数量级多个异常值,确认财产的第4部分
3 满意(5%的离群值,皮尔森系数变化约10%,平均差变化为12%,而ΔRIC是0.7%)。
图2
(a) PCC的行为、差和里克与加性噪声的标准差两个变量之间的线性关系:
y =
x 。(b)的行为PCC、差和里克与加性噪声的标准差不同装箱。
(一)
(b)
4.3。非线性相关性:高斯噪声的影响和装箱
里克的竞争优势更加明显的非线性关系。在图三个范例的情况下
3 ,提出新准则较差年代 。据函数依赖
y =
x 2 ,
y =罪(
x ),
y = exp (
x )。
图3
PCC的行为、差和里克与加性噪声的标准差为各种非线性依赖关系。(一)
y =
x 2。(b)
y =罪(
x )。(c)
y = exp (
x )。
(一)
(b)
(c)
正如所料,IQR更敏感的选择装箱和噪音水平。里克仍然稳定在一个值非常接近1更大范围的这些因素。此外,差不输出值甚至完美的两个变量之间的相关性。这是一个分母不正常数量的结果。还在非线性相关性的情况下,里克提供更一致的结果也存在相当数量的异常值(比较弹性类似于线性相关性的情况下)。
里克的积极品质,PCC和差相比,并不是一个微不足道的问题在实践中,因为在真实的应用程序中,噪声的影响和不确定性pdf文档的细节可以有强烈影响的结论。
应该注意的是,从分析面元的函数执行,很明显,房地产的第2部分
3 满意,也就是说,
Δ
N
本
/
N
本
≫
Δ
里克
/
里克
。
5。相互影响的标准:数值为非功能性测试依赖关系
治疗病例在这一节中,为非功能性例证里克的属性依赖(加性高斯噪声的均值等于零,标准差等于0.1),如图所示
4 。这些类型的依赖关系是很复杂的,难以解决。他们甚至不能完全非线性和由函数表示。对于所有这些情况下,里克表现明显好于其他指标。合成结果报道在表的概述
2 。
图4
主要的例子主要函数依赖调查。(一)合成数据的例子。(b)的数值指标。
(一)
(b)
表2
各种指标的值图
4 。
圆形
两方
菱形
皮尔森
0.00
0.00
0.03
斯皮尔曼
0.00
0.00
0.04
肯德尔
0.00
0.00
0.02
距离相关
0.19
0.31
0.15
位差
0.21
0.31
0.05
里克
0.80
0.89
0.38
检查表
2 和图
4 揭示了RIC标准总是高于其他因素。的一部分的菱形依赖总是提供一个0.8或更高的价值,而其他指标更接近零。因此,里克提供了更可靠的迹象,这两个变量之间有很强的相关性。即使两个最先进的标准,差和距离相关性,对所有被研究的例子执行明显恶化。
6。鲁棒性噪声不同的统计和离群值
信号和数据获得在许多学科通常受到噪声的影响。高斯统计的假设往往是合理的,但也有其他重要类型的噪声的实践和理论意义。最相关的两个肯定是泊松分布和γ。
泊松分布:
(21)
f
x
=
λ
n
n
!
e
−
λ
,
∀
n
∈
ℕ
。
伽马分布:
(22)
f
x
=
x
k
−
1
e
−
x
/
θ
θ
k
Γ
k
,
∀
x
>
0
,
k
,
θ
∈
ℕ
。
图
5 报道一些比较的例子不同的性能指标这两个发行版。的病例报道充满代表一系列的系统测试执行调查这一点。一般来说,对于高斯分布在图
5 作为参考,里克也更受加性噪声不同的分布。
图5
里克和其他标准的比较非线性相关性,
y = 30罪(3
x ),信号受加性噪声不同的统计数据。
另一个潜在的污染来源的数据,实际的相关性,是异常值的存在。如果用户是意识到的问题,之前有一些异常值的统计信息,可以采取一些措施来挽救局面之前应用依赖指标(
17 ,
18 ]。这些措施属于健壮的统计数据,可以很有效的家庭。相反,它并非总是如此,医生是意识到这个问题,因此研究鲁棒性的各种依赖标准异常值仍然是一个重要的主题。一些代表一系列的系统测试的结果,执行评估这方面,如图所示
6 函数依赖的主要类。在这些情况下,异常值生成随机高斯点平均等于零和标准偏差与函数的范围。正如预期的那样,最脆弱的指标是新闻申诉委员会。rank-based标准和相关的距离是稍微不敏感;离群值必须是相对较高的数量和振幅影响排名,之前有不利影响这些指标的值。在任何情况下,即使在异常值的存在,里克仍是最健壮的标准。
图6
鲁棒性里克和其他标准对离群值。的
x 设在离群值的百分比报告生成随机使用大型标准差的高斯分布。
7所示。条件的相互影响的标准
相关分析在许多应用程序中,一个基本目标包括确定变量之间的相互影响的混杂因素的存在。因此自然调查的潜在条件里克的版本:
(23)
里克
气孔导度
X
,
Z
|
Y
=
1
−
1
10
心肌梗死
气孔导度
X
,
Z
|
Y
。
在接下来的情节,里克的表演气孔导度 与的一个条件差的版本:
(24)
位差
气孔导度
X
,
Z
|
Y
=
心肌梗死
气孔导度
X
,
Z
|
Y
H
X
Z
。
块图
7 报告的情况下非线性相关性(
z =
x 2 +
y ,
z =
x 3 +
y ,
z = ex +
y ),但是同样的结论也适用于线性效应。
图7
里克的比较气孔导度 (
X ,
Z |
Y )和差气孔导度 (
X ,
Z |
Y )各种类型的相互影响的混杂因素的存在。
此外,在这个应用程序中,里克提供更好的韧性噪音,并较少依赖面元的选择来确定数量的pdf。此外,即使对于非常低水平的不确定性,在没有噪音的极限,它实际上能够更清楚地识别的相互关联。
8。讨论和结论
量化量之间的相互影响,引入了一个新的指标,相互影响的标准。分离条件版本的混杂因素的影响也被设计了。RIC繁殖的结果PCC的线性相关性,但更健壮与添加剂噪声和离群值的影响。的非线性影响,里克优于不仅排名标准和协方差的距离还差理论等指标的信息在很多方面;它提供了更多可判断的结果和更强劲的对噪声和较不敏感的选择装箱的pdf文件。所有这些竞争优势可以在实践中相当重要。
其他方面,而不是被忽视的一个广泛应用的角度提出了指标,是里克在概念上非常简单,容易实现,并完全通用,在某种意义上,它不依赖于特定的假设随机变量的属性。需求的数据,当然,足够的例子必须正确可用计算pdf文档,但里克比另一种更简洁的指标,需要估计量的概率分布函数。
对于未来的发展,它是计划调查是否替代版本的熵和,因此,派生的数量,可以帮助提高里克的性能
19 - - - - - -
22 ]。此外,额外的配方,更适合实际的因果关系的调查比简单的相关性,也在考虑(
23 - - - - - -
26 ]。在实际应用方面,一些最直接从同步的调查在热核聚变实验和中断
27 - - - - - -
37 )测量技术和数据分析方法的改进在地球科学和等离子体物理
38 - - - - - -
40 ]。
附录
a额外有用的属性相互影响的标准
这个附录致力于展示RIC满足一些基本的属性,这是可取的任何相关的标准。他们是对称、渐近的一致性和无偏性(独立于抵消)。
对称:里克(
X ,
Y )=里克(
Y ,
X )。这显然是正确的,互信息对称。的确,
(.)
里克
X
,
Y
=
1
−
1
10
心肌梗死
X
,
Y
=
1
−
1
10
心肌梗死
Y
,
X
=
里克
Y
,
X
。
渐近线的一致性:这个属性基本上意味着指标假设的时候适当的值减少到零个或变得非常大。另外,在这方面,里克表现非常令人满意。指标范围从0到1,增加与MI单调,可以直接从方程(
19 )和(
20. )。
独立来抵消(公正):这些额外的非常重要的属性确保一个常数抵消或偏见的数据不会影响结果,可以写成里克(
X +
一个 ,
Y +
b )=里克(
X ,
Y )∀
一个 ,
b
ϵ
P 。另外,这个属性是一个直接后果的无偏互信息的性质。的确,
(a)
里克
X
+
一个
,
Y
+
b
=
1
−
1
10
心肌梗死
X
+
一个
,
Y
+
b
=
1
−
1
10
心肌梗死
X
,
Y
=
里克
X
,
Y
。
b的选择参数<斜体> < /斜体>
一般来说,里克被定义为指标
(责任)
里克
=
1
−
一个
H
x
y
一个
H
x
+
H
y
=
1
−
1
一个
心肌梗死
。
在这个附件,里克对的行为
一个 进行了探讨。的参数
一个 确实可以根据情况和优化的目标分析。这个自由度可以在各种应用程序变得方便。的原因
一个 已经设置等于10,获得的结果呈现在他的作品中,是,对于这个选择,里克产生很好PCC的趋势,以防两个量之间的相关性分析是线性的。图
8 显示了RIC值之间的线性相关性的函数不同
x 和
y 和
一个 。
图8
RIC趋势与平方皮尔逊相关系数为不同的值
一个 。
为
一个 = 10,里克几乎线性平方PCC是变化的,这个非常受欢迎的一致性指标可以被视为一个积极的质量在大多数应用程序。
数据可用性
使用的数据来支持这个研究的发现可以从相应的作者。
信息披露
罗西和Gelfusa co-first作者。资助者没有作用的设计研究;在收集、分析或解释的数据,写的手稿,并决定发表的结果。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
本研究所有作者同样做出了贡献。
[
]1
科恩
J。
科恩
P。
西
s G。
艾肯
l S。
应用多元回归和相关分析的行为科学
2002年
3日
举起,英国东苏塞克斯
心理学的新闻
[
]2
皮尔森
K。
注意回归和继承的两个父母
英国伦敦皇家学会学报》上
1895年
58
347年
240年
242年
10.1098 / rspl.1895.0041
[
]3
斯皮尔曼
C。
证明和测量的两件事情之间的联系
美国心理学杂志》
1904年
15
1
72年
101年
10.2307/1412159. jstor1412159
[
]4
肯德尔
M。
等级相关的新措施
生物统计学
1938年
30.
1 - 2
81年
89年
10.1093 / biomet / 30.1 - -2.81
[
]5
Guiasu
年代。
信息理论与应用
1977年
纽约,纽约,美国
麦格劳-希尔
[
]6
Szekely
g。J。
里索
m . L。
Bakirov
n K。
测量和测试独立相关的距离
统计年鉴
2007年
35
6
2769年
2794年
10.1214 / 009053607000000505
2 - s2.0 - 50849124115
[
]7
朱
l
徐
K。
李
R。
钟
W。
投影两个随机向量之间的相关性
生物统计学
2017年
104年
4
829年
843年
10.1093 / biomet / asx043
2 - s2.0 - 85039170100
[
]8
锅
W。
球协方差:通用测量巴拿赫空间的依赖
美国统计协会杂志》上
115年
2020年
529年
[
]9
Szekely
g . J。
里索
m . L。
布朗距离协方差
应用统计年鉴
2009年
3
4
1236年
1265年
10.1214 / 09-aoas312.pmc2889501
[
]10
SPSS教程:皮尔逊相关性,2017,
https://libguides.library.kent.edu/SPSS/PearsonCorr
[
]11
货物订单
g·W。
工头
d . I。
非参数统计:一种循序渐进的方法
2014年
美国新泽西州霍博肯
威利
[
]12
麦凯
d . j . C。
信息理论、推理和学习算法
2003年
英国剑桥
剑桥大学出版社
[
]13
阿恩特
C。
信息的措施,在科学和工程信息及其描述
2004年
施普林格系列:信号和通信技术
[
]14
封面
T。
托马斯。
j . A。
信息理论的元素
2006年
2日
纽约,纽约,美国
Wiley-Interscience
[
]15
威尔科克斯
R。
介绍了稳健估计和假设检验
统计建模和决策科学
2012年
3日
荷兰阿姆斯特丹
爱思唯尔/学术出版社
[
]16
Baudot
P。
Tapia
M。
Bennequin
D。
Goaillard
人类。
拓扑信息数据分析
熵
2019年
21
9
869年
10.3390 / e21090869
2 - s2.0 - 85071929824
[
]17
刘
年代。
距离相关
2020年,
https://www.mathworks.com/matlabcentral/fileexchange/39905-distance-correlation
[
]18
Hettmansperger
t P。
麦克基恩
j·W。
健壮的非参数统计方法,肯德尔图书馆的统计数据
1998年
纽约,纽约,美国
约翰•威利& Sons . n:行情)。
[
]19
尼尔森
F。
诺
R。
的封闭表达式Sharma-Mittal熵指数的家庭
物理学杂志》:数学和理论
2011年
45
3
032003年
10.1088 / 1751 - 8113/45/3/032003
2 - s2.0 - 84555190989
[
]20.
Renyi
一个。
措施的信息和熵
第四伯克利分校学报》研讨会上数学、统计和概率
1961年
美国加利福尼亚州伯克利
547年
561年
[
]21
Tsallis
C。
可能的波尔兹曼吉布斯统计的泛化
统计物理学杂志
1988年
52
1 - 2
479年
487年
10.1007 / BF01016429
2 - s2.0 - 33646516485
[
]22
Tsallis
C。
介绍Nonextensive统计力学
2009年
施普林格,德国柏林
[
]23
Romano
m . C。
泰尔
M。
Kurths
J。
冯Bloh
W。
多变量递归图
物理信
2004年
330年
3 - 4
214年
223年
10.1016 / j.physleta.2004.07.06
[
]24
马文
N。
Carmenromano
M。
泰尔
M。
Kurths
J。
递归式情节复杂系统的分析
物理的报告
2007年
438年
5 - 6
237年
329年
10.1016 / j.physrep.2006.11.001
2 - s2.0 - 33846338227
[
]25
以下两
T。
测量信息传递
物理评论快报
2000年
85年
2
461年
464年
10.1103 / physrevlett.85.461
2 - s2.0 - 12944275674
[
]26
格兰杰
c·w·J。
研究因果关系的计量经济模型和交叉谱方法
费雪
1969年
37
3
424年
438年
10.2307 / 1912791
[
]27
Murari
一个。
Lungaroni
M。
Peluso
E。
使用熵转移到研究之间的因果影响信号的时间范围
熵
2018年
20.
9
627年
10.3390 / e20090627
2 - s2.0 - 85052111976
[
]28
Murari
一个。
Peluso
E。
Gelfusa
M。
应用熵转移到因果关系检测和同步托卡马克实验
核聚变
2016年
56
2
026006年
10.1088 / 0029 - 5515/56/2/026006
2 - s2.0 - 84957005804
[
]29日
Murari
一个。
如何评估的效率同步托卡马克实验
核聚变
2016年
56
076008年
10.1088 / 0029 - 5515/56/7/076008
2 - s2.0 - 84978898754
[
]30.
Murari
一个。
Craciunescu
T。
Peluso
E。
莱赫奇
E。
Gelfusa
M。
在效率和解释sawteeth踱步与同轴的ICRH调制在喷气机
核聚变
2017年
57
12
126057年
10.1088 / 1741 - 4326 / aa87e7
2 - s2.0 - 85032480942
[
]31日
莱赫奇
E。
Lennholm
M。
卡瓦略
i S。
锯齿波与轴上踱步在JET-ILW ICRH调制
核聚变
2017年
57
3
036027年
10.1088 / 1741 - 4326 / aa53b6
2 - s2.0 - 85013421221
[
]32
Garzotti
l
调查使用新的小尺寸颗粒颗粒榆树触发物理发射器在喷气机
美国第37 EPS受控核聚变与等离子体物理会议
2010年6月
爱尔兰都柏林
欧洲物理学会
https://ocs.ciemat.es/EPS2010PAP/pdf/P2.131.pdf
[
]33
德弗里斯
p C。
Baruzzo
M。
Hogeweij
通用汽车D。
的中断ITER-like壁射流的影响
等离子体物理学
2014年
21
5
056101年
10.1063/1.4872017
2 - s2.0 - 84899093032
[
]34
帕梅拉
J。
Romanelli
F。
沃特金斯
m . L。
喷气机项目在ITER的支持
融合工程和设计
2007年
82年
为5 - 14
590年
602年
10.1016 / j.fusengdes.2007.03.003
2 - s2.0 - 35148849277
[
]35
帕梅拉
J。
飞机结果概述
核聚变
2003年
43
12
10.1088 / 0029 - 5515/43/12/002
2 - s2.0 - 0347253641
[
]36
Murari
一个。
Boutot
P。
维加
J。
集群基于测地距离高斯集合管自动分类的中断
核聚变
2013年
53
033006年
10.1088 / 0029 - 5515/53/3/033006
2 - s2.0 - 84874537144
[
]37
Murari
一个。
皮萨诺
F。
维加
J。
大量统计分析榆树在飞机碳墙
等离子体物理和受控核聚变
2014年
56
11
114007年
10.1088 / 0741 - 3335/56/11/114007
2 - s2.0 - 84908032432
[
]38
Orsitto
f P。
Boboc
一个。
高迪奥
P。
相互交互的法拉第旋转和Cotton-Mouton在喷气偏振相移测量
审查的科学仪器
2010年
81年
10
10 d533
10.1063/1.3502039
2 - s2.0 - 78149418392
[
]39
Bellecci
C。
Francucci
M。
高迪奥
P。
应用有限公司2 拨号系统红外探测森林火灾和减少假警报
应用物理B
2007年
87年
2
373年
378年
10.1007 / s00340 - 007 - 2607 - 9
2 - s2.0 - 34247331368
[
]40
Orsitto
f P。
分析飞机的法拉第旋转偏振测量
等离子体物理和受控核聚变
2011年
53
3
10.1088 / 0741 - 3335/53/3/035001
2 - s2.0 - 79952746999