CMMM
计算和数学方法在医学
1748 - 6718
1748 - 670 x
Hindawi
10.1155 / 2021/2464821
2464821
研究文章
Self-Representation-Based模糊支持向量机模型预测血管钙化的血液透析病人
刘
Xiaobin
1
张
Xiran
1
郭
孝义
1
https://orcid.org/0000 - 0003 - 2911 - 7643
丁
杰出
2
山
胖子
1
https://orcid.org/0000 - 0002 - 1456 - 4718
王
梁
1
https://orcid.org/0000 - 0002 - 0507 - 2033
周
魏
1
https://orcid.org/0000 - 0001 - 8812 - 5737
史
华
3
陆
栓
1
美国肾脏学
南京医科大学附属无锡人民医院
214023年
无锡
中国
njmu.edu.cn
2
电子与信息工程学院
苏州科技大学
215009年
苏州
中国
usts.edu.cn
3
光电学院,通信工程
厦门大学的技术
365001年
厦门
中国
xmut.edu.cn
2021年
28
7
2021年
2021年
4
5
2021年
30.
6
2021年
8
7
2021年
28
7
2021年
2021年
版权©2021 Xiaobin刘et al。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
在终末期肾病(ESRD)、血管钙化风险因素对血液透析患者的生存至关重要。有效地评估血管钙化的程度,机器学习算法可以用来预测血管钙化ESRD患者的风险。收集的数据的数量是不平衡在不同风险水平,它有一个影响分类的任务。因此,一个有效的模糊支持向量机(FSVM-SR)提出了基于自己预测血管钙化风险在这工作。此外,我们的方法也与其他常规机器学习方法相比,结果表明,我们的方法可以更好地完成分类任务的血管钙化的风险。
自然科学研究中国江苏高等教育机构
19 kjb520014
中国国家自然科学基金
61902271
江苏省“333”工程
BRA2020142
江苏省卫生委员会
LGY201801
无锡卫生委员会
Z201914
HB2020008
1。介绍
国外肾脏disease-mineral骨病(CKD-MBD)是最严重的并发症之一,在终末期肾功能衰竭患者,包括代谢异常的钙、磷、甲状旁腺激素、维生素D,骨转换异常,血管钙化,最终心血管疾病。
近年来,纤维母细胞生长因子(FGF23)已经被认为是一种蛋白质,这种蛋白质在磷酸调节起着重要的作用。克罗索蛋白质FGF23的受体蛋白质。它参与调节人体的骨代谢,钙和磷的代谢,保护血管的完整性,通过抑制血管钙化FGF23-klotho复合物的形成。因此,在CKD-MBD FGF23和克罗索是关键参与者,他们是密切相关的血管钙化和心血管疾病的发生。现有证据表明,有一个明确的FGF23与血管钙化的发生之间的相关性和心血管疾病(CVD)。FGF23的增加可以作为心血管疾病的危险因素患者终末期肾病(ESRD) [
1 ]。
Fetuin-A被认为是一种抑制剂的进展血管钙化和可以推迟腹主动脉钙化的发展(
2 ]。研究表明,有密切相关性fetuin-A和malnutrition-microinflammatory ESRD患者的状态(
2 ]。目前认为,低血清fetuin-A水平ESRD患者血管钙化是一个独立的危险因素。
ESRD患者的营养不良是一种常见的并发症,是密切相关的血管钙化,心血管事件,全因死亡率。影响因素(ESRD患者的营养包括蛋白质能量支出,消化和吸收,炎症,内分泌激素水平紊乱(
3 ]。
有各种各样的工具来评估透析患者的营养状况。其中,老年营养风险指数(GNRI)被认为是心血管死亡的一个重要预测因子(
4 ]。最新的研究还表明,GNRI之间存在一定的正相关和CKD患者主动脉钙化的程度
5 ]。
血管钙化(VC)分数在胸部平片上动脉和主动脉与心血管疾病相关事件和可能是心血管疾病的预测在透析病人
6 ]。许多研究结果表明,腹主动脉钙化评估在侧腰x射线是预测的存在显著的冠状动脉疾病在无症状的透析病人
7 ]。
我们工作的先前的研究结果表明,患者终末期肾功能衰竭水平异常FGF23和克罗索microinflammatory状态。他们的相互作用和相互影响参与血管钙化的发生和发展,CKD-MBD
8 ]。
因此,为了进一步探索ESRD患者血管钙化的风险因素,本文研究的科学和准确预测血管钙化风险因素在ESRD患者不同的预测模型,以帮助临床医生检测和早期干预,从而推迟CKD-MBD的发生和发展,减少心血管疾病的发病率,改善预后。机器学习(ML)已广泛应用于干重(DW) [
9 血液透析的患者,取得了良好的效果。很多ML-based模型也被用于药物发现(
10 - - - - - -
12 ),蛋白质功能(
13 - - - - - -
16 ),和疾病分析(
17 ,
18 ]。
在这项研究中,我们采用支持向量机(SVM)建立预测模型。SVM具有以下优点:(1)非线性映射的理论基础是支持向量机方法。支持向量机采用内积核函数来代替非线性映射到高维空间。(2)最优超平面划分特征空间是支持向量机的目标,和分类利润最大化的观点是支持向量机的核心方法。(3)少数支持向量确定最终结果,这不仅可以帮助我们捕捉关键样品也“删除”大量的冗余样本。不平衡数据集的分类标准支持向量机不擅长少数类别。在这项工作中,我们提出一个基于自己的模糊支持向量机(FSVM-SR)来识别血管钙化的血液透析患者在不平衡数据。FSVM可以估计每个训练样本的重量。当构造分类超平面,FSVM避免一些轻量级的样品(噪声样本)来缓解不平衡数据集的影响。
2。材料和方法
2.1。材料
这项工作雇佣了29个特征来描述病人的信息,包括性别、年龄、身体质量指数(BMI)、糖尿病(DM)、脑梗死(CI)、冠心病(CHD)。表
1 显示了数据集的详细信息。平均值和标准偏差的样本也列表。
表1
数据集的信息。
不。
功能
价值
r
∗
1
性别(男性或女性)
32/27
-0.0455
2
年龄(年)
55.83
±
15.60
0.4010
3
吸烟(是/否)
1/58
-0.0847
4
BMI(公斤/米2 )
23.56
±
3.12
0.1639
5
DM(是/否)
24/35
0.4847
6
CI(是/否)
3/56
0.0025
7
冠心病(是/否)
5/54
0.0433
8
收缩压(毫米汞柱)
155.69
±
23.63
-0.1150
9
舒张压(毫米汞柱)
88.11
±
13.71
-0.2043
10
磷酸盐粘结剂(是/否)
36/23
-0.2141
11
血红蛋白(g / L)
85.38
±
18.12
-0.2584
12
c反应蛋白(毫克/升)
11.74
±
35.61
0.3016
13
血清肌酐(
μ 摩尔/升)
785.09
±
368.62
-0.4252
14
血清葡萄糖(更易/ L)
5.48
±
2.28
0.2608
15
血清钙(更易/ L)
2.08
±
0.24
0.0520
16
血清磷(更易/ L)
1.81
±
0.38
-0.0862
17
总甘油酯(更易/ L)
1.69
±
1.08
-0.0542
18
总胆固醇(更易/ L)
4.53
±
1.42
-0.0466
19
低密度lipoprotein-C(更易/ L)
2.45
±
0.96
-0.0252
20.
高密度lipoprotein-C(更易/ L)
0.97
±
0.55
0.0866
21
糖化血红蛋白(%)
5.82
±
1.03
0.2151
22
血清白蛋白(g / L)
34.31
±
6.61
-0.1308
23
25-OH维生素D3 (ng / mL)
7.86
±
4.55
0.3850
24
iPTH (pg / mL)
274.50
±
306.31
-0.0225
25
GNRI
96.06
±
12.76
-0.0078
26
FGF-23 (pg / mL)
32.21
±
53.02
-0.0966
27
克罗索(ng / mL)
2.38
±
2.33
0.0443
28
白细胞介素- 6 (pg / mL)
25.37
±
53.69
0.2634
29日
Fetuin-A (pg / mL)
3.0320
e
+
05年
±
2.0606
e
+
05年
-0.0234
∗
表示,每个特性与血管钙化程度使用皮尔逊相关系数(
r
)。
在数据收集过程中,我们59患者分为风险水平。我们大约7风险根据两种分类方法进行分类。一些相邻的水平将被分成一个类别。分类结果如表所示
2 。在第一个分类方案(CS1),水平{0 1 2},{3、4、5、6}水平分为类1和2,分别。此外,水平{0,1},{2,3},{4、5、6}是分为类1、2和3 (CS2),分别。
表2
病人的信息风险分类方案。
风险水平
的患者数量
CS1
CS2
0
10
水平0,1,2类1(42个样本)
0和1是1级水平(25样品)
1
15
2
17
级别2和3类2(23样本)
3
6
水平3、4、5、6类2(17个样品)
4
6
水平4、5和6是3班(11样品)
5
4
6
1
CS:分类方案。
2.2。方法
2.2.1。腹主动脉钙化
所有的病人需要进行外侧腰椎x光检查的1周内血液生化检查评估腹主动脉钙化的相应水平1 - 4 (
7 ]。根据钙化斑块的长度的前部和后部墙壁腹主动脉,分数的0到3:没有钙化是0分,钙化范围< 1/3动脉壁长度是1,钙化范围1/3-2/3动脉壁长度是2,钙化范围> 2/3动脉壁的长度是3,和总分数是0到24之间。两个放射科医生分别得分和平均。老年营养风险指数的计算(GNRI) [
19 可以估计
(1)
GNRI
=
14.89
×
血清
白蛋白
+
41.7
+
实际
身体
重量
理想的
身体
重量
。
血清水平的完整FGF23,可溶性克罗索,Fetuin-A,白细胞介素- 6收到通过two-site酶联免疫分析(从Elabscience生物试剂,武汉,中国)。
2.2.2。模糊支持向量机
支持向量机是一种有效的基于统计的机器学习方法学习,考虑经验风险和添加一个正则化项来减少结构风险。这是一个稀疏和健壮的分类器
20. ]。支持向量机也可以通过内核执行非线性分类方法,这是一个常见的内核的学习方法。在许多实际的分类任务,不同类别的样本数量往往是不同的。在不平衡数据集下,SVM模型会产生很大的偏差。为了避免上面的情况,林和王提出了模糊支持向量机(FSVM) [
21 ]。不同于支持向量机,FSVM使用成员值来描述训练样本的重量。一般来说,离群样本的会员价值较低,该算法很容易削弱贡献在训练过程中决策超平面。
FSVM的训练样本可以被定义为
x
我
,
y
我
,
年代
我
,
我
=
1
,
2
,
⋯
,
N
,在那里
N
训练样本的数量,
x
我
∈
R
d
×
1
,
y
我
和
年代
我
∈
0
,
1
特征向量,标签,和成员样本的价值吗
我
,分别。模型的特征向量维数
d
。FSVM的目标优化函数
(2)
最小值
1
2
w
2
+
C
∑
我
=
1
N
年代
我
ξ
我
,
年代
。
t
。
y
我
w
T
ϕ
x
我
+
b
≥
1
−
ξ
我
,
ξ
我
≥
0
,
我
=
1
,
2
,
⋯
,
N
,
在哪里
C
表示正则化参数,
ξ
我
的误差
x
我
。构建一个健壮的模型,不同的训练样本应该给予不同的正则化参数。
年代
我
ξ
我
误差测量,由会员加权值。离群值(噪音)较低体重;相反,重要的采样点会有更高的重量。在一个不平衡的数据集,数据的类型与大量的样本往往含有更多的离群值。为了减少偏差,FSVM可以减少它的影响。方程(
2 )也可以重写的拉格朗日对偶问题:
(3)
马克斯
∑
我
=
1
N
α
我
−
1
2
∑
我
=
1
N
∑
j
=
1
N
α
我
α
j
·
y
我
y
j
·
K
x
我
,
x
j
,
年代
。
t
。
0
≤
α
我
≤
年代
我
C
,
∑
我
=
1
N
α
我
y
我
=
0
,
我
=
1
,
2
,
⋯
,
N
,
在哪里
α
我
拉格朗日乘数系数样本吗
x
我
。
K
x
我
,
x
j
的值是样品吗
我
和
j
在内核中矩阵。和内核矩阵可以计算了径向基函数(RBF):
(4)
K
x
我
,
x
j
=
经验值
−
γ
x
我
−
x
j
2
,
我
,
j
=
1
,
2
,
⋯
,
N
,
在哪里
γ
是一个高斯核带宽。
最后决定的功能分类
(5)
f
x
=
标志
∑
我
=
1
N
y
我
α
我
·
K
x
,
x
我
+
b
。
基本的支持向量机只能执行二进制分类任务。在这项工作中,我们使用one-against-one策略来实现多个分类。
2.2.3。Self-Representation-Based隶属函数
在这项工作中,我们提出一个方法基于重建误差构造隶属函数。这种方法可以测量总体数据结构之间的一致性和一个数据点。重建误差的偏差度可以量化噪声样本,这有助于提高模型的鲁棒性。
让
X
=
x
1
,
x
2
,
⋯
,
x
N
∈
R
d
×
N
,发作函数定义如下:
(6)
X
=
X
Z
+
E
,
在哪里
Z
=
z
1
,
z
2
,
⋯
,
z
N
∈
R
N
×
N
和
E
∈
R
d
×
N
系数和误差矩阵。
z
我
新样本的代表吗
我
其他的训练样本。可以优化配方的自己
(7)
最小值
J
Z
=
X
Z
−
X
F
2
+
λ
T
r
Z
l
Z
T
,
在哪里
T
r
Z
l
Z
T
是光滑的拉普拉斯算子的正则项系数
Z
:
(8)
T
r
Z
l
Z
T
=
1
2
∑
我
=
1
N
∑
我
=
1
N
W
我
j
z
我
−
z
j
2
2
,
在哪里
W
是样本之间的相似性矩阵。它也可以被内核矩阵。
l
=
D
−
1
/
2
Δ
D
−
1
/
2
是一个规范化的拉普拉斯算子矩阵和
Δ
=
D
−
W
。的
D
我
我
=
∑
j
=
1
N
W
我
j
是一个对角矩阵的元素
D
∈
R
N
×
N
。在这工作,
λ
表示系数的拉普拉斯算子的正则项,设置为0.01。设置
∂
J
Z
/
∂
Z
=
0
方程解(
7 )可以获得如下:
(9)
∂
J
Z
∂
Z
=
0
,
2
X
T
X
Z
−
X
+
2
λ
Z
l
=
0
,
X
T
X
Z
+
λ
Z
l
=
X
T
X
,
在哪里
X
T
X
Z
+
λ
Z
l
=
X
T
X
是一个西尔维斯特方程。对于每个训练样本,重建误差
x
我
可以计算为
(10)
r
我
=
X
z
我
−
x
我
2
2
。
映射的值重建误差
0
∼
1
。我们定义以下公式:
(11)
年代
我
=
1
−
r
我
−
r
最小值
r
马克斯
−
r
最小值
,
在哪里
r
最小值
和
r
马克斯
分别是最小和最大的重建误差。我们的方法是在算法的过程
1 。
<大胆>算法1:< /大胆> FSVM-SR的算法。
需要 :训练集
x
我
,
y
我
,
我
=
1
,
2
,
⋯
,
N
;
X
=
x
1
,
x
2
,
⋯
,
x
N
,测试集
x
t
e
=
x
j
t
e
,
j
=
1
,
2
,
⋯
,
米
的参数
C 和
λ
;高斯内核的带宽
γ
。
确保 :的预测价值
y
j
t
e
,
j
=
1
,
2
,
⋯
,
米
。
1。计算训练内核(
K
X
,
X
),测试内核矩阵(
K
x
t
e
,
X
)和拉普拉斯算子的矩阵
l
由方程(
4 ),
l
=
D
−
1
/
2
Δ
D
−
1
/
2
;
2。估计的self-representing系数矩阵
Z
=
z
1
,
z
2
,
⋯
,
z
N
∈
R
N
×
N
由方程(
9 );
3所示。计算重建误差
r
我
,
我
=
1
,
2
,
⋯
,
N
每个训练样本通过
r
我
=
X
z
我
−
x
我
2
2
;
4所示。获得最后的成员每个训练样本的价值
年代
我
=
1
−
r
我
−
r
最小值
/
r
马克斯
−
r
最小值
;
5。火车FSVM-SR(获得
α
我
,
我
=
1
,
2
,
⋯
,
N
通过解决Eq。) (
3 );
6。预测
y
j
t
e
,
j
=
1
,
2
,
⋯
,
米
支持向量机的决策函数:
f
x
=
标志
∑
我
=
1
N
y
我
α
我
·
K
x
,
x
我
+
b
。
3所示。结果
3.1。评估测量。
在我们的研究中,精度(ACC)是用来评估我们的预测模型的预测性能。此外,10倍crossvalidation方法(
22 - - - - - -
25 )是用于这项工作。ACC的计算方法如下:
(12)
整个
ACC
=
∑
我
=
1
c
TP
我
米
×
One hundred.
%
,
ACC
我
=
TP
我
米
我
×
One hundred.
%
,
米
=
∑
我
=
1
c
米
我
,
在哪里
TP
我
是真阳性数(TP)子类
我
。
c
类的数量。
米
和
米
我
表示整个测试子类样本和测试样本的数量。
ACC
我
是子类的准确性
我
。
4所示。选择最优的参数
为了获得最佳的预测性能,我们使用网格搜索方法获得最优参数
C
和
γ
。的搜索范围是25 到210 (
C
),从2-10年 到25 (
γ
),2的步骤1 。数据
1 。和
2 显示平均ACC与不同
C
和
γ
(在CS1和CS2),分别。
图1
平均ACC与不同
C
和
γ
(在CS1)。
图2
平均ACC与不同
C
和
γ
(CS2)。
如数据所示,模型达到83.05%和64.40%的ACC,当最优参数
C
=
27
,
γ
=
2
−
6
和
C
=
210年
,
γ
=
2
−
6
,分别。
4.1。相比其他分类器
进一步评估模型的性能,我们介绍了其他类似的机器学习模型
26 ,
27 ),包括逻辑回归,反向传播(BP)神经网络、径向基函数(RBF)神经网络,Takagi-Sugeno-Kang模糊系统(TSK-FS) [
28 - - - - - -
30. ),和标准支持向量机。2类(下表
3 )、逻辑回归、BP网络、RBF网络,和TSK-FS实现ACC的71.18%,66.10%,77.96%,和76.27%,分别。支持向量机的整个ACC(79.66%)和FSVM-SR(83.05%)比其他模型。特别是,FSVM-SR获得最好的预测精度。在子类1和2,FSVM-SR也达到最佳的准确性为95.23%和52.94%,分别。从结果可以看出,对于小样本学习,支持向量机有更多的优点比神经网络模型。模糊模型,FSVM比TSK-FS更好的性能在这个数据集。FSVM-SR可以有效地抑制噪声样本对模型的影响。接受者操作特性曲线(ROC)不同的模型图所示
3 。它也可以发现,我们的方法获得最高的曲线下面积(AUC)值为0.7955。
表3
比较现有的模型通过10倍crossvalidation(2类)。
模型
整个ACC (%)
ACC1 (%)
ACC2 (%)
逻辑回归
71.18
±
15.14
83.33
±
19.01
41.17
±
33.75
BP神经网络
66.10
±
13.70
73.80
±
26.78
47.05
±
43.78
RBF神经网络
77.96
±
8.67
88.09
±
15.47
52.94
±
36.89
TSK-FS
76.27
±
15.31
85.71
±
15.42
52.94
±
43.78
支持向量机
79.66
±
10.40
90.47
±
14.15
52.94
±
36.89
FSVM-SR(方法)
83.05
±
9.71
95.23
±
10.54
52.94
±
36.89
ACC1 :1级的准确性;ACC2 :二班的准确性。
图3
下不同模型的中华民国(CS2)。
在CS3 FSVM-SR也与这些预测比较,比较的结果列在表中
4 。SVM和FSVM-SR达到最佳整体ACC的64.40%。在子类1中,ACC RBF神经网络和支持向量机的72.00%(最好)。FSVM-SR TSK-FS获得65.21%,FSVM-SR子类2中较小的标准差(30.88%)。此外,支持向量机和FSVM-SR子类3中有更好的性能(54.54%)。可以看出FSVM-SR也在CS3更加稳定和有效。
表4
比较现有的模型通过10倍crossvalidation(3类)。
模型
整个ACC (%)
ACC1 (%)
ACC2 (%)
ACC3 (%)
逻辑回归
57.62
±
15.25
64.00
±
32.20
60.86
±
32.58
36.36
±
48.30
BP神经网络
55.93
±
19.62
60.00
±
32.44
60.86
±
28.60
36.36
±
47.43
RBF神经网络
59.32
±
21.99
72.00
±
29.61
60.86
±
41.91
27.27
±
48.30
TSK-FS
62.71
±
24.21
68.00
±
28.81
65.21
±
39.13
45.45
±
49.72
支持向量机
64.40
±
17.39
72.00
±
21.94
60.86
±
32.44
54.54
±
49.72
FSVM-SR(方法)
64.40
±
17.39
68.00
±
24.85
65.21
±
30.88
54.54
±
49.72
ACC1 :1级的准确性;ACC2 :二班的准确性;ACC3 :3班的准确性。
两个示例
t
以及被用来评估平均的意义差异ACC CS1和CS2的价值,分别。在我们的工作中,显著性水平为0.05。FSVM-SR通过10倍与其他模型相比crossvalidation(20倍)。统计学意义的结果如表所示
5 。在CS1 FSVM-SR之间的差异和其他模型都是重要的(
P
值< 0.05)。的最大价值是0.0064(支持向量机)和最小值是3.4341
e
-11 (BP神经网络)。除了支持向量机(
P
值0.1965),与其他模型的差异在CS2非常重要。从结果可以看出,该方法(FSVM-SR)优于大多数方法在两个病人的风险分类方案。
表5
分析不同方法的统计学意义通过10倍crossvalidation(20倍)。
模型
CS1 (
P
值)
CS2 (
P
值)
逻辑回归
8.4386
e
−
10
1.1262
e
−
05年
BP神经网络
3.4341
e
−
11
6.9318
e
−
07年
RBF神经网络
7.9770
e
−
06
0.0013
TSK-FS
3.3813
e
−
08年
0.0024
支持向量机
0.0064
0.1965
5。讨论
ESRD患者的心血管疾病死亡的主要原因。研究已经证实,腹主动脉钙化的发生(ESRD患者)是极其重要的心血管死亡(
31日 ]。近年来,非传统风险因素的影响,如FGF23,克罗索异常,microinflammatory状态,和营养不良在血管钙化吸引了学者们的关注。
作为蛋白磷酸监管中扮演着重要角色,FGF23参与控制磷的新陈代谢,甲状旁腺激素,和25磷酸二羟基维生素d。FGF23不仅可以调节体内平衡也进一步促进疾病进展、左心室肥大,增加心血管疾病的发生和死亡(
1 ]。克罗索,作为一个抗衰老的基因,已经被许多研究证实,它参与心血管保护ESRD患者通过抑制phosphate-driven血管钙化(
32 ]。我们中心的先前的研究结果表明,血清FGF23水平增加,和可溶性克罗索水平下降。此外,结合腹部主动脉硬化后,异常血清FGF23和克罗索更明显
8 ]。本研究与之前的研究结果是一致的。FGF23的水平和克罗索ESRD患者的异常。他们是血管钙化的危险因素。和不同的风险预测模型的分析结果都支持这个结论。
Fetuin-A血管钙化的保护性因素,可以抑制血管钙化的过程(
33 ]。这项研究的结果表明,ESRD患者的血清fetuin-A明显减少了。此外,血清fetuin-A减少腹主动脉钙化患者更重要。水平的降低有一定的预警作用血管钙化。FSVM和传统预测模型表明fetuin-A腹主动脉钙化是一个独立的危险因素。因此,临床医生应该密切关注血清fetuin-A水平CKD的过程。一旦发生异常,他们应该尽快介入。
研究表明,营养不良密切相关血管钙化,在ESRD患者心血管死亡,和全因死亡(
4 ]。在这部作品中,不同的风险预测模型的结果支持,营养不良是腹主动脉钙化的一个独立危险因素。现有研究表明,营养不良和microinflammatory状态,胰岛素抵抗,FGF23 /克罗索轴异常,和其他因素之间的相互联系,最终共同促进血管钙化的发生(
19 ]。因此,许多风险因素血管钙化常常混合,和临床医生很难准确地确定和提供精确的治疗干预的主要风险因素。通过比较不同预测模型的准确性预测腹主动脉钙化的风险,这是发现FSVM和SVM模型更准确的识别主要风险因素比传统的逻辑回归模型。在CS2, FSVM-SR达到最佳精度分别为95.23%和52.94%。我们的方法(FSVM-SR)明显优于其他方法(
P
价值、逻辑回归:
8.4386
e
−
10
BP网络:
3.4341
e
−
11
RBF网络:
7.9770
e
−
06
TSK-FS:
3.3813
e
−
08年
和支持向量机:0.0064)。更重要的是,FSVM-SR和支持向量机实现最好的在CS3 ACC的64.40%。Self-representation-based隶属函数可以为训练样本估计的重量。异常值的重建误差相对较大,相应的会员价值很低。当构造分类超平面,FSVM避免一些轻量级的样品(异常值)来缓解不平衡数据集的影响。模糊方法(
34 提高模型的解释能力和鲁棒性。有相关的应用在医学领域(
35 ,
36 ]。
6。结论
在这项工作中,我们提出一个FSVM基于自我表征方法来过滤噪声样本,提高模型的泛化能力,获得良好的效果。虽然我们的方法取得更好的精度,它仍然有以下缺点:(1)需要进一步增加样本容量最小化预测偏差。(2)没有详细分析病人的各种因素(
37 ,
38 ]。(3)模型的可解释性不如线性模型。在此基础上,我们将提出一个稀疏线性模型在未来努力解决贫穷问题的可解释性和因子分析。
数据可用性
用来支持研究的数据可以获得相应的作者根据机构的要求。
伦理批准
这项研究已经被医院的伦理委员会批准(伦理审批。KS2019041)。实验协议成立,根据赫尔辛基宣言的伦理准则,并通过人类的伦理委员会(无锡人民医院伦理委员会)。
同意
书面知情同意出版了从所有参与者。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
郭Xiaobin刘、张Xiran和孝义是共同第一作者。
确认
我们感谢美国肾脏学无锡人民医院在本研究收集数据。这项工作是由顶尖人才支持计划的资助年轻人和中年人的无锡健康委员会(HB2020008),无锡的科研项目健康委员会(MS201927),无锡的科研项目健康委员会(Z201914),江苏省卫生委员会的科学研究项目(LGY201801),江苏省“333”项目(BRA2020142),中国国家自然科学基金(国家自然科学基金委61902271),江苏的自然科学研究中国高等教育机构(19 kjb520014)。
[
]1
摩尔多瓦
D。
摩尔多瓦
我。
Rusu
C。
Kacso
我。
Patiu
i M。
Gherman-Caprioara
M。
FGF-23、血管钙化和慢性血液透析患者的心血管疾病
国际泌尿外科和肾脏学
2014年
46
121年
128年
10.1007 / s11255 - 013 - 0422 - 2
2 - s2.0 - 84893856737
23549862
[
]2
Muzasti
r。
Loesnihari
R。
高fetuin-A水平作为保护因素腹主动脉钙化在印尼常规血液透析病人
开放获取马其顿医学科学杂志》上
2019年
7
721年
725年
10.3889 / oamjms.2019.167
2 - s2.0 - 85064105468
[
]3
石井
H。
高桥
H。
伊藤
Y。
青山
T。
Kamoi
D。
神
T。
Umemoto
N。
Kumada
Y。
铃木
年代。
Murohara
T。
踝肱指数协会、蛋白热能浪费、和炎症状态与心血管死亡率在慢性血液透析患者
营养物质
2017年
9
416年
10.3390 / nu9040416
2 - s2.0 - 85018286437
28430145
[
]4
冈本
T。
畠山直哉
年代。
小玉
H。
Horiguchi
H。
日本久保田公司
Y。
城
K。
Momota
M。
Hosogoe
年代。
田中
Y。
高岛
T。
Saitoh
F。
铃木
T。
高手
C。
可怜的营养状况之间的关系和发展的主动脉钙化在维护血液透析病人
BMC肾脏学
2018年
19
71年
10.1186 / s12882 - 018 - 0872 - y
2 - s2.0 - 85044206600
29558928
[
]5
原田
K。
铃木
年代。
石井
H。
Hirayama
K。
青木
T。
柴田
Y。
根岸英一
Y。
烟灰墨
T。
川岛
K。
国村广城
一个。
榻榻米
Y。
Kawamiya
T。
山本
D。
森本晃司
R。
Yasuda
Y。
Murohara
T。
营养状态预测的严重血管钙化non-dialyzed慢性肾脏疾病
循环杂志
2017年
81年
316年
321年
10.1253 / circj.cj - 16 - 0911
2 - s2.0 - 85013968355
28077811
[
]6
不结盟运动
h·S。
李
s M。
宋
e . G。
李
d . Y。
儿子
y K。
金
s E。
钟
s . H。
赵
y R。
公园
j·S。
李
s W。
能剧
m . H。
一个
w·S。
在胸部平片上血管钙化与病变的严重程度相关的检测到透析患者的冠状动脉造影
东北实验医学杂志》上
2015年
235年
135年
144年
10.1620 / tjem.235.135
2 - s2.0 - 84925424261
25746157
[
]7
de Bie
m·K。
Buiten
m . S。
罗特曼
j . I。
Hogenbirk
M。
Schalij
m·J。
Rabelink
t·J。
Jukema
j·W。
腹主动脉钙化在普通x射线和关系重要的无症状慢性透析患者的冠状动脉疾病
BMC肾脏学
2017年
18
82年
10.1186 / s12882 - 017 - 0480 - 2
2 - s2.0 - 85014314736
28253835
[
]8
张
X。
刘
X。
王
l
吴
M。
山
W。
刘
B。
腹主动脉钙化和胰岛素抵抗之间的关系,micro-inflammatory状态和FGF23 /克罗索轴在终末期肾功能衰竭患者接受透析
山东医学
2020年
60
54
57
[
]9
郭
x Y。
周
W。
史
B。
王
x H。
杜
一个。
丁
y . J。
唐
J。
郭
F。
一个高效的多个内核支持向量回归模型来评估血液透析患者的干重
目前的生物信息学
2021年
16
284年
293年
10.2174 / 1574893615999200614172536
[
]10
姆尼尔
一个。
马利克
我美国。
马利克
k。
蛋白质组开采公认的药物靶点的识别人类病原体梭菌有毒物质造成
目前的生物信息学
2019年
14
532年
540年
10.2174 / 1574893613666181114095736
2 - s2.0 - 85070571937
[
]11
丁
Y。
唐
J。
郭
F。
识别药物相互作用通过双重拉普拉斯算子的正则化最小二乘与多个内核融合
以知识为基础的系统
2020年
204年
10.1016 / j.knosys.2020.106254
[
]12
壮族
J。
戴
年代。
张
l
高
P。
汉
Y。
田
G。
杨ydF4y2Ba
N。
唐
M。
亏
l
识别癌症乳腺癌基因扰动及其应用在指导药物再利用
目前的生物信息学
2021年
15
1075年
1089年
10.2174 / 1574893615666200203104214
[
]13
丁
Y。
唐
J。
郭
F。
蛋白质结晶通过模糊识别模型线性表示
IEEE / ACM事务计算生物学和生物信息学
2019年
1
1
10.1109 / tcbb.2019.2954826
[
]14
丁
Y。
唐
J。
郭
F。
人类蛋白质亚细胞定位Kernelized社区通过模糊识别模型表示
应用软计算
2020年
96年
10.1016 / j.asoc.2020.106596
[
]15
伊克
N。
Qadir
m·A。
阿夫扎尔
m . T。
SimExact——一种有效的方法来计算函数使用基因本体相似的蛋白质
目前的生物信息学
2020年
15
318年
327年
10.2174 / 1574893614666191017092842
[
]16
Naveed
M。
Mehboob
m Z。
侯赛因
一个。
伊克
K。
达拉
一个。
Zeeshan
N。
守恒的致命的假想的蛋白质的结构和功能注释沙眼衣原体:一个in-silico方法
目前的生物信息学
2019年
14
344年
352年
10.2174 / 1574893613666181107111259
2 - s2.0 - 85067954745
[
]17
王
H。
唐
J。
丁
Y。
郭
F。
探索非编码rna在人类疾病协会通过与hypergraph-regular条款3的矩阵分解中心内核对齐
简报的生物信息学
2021年
10.1093 /龙头/ bbaa409
[
]18
汗
一个。
Zahra
一个。
泰姬
年代。
Fatmi
m Q。
汗
m·J。
集成in-silico分析研究小分子核糖核酸的作用在慢性肾脏疾病的检测
目前的生物信息学
2020年
15
144年
154年
10.2174 / 1574893614666190923115032
[
]19
山田
年代。
山本
年代。
Fukuma
年代。
Nakano
T。
Tsuruya
K。
稻叶型
M。
老年营养风险指数(GNRI)和肌酸酐指数同样预测血液透析患者的死亡率的风险:J-DOPPS
科学报告
2020年
10
10.1038 / s41598 - 020 - 62720 - 6
32238848
[
]20.
议会
C。
Vapnik
V。
支持向量网络
机器学习
1995年
20.
273年
297年
10.1007 / BF00994018
[
]21
Chun-Fu林
Sheng-de王
模糊支持向量机
IEEE神经网络
2002年
13
464年
471年
10.1109/72.991432
2 - s2.0 - 0036505650
[
]22
朱
H。
杜
X。
姚
Y。
ConvsPPIS:识别蛋白质交互网站的合奏卷积神经网络与功能图
目前的生物信息学
2020年
15
368年
378年
10.2174 / 1574893614666191105155713
[
]23
高
J。
张
l
余
G。
曲
G。
李
Y。
杨
X。
结直肠腺瘤风险的模型与GBDT诊断
目前的生物信息学
2021年
15
971年
979年
10.2174 / 1574893614666191120142005
[
]24
Tahir
M。
Sardaraz
M。
Mehmood
Z。
汗
m . S。
ESREEM:高效短读为新一代基因组测序误差估计的计算模型
目前的生物信息学
2021年
16
2
339年
349年
10.2174 / 1574893615999200614171832
[
]25
刘
W。
哈兰
j . P。
灰
答:S。
埃里森
J·J。
叶
年代。
Tjia
J。
Bucci
V。
张
B。
高维因果中介分析与大量的介质聚集在0到评估的贡献微生物细菌病原体的风险在老年人殖民
目前的生物信息学
2020年
15
7
671年
696年
10.2174 / 1574893614666191115123219
[
]26
陈
l
李
J。
常
M。
癌症诊断和疾病基因通过统计机器学习识别
目前的生物信息学
2021年
15
956年
962年
10.2174 / 1574893615666200207094947
[
]27
黄
k . k . L。
优化设计中自然结构、生物材料、生物信息学和生物识别技术为解决生理需求和最终bio-devices的性能
目前的生物信息学
2019年
14
5
374年
375年
10.2174 / 157489361405190628122355
2 - s2.0 - 85073269471
[
]28
邓
Z。
江
Y。
崔
K.-S。
钟
F.-L。
王
年代。
Knowledge-leverage-based TSK模糊系统建模
IEEE神经网络和学习系统
2013年
24
1200年
1212年
10.1109 / TNNLS.2013.2253617
2 - s2.0 - 84880920607
[
]29日
Rezaee
B。
Zarandi
m·h·F。
数据驱动Takagi-Sugeno-Kang模糊系统的模糊建模
信息科学
2010年
180年
2
241年
255年
10.1016 / j.ins.2009.08.021
2 - s2.0 - 70350605478
[
]30.
江
Y。
钟
f . L。
Ishibuchi
H。
邓
Z。
王
年代。
多任务TSK模糊系统建模通过挖掘任务间常见的隐藏的结构
IEEE控制论
2015年
45
548年
561年
10.1109 / TCYB.2014.2330844
2 - s2.0 - 84923342673
24988602
[
]31日
Honkanen
E。
Kauppila
l
Wikstrom
B。
Rensma
p . L。
Krzesinski
人类。
Aasarod
K。
韦贝克
F。
詹森
p . B。
Mattelaer
P。
矿
B。
代表线学习小组
在透析病人腹主动脉钙化:线研究的结果
肾脏透析移植
2008年
23
12
4009年
4015年
10.1093 /无损检测/ gfn403
2 - s2.0 - 56749103026
18676346
[
]32
陆
X。
胡
m . C。
克罗索/ FGF23轴在慢性肾脏疾病和心血管疾病
肾脏疾病
2017年
3
15
23
10.1159 / 000452880
28785560
[
]33
陈
h . Y。
赵
y L。
许
s P。
拜
m F。
杨
j . Y。
彭
y S。
关系胎球蛋白A,血管钙化和透析患者的骨折风险
《公共科学图书馆•综合》
2016年
11条e0158789
10.1371 / journal.pone.0158789
2 - s2.0 - 84978705924
[
]34
江
Y。
吴
D。
邓
Z。
钱
P。
王
J。
王
G。
钟
f . L。
崔
k . S。
王
年代。
癫痫发作分类使用转移学习,从脑电图信号semi-supervised学习和TSK模糊系统
IEEE神经系统和康复工程
2017年
25
2270年
2284年
10.1109 / TNSRE.2017.2748388
2 - s2.0 - 85029183315
28880184
[
]35
江
Y。
张
Y。
林
C。
吴
D。
林
c . T。
EEG-based司机困倦估计使用在线多视点和转移TSK模糊系统
IEEE智能交通系统
2021年
22
10.1109 / tits.2020.2973673
[
]36
江
Y。
朱
J。
顾
X。
雪
J。
赵
K。
倪
T。
钱
P。
承认大规模使用一种新颖的多任务ncRNA数据cross-learning 0-order TSK模糊分类器
医学成像和卫生信息学杂志》上
2020年
10
2
502年
507年
10.1166 / jmihi.2020.2695
[
]37
张
G。
余
P。
王
J。
杨ydF4y2Ba
C。
使用信息增益特征选择算法对高维生物医学数据,提高化学反应的优化
目前的生物信息学
2021年
15
8
912年
926年
10.2174 / 1574893615666200204154358
[
]38
Berrhail
F。
Belhadef
H。
遗传算法的特征选择方法提高相似性搜索在ligand-based虚拟筛选的有效性
目前的生物信息学
2020年
15
5
431年
444年
10.2174 / 1574893614666191119123935