文摘

与认知的流行疾病,健康产业正面临着新挑战以来逐渐认知健康恶化随着时间的推移,和明确的体征和症状出现时已经太迟了。智能家居物联网(物联网)给希望监视和管理老年人的健康产业和less-abled舒适的家园。智能家居已经在检测和最有影响力的管理认知痴呆等疾病。他们能给的全面视图痴呆患者的ADL(日常生活活动)。ADLs分为日常生活的活动和复杂的交织在一起的活动。首先认知衰退的迹象出现当一个智障个人试图执行复杂的活动,涉及规划、分析、计算和决策。因此,我们分析个人的性能在执行复杂的活动而不是简单的ADL。人工智能已经医疗的一个最有前途的预测和诊断的技术。当应用于诽谤联盟数据,机器学习和深入学习算法可以方便地和准确地分析活动模式和预测认知衰退的最初迹象。我们建议使用机器和工作深度学习分类器分类痴呆和健康个体通过分析复杂的交织活动数据。 We use the subset of the CASAS (Centre of Advanced Studies in Adaptive Systems) dataset for eight complex activities performed by 179 individuals in a smart home setting. decision tree, Naive Bayes, support vector, multilayer perceptron classifiers, and deep neural networks have been used for classification. Their results and performances are compared to determine the best classifier. It is observed that deep neural networks and multilayer perceptron show the best results for classifying dementia vs. healthy individuals when evaluating their complex interwoven activities.

1。介绍

有精神疾病的迅速增长以及人民遭受他们在过去的几年里。超过10亿人患有精神疾病,上瘾,痴呆,或精神分裂症1][2]。(世界卫生组织)得出结论认为,在心理健康方面的投资规模不匹配的意识的精神健康问题。2010年降低生产力和健康状况不佳由于贫困全球心理健康导致2.5万亿美元的损失。预计这个数字到6万亿年将升至2030美元以现在的速度(2,3]。早期干预可以减少全球医疗保健系统的负担,最终减少相关的死亡率(4,5]。分析了目前认知健康诊所使用认知功能测试MMSE细微精神状态检查()和美国华人博物馆(蒙特利尔认知评估)和其他神经系统考试像CDR(临床痴呆评定)和ADL的评估。收集信息关于病人的ADLs通过问卷由患者本人或他/她的监护人,因此使整个评估过程主观(6,7]。这可能会导致一个不准确的评估。已经观察到非常微妙的迹象和症状首先出现在日常活动的个体认知能力下降,临床医生可以很容易错过在物理考试。说的道理,哈尔(人类活动识别)正成为一种有效的方法来监控个人的运动和活动,获得了特别关注改善医疗系统领域的研究。(8,9]。智能家居与多个传感器是一种很有前途的HAR有关诽谤联盟收集数据的工具。智能家居有多个网络的传感器,可以收集的概述居民的活动模式的健康、安全、安全、独立活动,和他们的社会生活10,11我们可以看到在图1

ADLs聚集通过传感器在智能家居分为简单和复杂的活动。简单的活动执行的活动来管理个人的基本需要,喜欢打扮,穿衣,个人卫生,和吃东西。复杂的活动包括活动使一个人独立生活的社区。这将是规划公交路线,药物管理,财务等等复杂的活动都是相互关联的活动,需要一定程度的决策和计算。虽然简单的活动是基于单一传感器事件记录,记录复杂的活动并不是那么容易,需要来自多个传感器的输入(10,12]。

ML(机器学习)和DL(深度学习)工具通常用于执行所有活动的深入分析(13]。结果相比,一些研究人员分析了ADLs和识别模式来区分从健康个体认知能力受损。拟议的工作旨在比较和对比不同的功效ML和DL算法来分析复杂的活动的公开数据集卡萨斯得到不同的传感器读数在智能家居环境中。数据集包括简单和复杂的活动。

遇到的最大挑战病人患有认知障碍主要是一个独立的生活方式。一个独立的生活不仅需要执行日常生活功能活动的能力也是个人执行一些复杂的日常活动,依赖于其他活动但需要一定程度的计算和决策(14]。复杂的活动,也被称为IADL(工具性日常生活活动),是一个认知诊断疾病的决定因素。目前,黄金标准评估考试是在诊所可以主观的。我们的主要动机是分析复杂的活动在个人日常生活中发现最早的认知能力下降的迹象。因此我们的目标是准确和及时的预测存在认知障碍或痴呆在日常生活中通过分析完成复杂的活动。我们使用不同的ML和DL技术来找到最准确的预测模型,然后比较和对比每个模型的结果来确定有效性和确定哪些模型最适合分类。本文旨在为研究在以下方面:(我)提出了一种分类方法痴呆人通过分析复杂的活动表现在智能家居环境中探测到的最早迹象痴呆使用机器学习和深入学习(2)目前机器学习和深度学习算法之间的比较来评估的最佳模式,并提供一个基线研究(3)深入学习算法提高痴呆个人的检出率与机器学习算法和超乐谱演奏基线纸检出率

剩下的论文结构如下:部分2是一个文献回顾之前的工作通过检查ADL痴呆的早期检测数据。部分3给出了该方法的详细概述。实验分析和研究的结果发表在部分4,所有不同的技术用于分类进行了讨论。部分5提供了讨论实验分析。所有分类器的结果进行比较和对比。最后,部分5总结了通过分享最好的模型和性能。

2。文献综述

智能家居的方案选择老年人和残疾人。研究人员聚集分布分析、诊断和预测认知的健康问题。

在这样一个研究[4),作者使用了DL技术检测MCI的早期症状(轻度认知障碍)。利用时间序列预测技术,他进一步处理的问题缺少传感器信号,通常出现在实时数据采集由于传感器故障。此外,作者提出了一种autoencoder-based技术来降低数据的维数,偏差在人类行为中可以使用一个RNN-based检测方法。持续异常行为指出一个问题和MCI的警报。在[15),robot-enabled活动支持系统提出了智能家居的实验和评估。机器人是有用的监测居民的活动,需要的话,可以协助日常活动。

检测心理变化的可能性,认知和行为症状的老年痴呆症利用悄悄地收集智能家居行为数据和机器学习技术评估(16]。作者分析了公开数据集卡萨斯,试图处理不平衡数据使用Weka工具。四个模型,支持向量回归、线性回归与径向基函数内核,支持向量回归和再邻居算法,用来预测流动,认知,情绪症状从家庭聚集行为数据。

在另一个研究报告(17),作者用悄悄地收集智能家居行为数据诊断功能性健康下降。活动数据从数据集卡萨斯获得了38智能家居,和功能性健康评估的参与者使用IADL-C进行问卷调查。这个数据是使用不同的ML算法分析。(8)使用多传感器方法识别复杂的活动使用CNN(卷积神经网络)和一个LSTM(长短期记忆)模型,并比较两种模型的性能。在[18),作者使用机器学习模型来评估活动在智能家居和分类的质量活动,简单和复杂而一个神经学家的评估。作者还使用机器学习的方法来评估预测的准确性的认知健康状况如痴呆、MCI、阿尔茨海默氏症。

3所示。建议的方法

拟议的工作旨在预测健康与痴呆病人基于ADL的分析数据复杂的活动,如图2。个人的反应对复杂的活动将帮助分类个人和痴呆发病的早期检测。拟议的方法分为五个步骤:数据选择、预处理、特征提取和毫升和DL分类器分类健康个体和痴呆。

3.1。数据选择

选择最合适的数据集和确定合适的仪器数据采集实验装置是至关重要的。因此,仔细选择过程后,我们选择了卡萨斯数据集的子集。数据集已经公开的“自适应系统的先进的研究中心,“一个部门在华盛顿州立大学电子工程与计算机科学学院。它的目标是研究智能家居技术的使用来测试真实数据。数据集包括简单和复杂的活动被用来执行我们的分析。

我们的数据集包含了179人,其中145是健康的,32 MCI,和两个被诊断出患有老年痴呆症。数据集包含24个日常生活活动,前八活动简单的任务,最后八个活动是复杂的任务。任务从9到16没有标记,而不是划分为简单或复杂因此他们被排除在我们当前的研究。每个参与者在八个评估复杂的活动,是日常生活的一部分活动,比如从咖啡桌上选择一本杂志阅读它在总线上的通勤,使用微波加热加热垫3分钟带,离开公共汽车之前吃药晕车,计算公交路线和估算的时间离开公共汽车和总旅程从地图上,然后个人预计计算总线公平和收集所需的正确的改变。个人也是评估的复杂活动找到一个食谱食谱书的意粉酱和采集的所有成分。野餐篮子活动涉及一篮子从橱柜里通过收集所有必要的东西,把它们放进篮子里。最后,个人将退出与野餐篮子向门口。这些都是八个人进行评估复杂的活动。

多个传感器在智能家居环境中被用来收集活动数据。运动传感器、门传感器、燃烧器传感器、温度传感器等被用来评估一项复杂的任务。

3.2。数据预处理

从数据中提取信息的能力是与数据质量直接相关。数据的质量取决于清洁和有意义的数据。为了使我们的数据适合评估,我们预处理数据。

3.2.1之上。检查缺失值

所有属性都是检查缺失值。缺失值,即。,sensor values with no readings, were replaced with zeros.

3.2.2。分类成数值

所有非数字属性被分配分类值。属性诊断有两个值,健康和老年痴呆症。' 1 ' ' 0 '时被分配到健康被分配到痴呆。

3.2.3。所有数量的扩展

所有传感器的值被规范化使用min-max标量范围内。这个天平传感器读数在0和1之间没有改变分布的形状和保留原始数据的属性。毫升和DL结果如果数据比例大幅提高。

3.3。特征提取

在任何给定的数据集,某些特性与具体研究或包括无关的细节,不要造成任何重大的研究过程。为了消除不必要的处理,提取相关特征的数据集是至关重要的。冗余传感器读数被执行了皮尔逊相关性。阈值被确定为90%。所有属性超过90%被淘汰是因为他们是高度相关的。几乎58传感器是高度相关的。因此,他们被消除。分类是应用于其余传感器的读数。

3.4。分类模型

人工智能技术可以准确地用于医疗保健的预测和诊断疾病的客观态度。毫升和DL疾病预测最常用的人工智能技术。我们四个毫升模型应用于数据集组成的复杂的活动数据。他们DTC(决策树分类器),NB(朴素贝叶斯),SVC(支持向量分类器),和MLP分类器(多层感知器)。我们也使用的是深层神经网络由四个致密层对我们的数据进行分类。

3.5。评价指标

每个模型的实现,一些评价指标工具被用来评估每个模型和比较模型的性能收益最好的输出。我们比较和对比如下:

3.5.1。训练数据的交叉验证分数

自从K-fold交叉验证(CV)是一种有效的措施在模型选择,我们在训练数据集进行了10倍的简历为每个模型(19]。然后我们计算的平均精度验证过程之后对所有十迭代和手段的标准偏差,以确保数据的一致性。

3.5.2。平均精度和准确性的训练数据的标准差

执行简历时,重要的是计算所有十个结果的平均值得到的模型的性能,并概述包括衡量所有十个结果的方差,以排除任何不寻常的结果离群值的形式(20.]。

3.5.3。每个模型的时间训练

花了多少秒毫升模型计算精度?培训时间通常超过测试由于训练数据是一个更大的比例的数据集。

3.5.4。测试数据的准确性

模型应用于测试数据,和他们的计算精度。

3.5.5。每个模型的测试数据

测试模型的测试数据中提取数据集。

3.5.6。精度

这是定义为

精度是有用的在决定如何准确的模型预测真正的积极成果的积极成果预测。

3.5.7。回忆

这是定义的公式:

记得帮助识别准确积极预测比例实际积极值的数据集。

3.5.8。F1-Score

这是定义的公式:

从精度和召回是不准确的确定模型的真实性能,F1-score用于确定精度和召回的综合效应计算调和平均数。

3.5.9。支持

这是简单的实例的数量/记录提供给模型进行训练和测试。

3.5.10。混淆矩阵

给出了总结。实例:真阳性、假阳性、假阴性,真正的负面。

3.5.11。曲线下的面积(AUC)

这是一个如何的图示模型可以区分两类。面积越高,模型的性能越好。

4所示。实验分析及结果

该方法旨在诊断痴呆从公开的数据集使用复杂的活动数据。我们训练不同的分类器与给定的数据和分析结果得到模型,给出最准确的结果。实验分析了著名的基于web的IDE notebook-Google Colab,和实现是使用Python 3.6完成。第一个任务数据预处理之前将数据分为训练和测试样本。我们使用78:22比训练和测试,分别。616年的记录,480被用于训练和136进行测试。

4.1。决策树分类器

决策树算法是监督毫升分类器。他们通过分裂操作数据集分类基于标准。数据迭代分割直到均匀子集包含记录相同的类标签。基尼指数,信息增益,增益比常用的指数进行分割(21]。我们的DTC使用默认的“基尼指数”进行分类。

1显示的平均精度从十迭代获得10倍交叉验证取得了97%的准确率最低标准偏差为0.0208,表明所有迭代了类似的结果。培训时间为0.215秒,而预测非常快,只花了0.03秒。

2概述了我们的决策树分类器模型的性能。它可以观察到,precision-recall和F1-score都给97%的分数。全部参与者的测试数据,59痴呆患者和77名健康的人在我们的测试数据集。图3是一个模型的混合矩阵。它给的总结预测与实际结果。我们的模型准确地预测57 59痴呆患者和75 77健康个体通过决策树分类器。只有四个错误分类。图4为我们的决策树分类器是ROC曲线。该模型有效地痴呆和健康人之间的分化,准确率达到97%。图中可以看出,真阳性率迅速增加到0.97,而假阳性率相当低,达到0.97后,曲线变得平坦,速度几乎不变。

4.2。朴素贝叶斯分类器

NB分类器是基于贝叶斯定理概率分类器。通过使用条件和先验概率,我们可以确定一个类的概率。这些复杂的计算非常重要,以确定类概率之前,和条件概率可以很容易地从给定的数据集。NB分类器从根本上操作概率原则所定义的 在哪里 后验概率, 的可能性, 是类的先验概率, 预测概率。

3表明,平均精度获得10倍后的简历NB的分类器是0.831标准差为0.053。NB分类器的训练和预测时间远小于决策树分类器,因为NB分类器是一个相对简单的和简单的分类器,这是一个优势在处理时间,但因其天真的本质是一个明显的缺点。总体预测精度达到0.85。

4总结了从模型实现重要的发现。痴呆的精确值是0.74,回忆是1,F1-score是0.85%,而健康个体的精度是1.00,0.73召回,F1-score是0.84。的整体精度测试数据是0.85。

5混淆矩阵的实际与预测结果。模型能够正确分类所有痴呆患者,但它们是不是21健康个体,从而减少模型的准确性。只有56个健康人可以预测从测试数据集。中华民国曲线在图6显示了一个曲线下的面积等于0.99。

4.3。支持向量分类器

SVC是一个监督ML算法可用于分类和回归的挑战。拟议的工作使用SVC分类痴呆和健康个体通过分析数据复杂的日常活动在智能家居环境中。每个数据点映射到n维平面,然后在每个类分离用一个超平面22]。最大的目标是找到一个超平面最近的点的距离,也称为支持向量。

5应用后表明,平均精度获得10倍的简历是0.967,标准差是名义上的,也就是说。0.025点。表6显示精度、召回和F1-score痴呆和健康值的范围从0.97 - -0.99,表明我们的算法给出了非常准确的结果。训练和预测时间SVC不到DTC和NB。

7是一个SVC的混淆矩阵。矩阵表明,该算法可以成功地分类58痴呆的实例和75年健康个体只有三个错误分类的实例。ROC曲线在图8显示了一个曲线下的面积等于1.00,显示了性能优良的算法。

4.4。多层感知器分类器

MLP神经网络是神经网络,其中每个神经元模仿人脑的工作方式和学习结果使用数学运算。输入层由神经元接收数据;在每个神经元处理后,数据被传递到一个或多个隐层执行数学运算并将其传递到输出层预测输出(23]。即使用反向传播神经网络学习的错误发生。预测和实际产出之间的误差计算,和调整,使学习的模型。表7显示我们MLP分类器的性能预测痴呆与健康的病人从复杂的活动数据。从10倍的简历获得平均精度为0.971,标准差之间只有0.0298十迭代。向MLP分类器实现约99%通过训练神经网络预测精度在11.95秒,在0.011秒内获得使用测试数据的预测。虽然中长期规划的培训时间是很多,因为涉及复杂的计算,它已经发现他们可以达到很高的精度。表8的分类报告MLP分类器和显示精度。记得,和F1-score 0.99至1,这两个类都是接近100%。

9混淆矩阵的MLP分类器,可以看到,我们的算法成功地分类的所有健康的人,只有更进一步的痴呆患者。ROC曲线在图10也表明100%的准确率曲线下的面积等于1。

4.5。深层神经网络

款(深层神经网络)是一种神经网络有多个隐藏层紧密连接。款的能力从原始传感器数据中提取特征并给出一个有意义的输出使用复杂的数学运算使款最先进的人工智能技术。款已经被成功地用于医疗,他们已经超过人类的准确性。使用复杂的活动数据,提出采用工作款预测健康与老年痴呆症患者。使用4款模型构造致密层。ReLu激活函数中使用的前三层,和一个s形的函数使用第四层产量输出预测个体是否健康的或痴呆病人。二十世纪被用来训练我们的模型的批量大小16。训练精度迅速跃升至0.57后第一个时代后0.78秒。精度在20世纪逐渐从0.78增加到0.986。同样,预测精度从0.75之后第一个时代跃升至0.85之后第二个时代,20世纪后升至0.96。 As shown in Figure11期间,训练和测试的精度迅速增加后的第一个三个时期,然后成为稳定三个时期。图12使用款混淆矩阵的分类模型。只有一个痴呆患者被误诊;其余的健康个体和痴呆患者正确分类,显示良好的精度。

13说明了训练和测试数据的损失/错误行为/时代。观察到的训练误差是非常高的第一次时代后,即0.62、0.64和测试错误。培训和测试数据,每个时代稳步减少损失。减少十世后放缓时,曲线变得平缓,奉承。20世纪后的最终损失训练数据为0.061,和测试数据,这是减少到0.13。中华民国曲线还表明一个AUC的指示一个优秀的两类的分类图14

5。讨论

我们测试了五种不同的毫升在公开数据集分类器组成的179人的数据,其中145是健康的个体,32受到MCI,和两个被诊断出患有老年痴呆症。收集的数据来自传感器在智能家居环境中聚集攻击八个复杂的任务。结果数据然后使用DTC分类,NB标识符,SVC,向MLP分类器,和一款模型。总结了结果表9

款和MLP分类器产生最好的准确性和ROC曲线下的面积。返回的NB和SVC少预测痴呆与健康个体的精确性。虽然MLP分类器提供了准确的结果,需要训练时间最长;因此,它不是最有效的处理和花费的时间由于其复杂的算法。款也取得了优秀的精度比DTC但需要较长的处理时间,NB, SVC。SVC,尽管它需要最少的处理时间,它得到可怜的准确性。因此可以得出结论,准确性和中华民国,延时和款是最好的分类器预测痴呆使用复杂的活动数据,考虑到培训时间没有多大意义。

6。结论

拟议的工作试图比较和对比不同的分类器的性能预测痴呆使用毫升技术在复杂的活动数据。我们观察到,大多数分类器成功地从给定的数据分类痴呆和健康有轻微变化精度。深层神经网络和多层感知器分类上课表现很好。我们得出这样的结论:人工智能技术是非常有效的早期诊断和预测痴呆。使用智能家居,我们可以方便地诊断痴呆病人通过观察他们的行为在他们复杂的日常活动。多层感知器和深层神经网络被认为是最好的分类器的分类任务,因为他们可以实现精度高达99%。最早的痴呆的迹象出现在个人试图执行复杂的日常活动,包括认知脑功能规划、分析和计算。我们提出的工作可以检测这些行为在个体的早期变化,从而帮助医疗专业人士检测痴呆早期和准确。越早诊断,疾病容易管理。

数据可用性

(复杂的交织活动)数据用于支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。