文摘
在现实生活中,人们遇到的风险在各种负面情绪,和长期的负面情绪,很容易陷入抑郁状态。然而,在当前的心理健康系统,诊断抑郁状态的客户通常需要医生或顾问与客户进行面对面或视频咨询,耗费大量的时间和人力。因此,有必要采用心理健康监测和个性数据分析。为了达到更好的结果在识别学生的心理健康问题,本文尝试使用多个数据源,提出了一种识别算法基于多个数据源的心理健康问题,并使用数据学生心理状态提供心理学标签改善缺点带来的问卷调查方法。进一步优化模型识别结果,提出了一种心理健康问题识别算法基于DeepPsy模型。2 d-cnn被用来提取一天的在线模式,一个LSTM网络被用来捕获时间天之间的依赖关系,并深入学习网络旨在结合底层特征与在线轨迹模式。实验显示精度0.71,0.75的回忆,和一个F1-Measure 0.72,能够识别75%的学生心理健康问题。
1。介绍
在传统心理健康诊断,通常是必要的诊断通过评估客户是否有心理问题,采访等。这种方法更多的劳动密集型,不利于发现和早期心理问题的干预。然而,许多先前的研究已经表明,人们的各种习惯和在他们的生活中跟踪项目的心理状态。尽管目前,传统心理健康诊断的准确性比通过多维机器学习诊断,诊断通过机器学习也有自己的优势。智能系统由大数据可以诊断和分析大量用户同时,节约时间和劳动力成本,并且可以一天24小时监控用户的心理状态,这有利于早期发现和预防不良心理状态。这些都是传统的心理健康诊断方法不能做的事情。因此,传统心理健康诊断和大数据心理健康诊断可以互补。大数据系统的自诊断准确性不如传统的健康诊断,在实际应用中,该模型可以优化方法来实现宽松入口和严格的出口。也就是说,用户怀疑心理健康(PWB)问题被发现,提醒,并召回通过大数据系统,然后进行进一步的诊断和干预通过传统心理健康诊断方法。
心理健康和人格评价变得越来越重要,和天C开发特定的教育干预对一些特殊的父母。这些父母通常有严重的人格障碍和精神健康问题,因为父母的心理问题可能是感染了他们的孩子。设计一个务实的混合方法设计的目的是开发和试点专业教育干预措施(1]。家庭教育极大地影响青少年的心理健康。陈分析家庭累积风险的影响从不同的角度对青少年的成长和发展,并提出了相应的家庭教育方法在此基础上,主要为儿童心理健康教育提供一定的指导方针和人格问题[2]。Mamsharifi等人研究了社会支持和人格特征预测心理健康问题和对数据进行回归分析3]。种族歧视和消极的心理健康状况之间的关系一直受到质疑,和Mekawi等人使用二元关系和分层回归分析方法来确定种族歧视导致抑郁,焦虑和创伤后应激症状影响人格的作用[4]。Shirazi和Omidvar研究批判性思维和动态的角色性格在预测工作自我效能和对数据进行回归分析5]。一般来说,抑郁症在传统PWB诊断系统的诊断主要依赖于精神科访谈,耗费大量的时间和人力,将导致更严重的状况,不利于抑郁症的预防和治疗。
如何从大数据中提取情感信息变得非常重要。龚Y的研究发现,不同的个性,情绪状态和外部刺激对情感语义分析有不同的影响。过程特征描述情感进化更全面的预测从情感的描述和计算动态特性(6]。Adamopoulos等人研究了在线用户的潜在性格特征是否影响平台的有效性,使用机器学习方法结合计量经济学技术(7]。Ammannato和基耶西研究和调查信息游戏玩家的行为和反应模式评估人格特征的可能性。发现在五个六个人格维度,正确地识别一个球员的特质水平的概率高于使用深度学习培训机会深层神经网络(8]。的框架来解决精神压力健康智能医疗、Rachakonda等人提出了一个新颖的基于深度学习系统可以监视一个人的压力通过体温,移动速度,和汗水在体力活动(9]。人们如何学习心理学研究模型的特性和分类,但深层神经网络学习表示现实世界的刺激通过网络,可以用来捕捉心理表征。皮特森等人发现,简单的转换,对这些差异可以通过凸优化,扩展心理实验的范围和计算模型10]。虽然有很强的行为和PWB之间的关系问题在上面的研究中,获得的标签可能是不准确的通过问卷调查获得和行为之间的关系单一数据源和PWB不能准确评估PWB的状态。
2。PWB和人格的评价深度学习
2.1。应用人工智能技术在PWB状态预测
智能技术的进步融入心理领域。例如,有人工智能助手,可以与用户聊天,评估用户的PWB,和用户推荐合适的解决方案11]。也有相关的技术公司,开发了设备使用基于“增大化现实”技术和虚拟现实技术。用户可以穿这些设备和观察虚拟现实和心理治疗的基于“增大化现实”技术的视频图像。
互联网的发展、大数据和人工智能技术为心理学的研究提供了新的方法和机会。通过社会媒体内容、传感器(包括各种可穿戴设备和摄像机)和智能手机,可以获得大量的数据从人们的日常生活。PWB大数据总结和分类,如图1。
如图1,大数据在PWB级别分为情感、认知、行为、社会、和生物水平。这些大数据在PWB级别将项目人民PWB的地位。例如,在社会大数据,当人们感到伤心或者快乐的时候,他们会让自己的亲戚和朋友知道他们当前的情绪通过发送一个朋友圈12]。在生物大数据的水平,人们的睡眠质量会受到心理健康状况的影响,因此收集人们的睡眠数据通过可穿戴设备如睡眠手镯也可以对心理健康状况进行研究。简而言之,人们的情感和PWB状态可以通过分析这些PWB大数据。字符分类如图2。
如图2,人格理论是指一个人的性格的描述主要是由五个特征,包括开放性、责任感、外向性、宜人性和神经质13]。
虽然目前人工智能技术水平没有达到可以真正取代人类心理辅导员,人工智能技术的发展对传统的心理咨询工作带来了巨大的影响。一些高成本和低效心理咨询将取代了人工智能和人工智能技术将扮演一个角色在促进和推动整个PWB行业14]。
2.2。网络评估PWB深度学习
2.2.1。决策树算法
最关键的技术在构建决策树的选择分裂属性,和数据集通常包含很多属性。对于一些高维数据集,甚至可能有成千上万的属性。如何选择最好的属性是决策树研究的重点,也就是说,在多个属性,属性是优先选择分裂(15]。信息熵的计算公式所示(1):
其中,我代表了数据集的类别数E,(E)熵值越小,纯度越高的大肠样品的信息增益集E见公式(2):
属性选择收益最高,C4.5算法公式所示(3):
其中包括:
CART算法在速度优于前者。所示的计算公式(5):
决策树算法对数据不敏感。标定数据和数值数据都可以被处理,和功能不相关也可以处理(16]。
2.2.2。梯度增加树
梯度提高决策树的基本分类器(GBDT)算法也是一个决策树,和CART决策树,随机森林(17]。很难实现的准确性和多样性通过使用只有一个决策树分类器,和一个决策树分类器很容易过度拟合和不稳定的分类结果分类问题。梯度提高决策树树算法解决这些不足之处(18]。梯度增加树的基本思想是减少损失通过积累弱分类器。初始化基分类器所示公式(6):
每个基分类器需要做:
负梯度计算结果作为剩余价值,和公式所示的过程(7)。
拟合回归树,叶子节点,计算公式所示(8):
输出梯度增加树所示公式(9):
梯度增加树的区别和随机森林是一个随机森林里每棵树建立独立于其他树木,而梯度增加树构建基于先前的结果树。后者可以确保的连续性特征,和有许多非线性转换,有利于特征转换和高维特征代(19]。此外,梯度增加树木,如随机森林,克服问题,决策树容易过度拟合和不敏感的离群值。
2.2.3。神经网络
分类器错误率最低的电流被选为第一个基分类器,分类器的准确性是计算公式所示(10):
在他们中间代表了实际产出相对于输入类的第一个基分类器 。计算的误差分布的基分类器见公式(11):
基分类器在最后的分类器的重量计算公式所示(12):
更新后的训练样本的重量分布公式所示(13):
然后,回到第二步直到分类效果达到预设精度或行驶基本分类器的使用。
其中,代表的直接输出第一个基分类器。
2.3。学生PWB的识别算法基于多源数据
源的总体框架基于数据的学生PWB问题识别算法如图3。
如图3准确率(精密)高于召回率(回忆),和召回率最高(召回)只能达到0.58,表明有相对较少的样本,可以正确地识别。其次,决策树是最佳的综合性能,尤其是提高召回率(回忆)。因此,决策树被选为PWB的分类器识别算法基于多源数据。五分类算法在识别学生的结果PWB如表所示1。
所说的那样,实验结果如下表1:精度0.68,回忆是0.56,F1-Measure是0.67。算法利用多源数据能够56%的学生认同PWB困难,根据实验结果的测试集。
2.4。识别算法基于DeepPsy学生的心理健康问题
在这种识别算法,该算法使用数据,如学生消费,访问控制,网络,和成绩分析学生的行为在学校,可以识别学生的心理健康问题在一定程度上。但通过深入的分析,发现该算法的缺点。
2.4.1。算法的缺点
学生心理健康问题的识别算法基于多源数据,可以发现学生心理健康问题在某种程度上,但实验结果并不理想。通过进一步分析整个方法的框架,发现有两个缺陷。首先,由于大型在线行为序列的长度不同,有大量的职位空缺。较短的序列,它不可能提取学生在线模式。其次,在线模式训练两次,每个培训将产生一定的损失。提取冲浪的过程模式使用一维卷积神经网络(ID-CNN)产生一个损失,和另一个损失当训练一个分类算法(20.,21]。
为此,网络在线轨迹矩阵构造,旨在获得一种改进识别算法对学生的心理健康问题。
2.4.2。建设学生的在线轨迹矩阵
数据在网络日志的时间粒度精确到秒。获得的序列的长度直接建立行为序列根据时间的顺序不同。通常,学生的网络行为是用于上网的目的,甚至在不同时期通常是不同的。例如,越来越多的网页相关研究白天浏览,和更多的娱乐和购物相关网页浏览晚上(22]。如果类别的网页访问学生计算时间,然后学生上网的目的在每一个时期都可以知道。这是每天分为24个时间段,也就是说,每个周期是1小时。通过这种方式,学生每天上网轨迹可以转化为一个二维矩阵CH的时间和行为(web浏览类别)。其中,C代表类型的web页面的数量,H代表时间的数量,矩阵中的值访问web页面的数量。如果没有访问记录的时间段内,瓶里装的是0。一个二维矩阵,特征提取的常用方法是使用二维卷积神经网络(2 d-cnn)。在图所示的框架4。
如图4,该模型主要分为两个模块。第一个模块设计的联合模型2 d-cnn LSTM与学生的在线轨迹矩阵的输入,负责提取的隐藏模式学生的网络行为轨迹。第二个模块使用基本特征(包括异常分数)从四个数据源中提取作为输入来建立一个完全连接的神经网络,负责建筑的影响学生心理健康的基本特征的识别问题。然后,两个模块的输出连接,最后一个完全连接层神经网络。在这个模型中连接所有参数。当训练模型,back-propagated损失是应用于第一个模块和第二模块。同时,在线行为轨迹模块将根据学生的反馈做相应调整的基本功能模块,学生的基本功能模块也将影响学生的网络行为轨迹的特点(23]。
2.4.3。网络架构设计
共有八层神经网络是建立在2 d-cnn在线行为轨迹模块的一部分。第一和第四层神经网络层的卷积,卷积和相同的同时,也就是说,边缘的矩阵是满是0,所以矩阵的维数卷积操作之后不会改变。
的第二和第五层神经网络层使用一批标准化层。它是批规范化的输出之前卷积层。其操作所示(16)。
结合卷积和池层输出的特性,提取的特征矩阵是第一个夷为平地变成一个向量之前完全连接层。辍学的功能网络层是随机隐藏一些神经元节点,可以防止过度拟合训练中,提高模型的泛化能力。因此,第八层使用一个辍学网络层。对于每一个学生,每天的输出是一个矢量特性的T向量。
2 d-cnn部分后,每个学生每天上网行为特征的提取。隐藏在第九层获取时间依赖性,计算公式(17)和(18)。
很长一段短期记忆网络输出。只输出最后一刻的价值,然后输入这个值到第十层完全连接神经网络和网络行为的结果是输出轨迹模块,见公式(19)。
基本功能模块使用一个完全连接的神经网络,然后两个模块的输出连接在一起作为输入的下一层完全连接神经网络和连接操作所示公式(20.)。
在这项研究中,目标是一个二元分类问题,使用乙状结肠函数的输出转换为0和1之间的数字,代表样本的概率属于“1”,然后输出类的结果。
3所示。PWB和个性数据实验
3.1。基于社交网络的人格评估和预测
通过反复训练支持向量机的算法,即经典SVM-REF算法,特征对应于最优模型筛选出来,和5人格构造预测模型使用这些特性。实验仍然使用scikit-learn图书馆提高特征选择过程。而称其RFE接口、网格搜索是用来确定最优hyperparameters的线性支持向量机在每一轮的培训,和10倍交叉验证用于培训过程。在本实验的人格分类任务,总共有42的形象特征。也就是说,共有42个模型构造算法的在第一轮,和一个特性将删除最后一轮培训。这些42模型训练的基本设置下网格搜索最优hyperparameters和10倍交叉验证。这使得算法获得最优模型在当前特性集每一轮的执行。最后,经过SVM-RFE的迭代算法,将获得一个最优模型,和相应的特征模型的特征选择后的功能操作。接下来,提取的特征应用于实验过程,和只有差异在特征提取阶段,和其他设置不变。
3.1.1。开放性和外向性的实验结果
值得注意的是,18岁的20个图像风格特征提取的深卷积神经网络出现在超过30的特性。它表明,《阿凡达》的文体特征更重要的开放模型比《阿凡达》的面部特征。当试验分别在面部特征和风格特征,模型构建与风格特征与面临比模型建立特征精度和F1的分数。比较开放和外向性的预测效果如图5。
(一)
(b)
如图5改善后,打开四个预测模型的平均精度从66.0%上升到70.6%,平均F1从66.2%上升到68.1%。改进后,平均四个外向性预测模型精度从56.3%上升至59.6%,和F1平均从56.8%上升到59.0%,性能持续提高和整体模型。的准确性和F1值再和朴素贝叶斯分类模型已经得到了明显的改善,用高斯核支持向量机分类模型有一个小的改善的准确性,而准确性的车几乎没有改变,和F1值甚至拒绝。利用SVM-RFE提高特征选择方法,开放性人格的分类算法的预测准确率最高的78.4%,最高的F1值的77.8%。证明该方法使用《阿凡达》的风格和面部特征来预测用户的开放性人格是有效的。开放的实验结果预测用户每日公布的多个图像进行了分析。开放实验结果如表所示2。
如表所示2分类模型的整体性能改善,每天上传图片推断开放使用多个用户,当每天上传图片推断用户个性基于多个用户。四个开放的平均精度预测模型从70.6%上升至78.0%,和F1平均水平从68.1%上升到74.5%。只有购物车的F1值分类模型减少,只有0.05。其中,再算法的准确性和F1值高达83.3%和82.9%,这是开放下的最优性能指标预测任务。高斯核支持向量机的性能改善是最明显的,准确率提高了0.133,F1值增加了0.176。这不仅证明了可行性和有效性的使用用户的每日发布的图片来预测用户的开放特点,也进一步证实,当多个图像是用来预测用户的开放,将增强模型的性能。外向性试验的结果如表所示3。
如表所示3F1的平均值从59.0%上升到71.0%,性能不断提高和整体模型。所有分类模型的准确性超过70.0%,最高为72.1%通过朴素贝叶斯分类模型,和最高的F1值高斯核支持向量机获得的75.6%。其中,F1值的高斯核支持向量机增加了0.174之前和之后,再和精度模型增加了0.146之前和之后,和改进的效果是最明显的两个评价标准。
3.1.2。责任心的测试结果
在实验过程中通过SVM-RFE责任心,共有19个图像特征筛选出来,和责任心的比较预测效果如图6。
如图6的特性,皮尔逊相关系数的绝对值大于0.1被选中参加认真谨慎的性格分类模型的训练过程,最后只有8面部特征。而使用SVM-RFE方法提取重合5面部特征,11形象风格特征提取。而与源实验结果相比,平均精度的四个改进认真预测模型从63.5.0%增加到65.3%,F1平均水平从63.7%上升到64.0%,并改进模型的整体性能。的准确性和F1值高斯核支持向量机和朴素贝叶斯分类模型有所改善,但是这两个再模型的评价指标都降低了。通过改变特征选择方法,责任心的最高预测精度提高到69.2%,F1值70.2%。
当使用图像用户每日发布的预测,由于图像的数量的增加,这两个评价指标四个分类模型的责任心都得到改善,和相同的模型预测效果的两种类型的图像。其中,使用化身与实验结果一致,再模型仍然是表现最差的认真的分类模型预测任务。朴素贝叶斯分类模型维护两种方法分类效果最好,和责任心的实验结果如表所示4。
如表所示4,当推断责任心每天使用由用户上传图片,朴素贝叶斯分类模型的准确性为80.0%,与F1值是79.2%,这两个是这个任务的最优值。改进的高斯核支持向量机的精度最高为0.134。购物车的F1值分类算法具有最明显的改善,增加0.139。通过这部分的实验中,发现当使用多个图像用户发布的预测责任心,分类模型有良好的性能,比只有一个用户图像时使用。实验方法和图像特征的有效性验证。然而,最高的预测准确率只有80.0%,这也表明,尽管的特性被认为是在实验中是有效的,他们也有不完美的功能的问题。
3.2。学生PWB问题的识别结果
通过DeepPsy模型中的每个网络层,每一层的参数将被描述。在模型训练过程中,迭代次数是60,batch_size设置为4,优化算法采用亚当优化。DeepPsy模型的实验结果进行了比较。为了便于直观的比较,两组结果直观地显示。DeepPsy之间的对比效应模型和多源数据模型如图7。
如图7,可以看出DeepPsy模型比源模型在所有三个评价指标。特别是,召回指标最明显的改善。目标是确定PWB的学生问题,希望识别尽可能多的这些学生,给他们更多的关注。根据召回的定义,这是积极的样本,预测学生的比例正样本实际上是积极的。的回忆价值模型是更加关注。召回DeepPsy模型达到了0.75,这是源算法的高出19%,这意味着该模型可以75%的学生认同PWB问题。
现在还不知道的特性如何影响结果。本文使用这些特性集来训练模型:
中包含的功能类型特性集我是:网络特性,成就特点,消费特点,和访问控制功能。特性集II删除网络功能特性的基础上,包括:性能特点,消费特点,和访问控制功能。特性集II删除成就第二功能特性的基础上,包括:消费功能,访问控制功能。特性集IV排除消费第二功能特性的基础上,并且只包括访问控制功能。四种不同特性的可视化实验结果的组合设置如图8。
如图8,实验结果的特性集我是最好的,和实验效果逐渐恶化,减少功能类型,尤其是第四的衰落特性集比较大。这是因为消费特征的数量很大,这将大大影响结果。坐在60的迭代次数,参数batch_size,如果其他参数保持不变,也n= 1,2,3,4,5,如图9。
(一)
(b)
图9说明卷积核的数量通常设置为2当所有其他参数保持不变。五组实验数据比较图9(一个)。精度、召回和F1-Measure波动范围,分别为4%,6%,和3%,表明卷积核的数量在第一卷积层没有对实验结果的影响。的五组实验数据比较图9 (b)。精度、召回和F1-Measure波动范围是5%,7%,和5%,分别。实验的结果是受批大小略高于卷积核的数量在第一卷积层。
4所示。结论
传统的问卷调查对PWB问题有问题,很容易隐藏和小型规模。近年来,基于网络日志方法对于识别PWB问题已经出现。这种方法弥补问卷调查法的缺点,但是校园里的学生有不同的行为,和在线行为只是其中的一部分,这是不足以反映出所有学生的心理活动。同时,基于网络日志的方法识别PWB问题仍然使用调查问卷获取标签,标签仍然是不可靠的。本文使用多源数据来识别PWB大学生的问题,并提出了一个PWB问题识别算法基于DeepPsy模型。然后,使用用户化身为字符数据分析到设计深度学习网络相结合的基本功能和在线轨迹模式。实验结果表明,该算法具有较高的实用性。算法提出了确定那些未被发现的PWB的学生问题和人格缺陷,并可以为这些学生提供及时的心理咨询,以防止进一步恶化。在未来的工作中,希望能够预测学生的精神健康问题的严重性。
数据可用性
数据共享不适用于本文没有生成数据集或在当前的研究分析。
的利益冲突
作者宣称没有利益冲突与任何金融机构有关材料在本研究报告。