文摘

随着用户数量的增加在目前的社交网络平台(以微信为例),个人隐私安全问题是很重要的。本文提出了一个智能检测方法在社交网络个人隐私信息披露。首先,我们提出并构造特征值在社交平台。其次,通过计算用户帐户资产的价值,我们可以获得特征值计算威胁发生的可能性和威胁的影响。第三,我们分析的情况,用户可能泄漏隐私信息,使得分。最后,支持向量机算法用于分类结果,提出一些建议警告和修改。实验表明,该智能检测方法可以有效地分析个人用户的隐私泄露。

1。介绍

当今社会发展迅速,随着智能手机的普及,大量的私人信息生成增加。发生的“棱镜”,Facebook的用户个人信息泄露,和其他事件,私人保安的问题已经开始吸引人们的注意力。

近年来,微信是在中国最流行的应用程序之一,截至2019年6月,微信上的每月活跃用户数量达到了11.3亿。巨大的用户数量将包含大量的用户隐私信息。然而,大多数用户没有相关专业知识或忽视信息管理。因此,在使用微信时,他们不注意保护私人信息。调查和分析后,披露账户密码、添加朋友设置、位置信息等,在聊天过程中会对用户数据构成威胁如果他们泄露,甚至可能导致经济损失或人身伤害。由于上述问题,相关的研究。文献[1)进行了综合评价应用的移动应用市场,但没有考虑社交平台的风险。文献[2)针对Facebook收集大量用户数据使用问卷调查和分析,但用户的数量远远超过Facebook在中国微信。文献[3)总结了异常账户检测方案基于行为特征的四个方面,内容、图表和无监督学习。检测方案丰富,但所涉及的特性值相对较小,使得数据分析不够,而不是针对个人社会账户做出适当调整。文献[4)充分考虑轨迹隐私泄漏的问题,保护一个前缀树,但这并不足以考虑个人社会账户安全的各个方面。文献[5]做了一个正式的描述恶意使用通讯录匹配函数和相应的保护措施,但它也被认为是不完整的。在[6),很多恶意程序和风险项目在安卓方面深度分析了,但是只有信息通过电话和短信的泄漏进行了分析。它不分析社会平台和未能给出一个更直观的评价体系。在[7),高科学和严格的静态分析,动态分析和网络数据模型被用于多维分析。然而,只有30的应用进行测试,得出的结论是,目前的应用程序市场软件泄漏用户隐私。没有风险评估是为每个用户执行。在[8),风险分析是基于关联规则和游戏理论,但选择的特征值是十分罕见的没有针对社交平台。此外,据了解,在当前环境下隐私泄漏检测系统面向企业和企业和不适合分析个人用户。

本文提出的创新如下:(1)通过微信的调查和分析,提出了八个特征项在社交网络和构造,账户密码在聊天,微信的钱包消费记录(不是朋友),(朋友)和微信的钱包转移记录,时刻设置的陌生人,设置对附近的人来说,设置添加朋友,时刻设置的朋友,和迷你程序的信息采集。智能检测系统使用这些过滤功能项来计算风险价值更有效和准确。(2)使用的运营资产识别、威胁识别、脆弱性分析计算综合威胁值。(3)智能检测方法提出了基于SVM(支持向量机)划分的数据更准确。(4)调查后,大部分的今天具有相似功能的检测软件是面向企业,这个系统是一种罕见的个人用户市场上的智能检测系统。

2。智能检测系统的原理

智能社交网络个人隐私泄漏的检测方法提出了在本文中为用户总是。有一个个人隐私泄漏的风险。获取用户微信设置、资产识别、威胁识别、执行和漏洞分析,矩阵相比,获得安全。对事件风险值,根据重量计算信息泄漏风险系数。文献[9- - - - - -12)指出,机器学习已经广泛应用于医疗领域,网络安全,等由于其强大的数据挖掘功能,支持向量机是最流行的一种机器学习算法;因此使用SVM算法将信息泄漏风险系数,得到最终的评估。

2.1。风险:风险是不确定性的影响在一个目标

本文探索风险指的是信息安全漏洞的风险,人类和自然的威胁,和使用信息系统及其管理系统的漏洞导致安全事故及其对组织的影响。在当前环境下的高信息透明度、私人信息不能在零风险(8]。

2.2。资产识别
2.2.1。资产和它们的价值

资产是指任何有价值的信息或资源。资产的价值并不是指的是信息系统的经济价值,但密切相关的业务工作的组织。资产价值的重要性和敏感性资产和资产鉴定的主要内容。

2.2.2。资产识别

资产识别包括两个步骤:“资产分类”和“资产分配。本文探讨了应用软件的分类。资产分类的基础上,进一步执行资产semiqualitative和半定量的分析;执行资产估价,要有一个科学、合理的对资产价值的理解。资产分为三个安全属性的任务:“机密任务,”“完整性的任务,”和“可用性作业。”

2.2.3。保密

的功能,可以防止信息被泄露给未经授权的个人、实体、过程或无用的。

2.2.4。完整性

它可以保护信息和处理方法的准确性和完整性。

2.2.5。可用性

它是一个功能,可以访问和使用授权实体一旦需要(13]。

2.3。威胁识别

(1)威胁:事故的潜在原因,可能会导致损害资产或单位。(2)威胁标识:指的过程分析事故的潜在原因。威胁识别分为“威胁分类”和“威胁赋值”(13]。

2.4。脆弱性分析

(1)弱点:软弱的资产或资产,可以威胁。与威胁相比,风险的威胁是外部原因,和脆弱的内部原因是风险。这两个一起构成风险。(2)脆弱性识别:指的是薄弱环节的分析和测量过程的资产可能威胁要使用[13]。

2.5。支持向量机算法的基本介绍

支持向量机是指支持向量机,是一种常见的方法的歧视。在机器学习领域,这是一个监督学习模型,通常用于模式识别、分类和回归分析。

支持向量机的主要观点可以概括为两点:(1)分析了线性可分的情况。对于线性不可分的情况,通过使用一个非线性映射算法,从低维输入空间线性不可分的样本转化为高维特征空间使其线性可分的。可以执行一个线性分析的示例使用一个线性算法的非线性特征在特征空间中。(2)它在特征空间构造最优超平面基于结构风险最小化理论,以便学习者是在全球范围内优化,期望在整个样本空间满足某个上界有一定概率(14]。

3所示。智能检测模型设计

3.1。智能检测模型的基本架构

这个智能检测模型分为数据源层、层,分析和计算层,如图1。其中,微信的用户来源数据后通过数据源层,选择八个特征值分析和计算;分析层执行资产识别特征值,和威胁和漏洞分析计算,分别得到计算表。资产鉴定选择三个安全属性的资产机密性、完整性和可用性,计算资产价值和资产价值分为五个层次获得量化资产价值表。威胁识别威胁划分成五个层次基于威胁的频率获得的频率表的威胁。脆弱性分析是计算脆弱性属性计算表通过计算基本测量组,时间测量组,反过来,环境测量小组;在计算层,三个计算表分析相结合的安全事件比较每个特征值的二维矩阵表来获得的数据安全事件的风险价值。

然后每个风险的权重值的总和值用于获得价值,风险和风险值带入相应的支持向量机分类器获得最终结果。

3.2。特征值结构

基于微信的调查和分析,我们选择下列条件作为特征值。智能检测系统使用这些过滤功能项来计算风险价值更有效而准确地:

3.2.1之上。聊天过程中帐户密码

帐户和密码直接提到了在聊天。如果聊天记录被盗,账户和密码信息泄露,和整个帐户将被丢失,有违法行为。

3.2.2。微信的钱包消费记录(加密)

他们需要钱来互相交流不知道太多关于另一方的身份,缺乏安全保护,可能会造成经济损失。

3.2.3。微信的钱包转移记录(朋友)

朋友之间的传输安全高于敌人之间的转移,但如果朋友是假扮的身份,转让交易对手的身份是未知的,所以即使朋友之间的转移将会处于危险之中。

3.2.4。设置一个圆的陌生人

陌生人的设置一个圆分成看不见陌生人,十对陌生人照片可见,无限的。如果攻击者不断获得用户圈信息很长一段时间,陌生人可以看到十照片是无限的,没多大区别,将导致大量的为用户信息泄漏。

3.2.5。设置对附近的人

如果不关闭,附近的人的实时位置使用的用户将会暴露和罪犯。

3.2.6。添加朋友设置

相关的设置包括是否需要验证当添加为好友。的方式分为微信搜索用户,手机号码,和QQ号码,除了名片。在这方面太多的权限将会增加的可能性被陌生人打扰。(7)时刻的位置:攻击者可以根据获得的定位进一步犯罪信息,导致用户的人身安全受到威胁(8)迷你程序信息采集:迷你程序通常获取用户信息。如果罪犯利用迷你程序,仲裁用户信息将导致用户信息泄漏。

3.3。资产识别

资产的安全属性,如机密性,完整性,可用性,反映了资产在不同方面的特点。通过量化三个安全属性,一个可以计算一个值,反映了资产(15]。

其中, 代表保密性赋值; 代表完整的任务; 代表任务可用性; 代表舍入处理和舍入。三个安全属性分为5个层次。水平越高,对资产的影响就越大。有5个相应级别的安全属性和水平的资产价值也分为5个层次。水平越大,越重要的资产。

从表可以看出1的披露帐户密码在聊天过程中会导致整个帐户信息的损失,所以它的三个作业和计算资产价值是5,这是最高的。与微信的钱包朋友之间转移相比,所需的保护信息和处理方法更准确、完整的微信钱包朋友之间的转移;也就是说,完整性的任务是相对较高的。功能项目可能接触陌生人(时刻陌生人的权限设置,设置附近的人,添加好友,并使用迷你程序),我们已经安排了更多的平均值。时刻的位置主要是有限的朋友,因此,价值较低。

3.4。威胁识别

根据频率的威胁,威胁的可能性是定义和划分为5个层次。级别越高,威胁的概率就越高。

从表可以看出2帐户密码信息披露的数量和微信的钱包消费记录之间加密聊天过程中有更大的影响在每个泄漏,所以间隔分配的频率不同级别的威胁较小。剩下的特征值赋值间隔较大或分配根据设置在特定的微信。

3.5。脆弱性分析

本文使用常见的弱评价系统(CVSS)。CVSS评价体系包含三个测量组:基本测量组,时间测量组、和环境测量组(15]。

基本指标= round_to_1_decimal(10∗∗访问访问向量复杂性∗∗身份验证(∗保密(机密性影响影响体重值)+(∗一致影响一致性影响体重值)+(可用性影响∗可用性影响体重值)))

表中的值3根据表被选中4(16]。因为个人隐私泄漏是基于本地信息,在本地选择所有访问向量。微信官方的保护措施,所以访问都是高的复杂性。身份验证是指验证用户是否有权访问该系统。身份验证所需的特种作战,所以所有的选择都不是必需的。如果账户密码泄露披露在聊天,它会导致用户失去他所有的账户,所以只有机密性影响,一致性的影响,和可用性的影响选择此功能项,剩下的全部或根据选择的影响。机密性的影响权重值,重量值一致性的影响,和可用性的影响权重值分配根据每个特征项的比例三个属性的影响。最后,基本测量值计算。

时间度量= round_to_1_decimal(基本度量可用∗∗∗保密等级,可以修复的报告)

表中的值5根据表被选中6(16]。帐户密码的泄漏在聊天最有可能被使用,所以可以选择此功能项来高利用率。传输记录可用性较低,所以选择不确认。时刻的位置选择的可用性在理论上被证明是切实可行的剩余的功能项。水平,可以修复被分配根据特色项目根据是否容易泄漏后的恢复。转移记录和时刻定位比其它功能项。因此,高和理论选择,选择未经证实的其余部分。报告已经一致选择的机密性。

环境指标的价值= round_to_1_decimal((时间指标得分+((10倍指标得分)∗附带损失影响))∗目标分布)。

表中的值7根据表被选中8(16]。损失的影响传输记录和时刻的位置很小,所以附带损失的影响是选为中、低,剩下的都选为高。分配的目标分配是根据物品的分布特性。聊天的帐号密码,密码将会被高,剩下的选择较低或中等。计算环境指标。

脆弱性价值计算公式(16]:INT V ={(环境测量值5∗)/ 10 + 0.5},所以漏洞值如表所示9

3.6。风险计算:计算的风险如下

在完成资产识别、威胁识别、脆弱性识别,一个适当的模型可以用来计算的风险值使用威胁安全事件造成的脆弱性。本文采用中国国家标准GB /风险计算模型T20984年“信息安全技术,信息安全风险评估规范”。

公式表示为风险值=R(一个T,V) =R(L (T, V) F (A、V))。其中,R安全风险的计算功能,一个是资产的价值,T的威胁,V是脆弱,l威胁的可能性使用资产的脆弱性导致安全事件,和F是安全事件造成的损失。

在风险的具体计算,有三个关键计算链接。

3.6.1。计算安全事故的概率

根据频率和漏洞的威胁,计算的概率使用漏洞将导致安全的威胁事件,也就是说,一个安全事件的概率=l(频率的威胁、脆弱性的严重程度)=lV (T)。

这个系统使用一个二维矩阵算法计算的概率安全事件,如表所示10(15]。

操作。计算安全事件造成的损失

根据资产价值和脆弱性的严重程度,计算安全事件一旦发生,所造成的损失,造成的损失安全事件=F(资产价值、脆弱性的严重程度)= F (A、V)。

该系统使用一个二维矩阵法来计算损失的安全事件,如表所示11(15]。

3.6.3。计算风险价值

根据安全事件的概率计算和安全事件造成的损失,计算风险值,即风险价值=R(安全事件的概率,造成的损失安全事件)=R(L (T, V) F (A、V))。

系统采用二维代码矩阵法来计算风险值的安全事件,如表所示12(15]。

4所示。基于权重总和

每个数据安全事件的风险价值是来自表12,每个风险价值乘以权重表的价值13获得最终的风险值。

全面的计算公式计算一个威胁信息资产的价值:

其中,t是一个威胁的综合价值,T年代是一个威胁源值,定义为一个值介于1和5,然后呢T是一个影响程度值,也定义为1到5之间的一个值。

4.1。支持向量机算法应用

智能检测系统使用SVM算法划分综合威胁值(如图2),并进一步划分更准确的用户帐户的风险水平。

具体过程如下。

基于上述综合威胁,值得计算风险值。得到的风险值分为两类。1 - 40的分数低风险地区,和40到100的分数是高危地区。其中,1到20的低风险区域被定义为安全,21到40被定义为基本安全,41在高危地区59被定义为更高的风险,和60 - 100部分表示为高的风险。

特征量的两种类型的风险值定义为安全及基本的安全记录在初始特征向量组1。特征量的定义为两种类型的风险值较高风险和高风险记录在初始特征向量集2。

规范化特征数据项删除极端数据。处理两种类型的数据格式转换为支持向量机分类器的输入格式可以接受(类向量Y,特征向量Xi)

相应的分类器1是训练用数据定义为安全、基本安全作为训练样本,和相应的分类器训练2是使用数据定义为安全、基本安全作为训练样本。

将支持向量机参数和使用K-fold交叉验证算法找到最优参数。进行资产识别、脆弱性分析和识别威胁的特征值由用户阅读。风险计算后,确定基于分数低风险区域或高风险区域并输入相应的风险区域作为测试样本。支持向量机分类模型进行分类判断。支持向量机的结果代入朴素贝叶斯公式得到安全风险概率,并发送反馈的最终结果给用户。

4.2。支持向量机训练算法

支持向量机计算流程如图3。训练数据和测试数据的格式是:

<标记> <指数(1)>:< value1 > <指数(2)>:< value2 >…

例如:0 1:1 2:1 3:1 4:1 5:2 6:2 7:2 8:2。

其中包括:

<标记>是训练数据集的分类标识符,设置为0和1,0为安全,1为基本安全。

<指数>是指8输入算法的特征量,这是整数。

<价值>是每项功能代码的值是一个整数。

SVM_train实现培训训练样本获取支持向量机模型。

SVM分类的预测分类的结果根据训练数据集模型。

使用SVM_train训练输入训练数据集获取支持向量机模型文件。SVM算法映射每个输入训练样本,也就是说,一个n维向量在高维空间,形成多个分散的点,通过聚合点。该地区模拟分类超平面,不断使用新输入训练样本的数据进行修正,生成模板文件,并记录分类特性。

摘要K-fold交叉验证方法用于获得最优参数通过验证结果的准确性。验证算法的主要目的是将数据集分为训练集B和测试集c .当样本容量很小,可以随机分为数据集k包,一个包作为测试集。剩下的k - 1包作为训练集训练。交叉验证方法是用来防止过度拟合模型过于复杂造成的(18]。通过不断地将支持向量机的两个重要参数:C惩罚因子和核函数参数 ,最优参数C= 2048, = 0.0078确定。

4.3。支持向量机算法处理

支持向量机分类器1:输入 ,x代表了每个样本的特性值设置在测试样本,y0和1表示类别,分别代表安全和基本安全;输出用户的安全风险概率小于或等于50%,安全,和超过50%的基本安全。步骤1:正常功能的数据第二步:加工特性数据转换成一个输入分类器可接受的格式(特征向量x、类别向量y)来获取训练样本步骤3:设置支持向量机类型0-SVM和核函数类型径向基函数(RBF)第四步:设置惩罚因子C和核函数参数G第五步:设置的K值K-fold交叉验证算法步骤6:使用SMO算法来寻找支持向量第七步:从训练样本构建一个超平面模型第八步:输入测试样本进行分类,并把分类结果y第九步:计算 获得每个特征属性的条件概率比结果分类y第十步:计算 类别的概率y出现第11步:计算 每个特征属性的概率步骤12:替代公式 13步:返回 支持向量机分类器2:输入 ,x每个样本的特征值集的测试样品,y类别是0和1,这意味着高风险和高风险输出用户的安全风险概率小于或等于50%,是一个高风险和超过50%的高风险。支持向量机分类器2的过程是一样的SVM分类器1。

5。智能检测系统的实验和分析

5.1。环境配置和数据采集

这个测试系统设计运行在Android平台上。在测试阶段,Android工作室是用来模拟各种测试的Android平台。

由于不便直接获取用户的个人隐私数据的微信,一份问卷被用来在这个阶段收集的微信使用149个用户作为支持向量机分类器的训练样本。问卷的具体内容补充材料(如附件所示在这里)。

5.2。功能测试

用户测试任务表如表所示14。这个系统的功能测试,我们首先获得相关的微信记录的用户测试,作为示例1。用户已经测试并计算综合威胁26的价值。在获得全面的威胁值,这个样本的数据格式转换为输入格式是可接受的分类器。基于用户的综合威胁值26日样本应该被确定。输入支持向量机分类器1。输入格式是0 1:3 2:1 3:2 4:1 5:1 6:1 7:4 8:2,样品1的处理完成。

消除极端数据从剩下的样品之后,上述步骤处理和发送到相应的支持向量机分类器。训练样本用于建立一个超平面模型。当系统智能地检测到泄漏风险概率,它会自动获得特征量,计算综合威胁值计算后,并将其发送到相应的支持向量机分类器获得最终的安全风险概率。

根据这一方法,我们加工149个用户问卷调查的结果和计算分数为每个段的数量。结果如下表所示15

从表15,我们可以看到,总共有89用户在低风险区域和34用户在危险区域,其中26个用户在安全地带。这表明安全意识教育一直有效,人们已经意识到,个人隐私是很重要的,但也有许多用户在高风险地区,表明仍有需要继续努力扩大覆盖面,提高每个人的安全意识。

5.3。性能测试

通过问卷调查获取用户相关的微信信息。作为样本,测试个人隐私泄漏检测用户的社交网络的价值,并给予警告或建议的人的比例在每个风险级别,然后得到人们是否知道并执行的当前数据隐私保护的程度,哪些方面对人们的重要性,和哪些方面被人们忽略,并提供方向促进未来的隐私保护意识。调查结果如图4

与此同时,我们数出现的次数高的威胁为每个功能项(也就是说,分配的次数4或5)。

在图5,我们可以看到,大多数人一定self-privacy保护意识,但是许多人忽视了“附近的人”功能,允许陌生人查看私人信息可能泄露的时刻。一个系统可以保护用户的隐私的隐私是非常重要的。通过这种智能检测系统对个人隐私泄漏社交网络,用户可以清楚地了解他们的过失的过程中正确使用微信,他们在问题发生前阻止它们。

6。结束语

本文提出的系统是基于阅读个人微信的多个特征值和基于资产的三个方面建立模型识别、威胁识别、和漏洞分析。根据国家标准的风险计算模型和方法的信息安全风险评估标准、维矩阵表计算安全事件的可能性,安全事件的损失,和安全事件的风险价值,决定了风险级别根据风险的大小,计算用户的个人隐私泄露的在线社交软件,给出了分数,并通知用户有关的风险来源。

这篇文章只提到得分函数的系统和功能显示个人隐私泄露的风险来源。在未来,更多的功能将被添加到改善整个系统,这也将使判断更准确,并创建一个更准确的形势对于个人用户来说,使用社交网络创造安全的环境。

数据可用性

由于不便直接获取用户的个人隐私数据的微信,一份问卷被用来在这个阶段收集的微信使用149个用户作为支持向量机分类器的训练样本。调查问卷的具体内容是在补充材料。

的利益冲突

作者宣称没有利益冲突。

确认

这部分工作是由人文社会科学研究项目的教育部(20 yjazh046)和高等教育研究项目(2020号gjzd02)、“实用培训计划”(创业)交叉训练的高级人才。

补充材料

调查问卷的详细信息在附录i根据数量,它分为五个层次:5是最高的,它正逐渐减少,1是最低的。(补充材料)