文摘

为了准确地获得社会媒体信息的可信度,提高可信度评估的效率,并提高社会媒体的安全,提出了一种评估方法基于用户感知的社会媒体信息的可信度。从三个维度的信誉,信誉来源,和内容的可信度,信息可信度评价维度进行了分析。根据信息可信度评价维度,建立一个社会媒体信息数据库和处理垃圾邮件数据库中。执行信用评估基于数据库中各种数据分析的结果,从社交媒体信息和提取有意义的关键词通过形成关键词簇的特征选择算法。最后,基于用户感知理论,社会媒体的可信度评估信息是实现。实验结果表明,定量方法评估结果的可信度社交媒体信息接近实际情况,评价结果更准确,和评价时间短,为监督管理提供了理论依据。

1。介绍

社交媒体与传统媒体不同,如报纸、广播和电视。其独特的特点,大量的信息,快速传输和开放,沟通和互动迅速成为主要的信息发布平台1,2]。社交媒体对任何人都开辟了一个不受限制的空间来表达他们的意见,这一趋势可能削弱他们的可信度的信息来源。在社会媒体的时代,尤其是移动互联网,和大数据的过程中生成和利用社会媒体的信息,用户的积极参与和互动分享是极大地增强了。用户的浏览器不仅是社会媒体的信息,而且社会媒体信息的生产者和传布(3]。在新媒体环境中,社交媒体的大规模增长的信息,沟通平台的多样性,沟通渠道的快速变化使信息的真实性和可信度,越来越多的人的关注4]。

目前,相关学者进行深入研究的可信度社会媒体信息,并取得了丰富的研究成果。作者在5]研究了影响社会媒体的信息来源可信度上的位置和语言特性,重点位置内容源的分布的影响不同的事件,并确定源的语义特征和不同的可信度水平的内容。根据调查结果,源位置影响的来源不同事件的数量,比例和位置也影响社会媒体的语义特征。研究表明,位置影响社会媒体的可信度(6]。概述的基础上的社会媒体信息内容类型之间的关系,未来的信誉模型,建立了适用于不同领域,为研究提供了新的见解来源,信誉,和其他类型的事件的信息。此外,本研究还使用位置的力量来寻找其它方法来评估社交媒体的可信度。Szczepaniuk et al。7)提出了信息安全评估方法在公共管理中,解释基本条款相关的信息安全管理,并定义了条件实现信息安全管理系统。构建安全管理体系范围内的理论考虑,引用、立法、和报告。在2016 - 2019年,实证研究进行了评估的效率,信息安全管理在公共管理办公室。在评估调查结果的同时,也分析了变量之间的统计关系研究(8]。经验数据的结果表明,实现信息安全的公共管理需要一套系统的方法。曹和张9)以微信为例研究突发公共卫生事件信息的可信度影响因素在社会媒体。基于问卷调查数据,用户的信息,信息来源、信息内容和信息环境相比,社交媒体在四维空间,探索突发公共卫生事件信息的可信度影响因素(10]。研究表明,内容客观、用户信任倾向、官方账户专业,和环境外部性反过来有直接和积极的影响在突发公共卫生事件社会媒体的可信度,用户愿意知道和友谊的力量对社会媒体关系有积极的影响。有一个间接的积极影响在突发公共卫生事件在媒体的可信度,还有更复杂的影响各种影响因素之间的关系(5]。

尽管上述传统方法进行了深入研究社交媒体的可信度信息和社交媒体的监督提供了强有力的支持信息,面对巨大的社会媒体的信息,可信度评估的传统方法需要很长时间,不能满足。信息的可信度评估需要及时性。因此,基于传统的方法,评估社交媒体信息的可信度的方法基于用户感知的目的是(7,9]。

论文的研究创新包括以下:(1)一个方法来评估社交媒体的可信度提出了基于用户感知的信息。(2)从三个维度的信誉,信誉来源,和内容的可信度,信息可信度评价维度进行了分析。(3)提取有意义的关键词通过特征选择算法形式在社会媒体信息关键字集群。(4)最后,社会媒体信息的可信度评估实现基于用户感知的理论。

2。社交媒体的可信度评估基于用户感知的信息

2.1。信息可信度评估维度

从公信力的定义可以看出,可信度不是信息本身的属性(11),但一个主观的认知,但如何评估信息的可信度是一个非常重要的研究问题。角度提出不同的可信度评价指标来评估信息的可信度。本文主要从三个方面提取信息可信度的影响因素:主题信誉,信息来源的可信度和内容的可信度。

2.1.1。主题的可信度

不同的主题产生相当大的影响信息可信度评估的准确性。目前,信息在社会媒体可以分为可信和不可信的信息。其中,可信度测量将是不可靠的。是进一步分为极端紧急情况信息,谣言,谎言,假阳性,垃圾邮件12]。娱乐和情感信息的内容主要是由出版商的主观感受和经常包含个人极端的情绪,也没有标准答案或对或错的标准。除了不可预知的意外和独特性,社会新闻热点信息还具有模糊性的特点,容易轻视和夸大事实的用户(13]。科学和健康信息的内容比较专业,和用户参与娱乐和热点新闻相比相对较低。大多数用户发布这样的信息是该领域的专家和学者。他们的信息是相对成熟的和客观的,内容是相对稳定的,这类信息的可信度很高。因此,有必要选择合适的主题作为数据分析的样本。

2.1.2。信息来源的可信度

原始来源和转发源可以算法规则的个人,组织或技术平台。社会媒体的信息来源的可信度一般是指个人或组织的可信度,发布和传播信息,包括行业专家,个人,和政府机构或学术组织发布信息(14]。人的马太效应在各种主题领域具有绝对的声音。在一些社交媒体,一些用户发布信息内容专业信息传播的节点。通常,最初的作者和用户多次转发的信息形成一个复杂的社会网络和信息来源,它有一定的对信息的可信度评价结果的影响(15]。因此,信息无法判断的可信度只有基于数量的喜欢和粉丝的数量。个人信息(专业、专业、信用证书等)的社会用户,支持者的数量,活动,和其他相关指标应通过测量平台。这种测量方法可以在当前社会形势下迅速做出判断。执行全面统计测量的权威和影响力的用户,然后计算量化用户声誉评价结果,并使用这些结果来实现信誉评价。

2.1.3。内容的可信度

信息的可信度评价内容主要包括客观评价,如多个客观指标的分析如文本内容的完整性、语法结构、组织成分、合理性和时效性,和用户感知的评价方法,包括用户问卷调查评分、投诉、建议,获得的评价信息内容质量(16]。然而,随着社交网络的发展,大量的信息样本,他们更愿意实现动态信息的实时评估通过自动监控。然而,目前收到的信息不仅是由词,但也表达了结合图片、视频和音频。信息内容的复杂性带来了一定程度的困难的识别和提取语义特征信息,并增加各种媒体平台的算法处理的难度。因此,如何提高判断的准确性和识别速度信息内容的真实性也成为当前研究的热点和挑战。

2.2。社会媒体信息数据库建设和垃圾邮件处理

根据信息可信度评价维度,建立了社交媒体信息数据库,和社交媒体信息可信度评估是在数据库中执行的,这可以有效地减少无效信息对评价结果的影响,减少评估时间。首先通过文本信息文本分为预处理方法。文本预处理的结果是分词,词性的词,它出现在文章的次数,和之间的从属关系词和文本17]。根据贝叶斯分类算法的要求,它可以知道一个词的类别信息可以通过一个单词的出现频率(18]。因此,数据库层次结构如图1

据社交媒体信息数据库的层次结构如图1,初步社会媒体信息处理的过程。第一个是随机选择一些文件从现有语料库作为本文的培训文档和使用原始的社会媒体信息被章鱼训练数据收集器。然后,收集到的社会媒体信息分为积极的社会媒体信息和消极的社会媒体信息(19]。信息是根据人类的判断。文本是由一组5人,分别评价分为积极的文本和消极的文本,不能判断;得到最终的分类结果相结合的比较结果。然后,计算位置和每个单词的出现次数,最后根据单词的共生关系,给这个词的位置和数量的事件,并将结果存储在数据库中。

由于传统方法没有考虑词汇的分布在文本和类别之间的概率分布,本文使用垃圾文本分类的想法,现在给出以下定义。

如果这个词 任意选择的概率,它属于垃圾邮件文本指的比率 这个词的概率之和 出现在垃圾邮件文本和这个词的概率之和 出现在各种文本的语料库。计算公式是

在这, 代表这个词的次数 出现在垃圾邮件文本 ; 代表总数的垃圾邮件文本; 代表的次数 出现在正常的文本; 表示文本的总量。

社会媒体信息的可信度评估的核心是建立一个分类器分类信息,在文本分类的核心是分类算法。传统算法只能应用于情况是相对独立的词汇。单词之间的关联语义表达和概率计算中忽略的问题之间的关联文本(20.]。本文介绍了语义分析的概念。以这种方式获得的结果考虑词的情况出现在垃圾邮件文本和普通文本和重点转移到垃圾邮件文本分类,解决问题,传统方法没有考虑文本之间的关系。和替换这个词出现的次数与频率的垃圾邮件文本中出现的词,这个词的出现频率在垃圾邮件文本和正常的文本,和替换文本的总数,哪个更有针对性的在垃圾邮件处理,反映出哪种类型的文本这个词更有可能出现在[21]。

2.3。选择社交媒体信息的功能

根据垃圾邮件处理结果2.2社交媒体的有意义的关键词信息提取的特征选择算法,形成集群的关键字。一方面,在信息可信度分类阶段,进一步训练样本提供的文本分类算法;另一方面,在信息可信度深度评估阶段,相似性计算样本数据为谣言提供了检测;因此,需要一个高精度的特征选择算法。在此基础上,提出了一种特征选择算法简短文本(22]。

传统的特征选择算法基于长文本使用TF-IDF方法来计算。算法的概念如下:更高的一个词在文档中出现的概率,比例越小文档的单词在文档的总数;然后,它被认为是伟大的重量。短的文本,它受到的字数的限制。大多数单词只出现一次或两次在信息文本。显然,在文档中出现的单词的频率是不合理的23]。如何计算的重量单词在短的文本是本部分要解决的问题。

根据传统的特征权重计算的想法,这个词的重量

在这, 是短的总数在数据库和文本 代表的数量短一词的文本 出现(24]。

根据实际需要,一个简短的文本特征选择算法相结合的社会媒体信息统计和语义是设计和实现。

原始数据从数据库中抓取标记为 ;然后,功能词集

进行分词和词性,删除停止词词集的特性 ,术语列表 ,在哪里 代表了 - - - - - -th单词和 代表了 - - - - - -th词(25]。

,词性判断执行,直到所有单词都被遍历,单词列表和特征 和noncharacteristic列表 得到了。计算混合词性价值方面的特性词集,计算结果根据大小进行排序,并选择重量阈值(26]。

使用公式(4)之间的相似性计算文本特点:

在这, 表示语义特征的重量; 表示文本相似度值; 代表了语义密度。计算语义相似度的剩余条款完成选择社交媒体信息的功能。图2显示了社会媒体信息特征选择的算法流(27]。

根据图2社会媒体信息特征选择算法主要使用文本的语义特征在表达过程;即词的组合比一个字更有意义。然后,根据所携带的信息量不同的词类,其权重也涵盖不同的特征,单词和句子之间的语义相似度是用来选择社交媒体信息功能。以这种方式的信息特征提取更全面,可以更准确地表示文本的语义(28]。

2.4。社会媒体信息的可信度的评价方法基于用户感知

用户感知理论来源于社会学和目标对象的知觉理解公众。这种理解是处理信息后,用户获得的结果与目标对象相关的信息内容通过信息渠道。在互联网环境下,用户感知是真正的感觉立刻由个人在相互作用的过程中形成各种媒体平台,是用户对平台的总体感觉,产品、信息和服务,是用户交互的结果的形式(情绪、需求趋势,等等)与系统功能和特定环境(22]。用户感知直接关系到用户的满意度,同时也会影响用户的重新选择,和对用户行为至关重要。为了提高用户满意度,本文结合了用户感知理论与社会媒体信息的可信度和将它定义为最直接的和真正的信仰,用户已经形成了在整个使用社交媒体获取信息的过程。知道,法官:分析社会情境通过判断这个媒体的公信力反映的质量信息。收购,然后决定是否生产接受行为(29日]。

通过文献分析,发现研究人员越来越多地倾向于分析外部变量如信息源、信息媒体和信息接受者。因此,根据社会媒体信息特征提取部分2.3,加上用户知觉理论,基于信息沟通理论和信息双重处理理论,和启发式系统认知模型为基本框架,本研究选择信息质量的系统变量研究,传播者的可信度,沟通动机、信息表现形式,和媒体公信力的启发式信息变量,个人信息和信任倾向参与调节变量,和感知信息可信度是因变量。社会媒体信息可信度评价模型如图3

根据社会媒体信息可信度评估模型,社会媒体信息可信度的定义基于用户感知的影响因素,如表所示1

考虑到社会媒体信息可信度的影响因素,采取社会媒体的相关分布信息传输效率为代价函数,社交媒体的平衡分配信息可信度实现:

在这, 代表了剩余价值和分析 代表着稳定周期解的判断参数。根据社会媒体信息可信度评估方法,稳态特性的解决方案 获得,然后稳定时期解决社会媒体获得信息可信度评估 使用二分法的方法。结合二维的网格的结果数据集完成功能分解,结果输出

在这, 代表认可程度的社会媒体信息的可靠性估计。用有限维空间分析的方法,社会媒体信息的可靠性函数获得可靠性评估:

在这, 代表了最好的游戏状态参数的可靠性评估和社会媒体信息 表示特征数据的可靠性评估社交媒体信息。根据可靠性函数,对社交媒体进行融合调度信息评估数据,以便满足社交媒体的统计特征量信息 ,设置评价变量的数量 ,然后是规范化的社会媒体信息的概率

,社会媒体信息评估的可靠性约束函数

在这, 代表了相应的观测值参数和 代表了相应的拟合值参数。融合微分的方法聚类分析用于实现聚类和属性合并处理社会媒体的信息,实现社会媒体信息的优化数学模型的可靠性评估。社会媒体信息的线性拟合结果的可靠性评估

在这, 代表最高评价阈值和最小阈值,分别。

最后,基于用户感知的理论,社会媒体的信息来源和内容变化的过程中跨平台通信可以被跟踪。获得的信息传播路径可以清楚地,它可以与媒体的权威参与通信过程和用户节点的路径。可信度计算结合在社会媒体的可信度信息:

在这, 代表参与传播路径和用户的数量 代表媒体携带信息的数量。总之,社会媒体信息评价方法的优化设计是实现。

3所示。实验设计

为了验证该方法的有效性评估基于用户感知的社会媒体信息的可信度,仿真实验用于验证。在实验中,为了进一步突出该方法的优点,该方法的7)和方法(9)被用作比较的方法来设计对比实验。

3.1。实验平台建设

仿真实验是建立在ISO复位触发器+ + 4.5平台,平台的性能是使用调试器调试最大化实验结果的准确性。ISO复位触发器+ + 4.5仿真平台由一个显示器,一个控制器,监控终端,一台电脑,和一个天线。它的硬件配置的具体参数如表所示2

3.2。社会媒体信息收集和处理

社会媒体信息的收集方法应该综合考虑结合样本数据的应用程序环境。通过跨平台传输路径的信息收集,章鱼收集器收集社交媒体信息用于评估用户参与传输路径的节点。社交媒体的内容是基于用户感知的信息可信度影响因素表所示1。专门收集百度用户回答的问题同意想法近几个月公布的数量动态数字。由于微博和微信用户参与的数量样本数据传输路径是相对较小,微博用户的动态状态阳光信贷和微信官方账户用户的基本属性是直接记录下来。为了确保社会媒体信息的标准化和使用的有效性,避免数据冗余,规则是对收集到的数据。

在上述实验的基础上硬件环境和参数处理,进行了实验验证,并在实验中生成的数据是由Matlab软件进行处理。

3.3。实验结果分析
3.3.1。分析信息可信度的计算结果

箴言多层数据起源模型构建的基础上,收集和记录的跨平台传输路径节点的社会媒体信息,并最终版本的可靠性价值信息的可视化结果具体计算和分析。评价的定量计算结果如表所示3

从信息可信度值表3,可以看出信息的可信度值J在微博微信平台和信息平台更高,和值都大于1,表明该节点具有强大的吸引力。此外,信息的出版商和F,权威信息发布机构,他们的身份验证了微博平台,其用户可信度值高于其他用户。结果表明,该方法的可信度值符合实际情况,进一步验证了该方法的可行性和有效性。

根据比较的结果最终版本的信息可信度值表3,三个平台的信息的可信度评估证明这个实验的准确性和有效性。图4显示的信息可信度值的比较结果最终版本。

根据图4,可以看出信息可信度值的排名的三个平台,信息B和E的可信度值较低。一方面,百度和新浪微博平台不提供信息发布。内容的判断标准规范的具体内容和信息发布者的身份不提供权威认证像其他平台,但只显示发表的大量的阅读内容;另一方面,作为源的信息,这些信息只包含信息发布者的知识和经验,没有被其他专家评估和判断,学者,或媒体上发布的内容的专业性和真实性,所以源信息的可信度值样本数据相对较低。

为了验证该方法是否有优势,社会媒体信息可信度的评估时间作为实验指标来验证不同的方法。对比结果如图5

图分析5可以看出,当使用不同的方法来评估社交媒体的可靠性信息,作为一个整体有下降的趋势,下降的趋势非常明显。相比较,该方法的评价最高的时间是2.2,最低是0.25秒。最大和最小评价时间的方法7)2.4和0.4年代,分别和最大和最小评价时间的方法9分别是2.3和0.3年代。数据显示,该方法的评价时间短。这是因为该方法设计了一个在设计过程评估社交媒体信息数据库,并基于信息可信度评价维度,社交媒体的信誉评价信息在数据库中执行,有效减少无效信息的影响。评价结果的影响,从而降低了评估时间。

4所示。结论

通过研究信息可信度的评价方法,本文强调了社交媒体的特点,与传统媒体不同,构造一个信息可信度模型适用于各种社交媒体,并提高了社交媒体的可信度。准确的评价和分析媒体提供方法论的支持,解决社会媒体信息的可信度和促进信息科学研究的发展。本文全面论述了研究维度信息的可信度,在现有研究的基础上,突破过去相对单一的研究维度,提出了更加丰富和完整的社会媒体信息可信度研究维度和方法。可信度测量模型的基础上总结了信息的特定网站在过去,一个社会媒体信息数据库建立和垃圾短信处理改善社交媒体的信誉信息的准确性。测量和分析提供支持,解决社会媒体信息的可信度。最后,基于用户感知理论,社会媒体信息评估的结果进一步改善,提高信息的可靠性评估的效率,有效管理社会媒体的信息和新思想。

数据可用性

作者批准,使用的数据来支持本研究的结果都包含在这篇文章。

的利益冲突

作者宣称没有利益冲突有关的出版。