raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

复杂性

1099 - 0526 1076 - 2787

Hindawi

10.1155 / 2021/4551067

4551067

研究文章

识别的主要研究领域和次要的研究主题Android恶意软件分析和使用救生设备检测领域

https://orcid.org/0000 - 0002 - 8489 - 5061

Thakur

迪帕克

https://orcid.org/0000 - 0002 - 2370 - 9384

辛格

Jaiteg

https://orcid.org/0000 - 0002 - 6343 - 5197

Dhiman

Gaurav

https://orcid.org/0000 - 0001 - 5106 - 7609

Shabaz

默罕默德

¹ ³

https://orcid.org/0000 - 0002 - 1648 - 7293

基拉

坦尼娅

¹ 王

长

Chitkara大学工程技术学院

Chitkara大学

旁遮普

印度

chitkara.edu.in

政府Bikram商务学院

邦

旁遮普

印度

gbcpatiala.ac.in

亚明奇大学

亚明奇

埃塞俄比亚

amu.edu.et

2021年

7 9 2021年

2021年 12 8 2021年 25 8 2021年 28 8 2021年 7 9 2021年

2021年

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

当代技术确保了高质量的研究数据的可用性在互联网上共享。这导致了一个巨大的可用性研究的文献,使进化本身。因此,识别的核心研究领域和趋势在这样不断发展文学不仅具有挑战性而且有趣。实证的概述当代机器学习方法,它有可能加快在研究文献证据合成,一直解释说。这手稿提出模拟分析研究专家理解趋势(烧焦)框架,它可以执行主观和定量调查在巨大的文学。TRENDMINER用例设计专门为烤焦的框架。TRENDMINER发现语料库444抽象的知识结构的研究(2010 - 2019)期间发表文章在Android恶意软件分析和检测。研究包括三个核心研究领域的识别,27的研究趋势。研究还表明,潜在的未来研究方向。

1。介绍

数据是无处不在的,无论他们是在博客、社交媒体平台,论坛、评论、文学,或研究。提取信息的多维数据不仅是重要的而且也很有挑战性。有一个范式转变不同分区之间的知识转移的研究。手动系统评价( 1)或半自动的 2- - - - - - 4)是两种方法,可以用于系统评价。手动检查更重要,可以有偏见( 5]。重点区域的选择、属性选择和解释完全取决于审稿人的专长。阐述目前的趋势和预测未来的发展方向从现有文献不仅具有挑战性,也为系统的手动审查费时。相比之下,更通用的半自动的方法找到的趋势( 6]。部署在半自动的机器学习技术评估方法可以帮助研究人员获得一个动态审查任何文学作品的选择。这个手稿提供了实证的概述当代机器学习方法,它有可能加快证据合成研究文献中使用模拟分析研究专家理解趋势(烧焦)框架。烤焦的部署类似人类的智能来有效地管理知识和信息。框架利用信息建模技术来模拟人类如何阅读,理解,理解单词的意义,和地图在文本的语义关系。拟议的框架被部署为TRENDMINER烤焦。作为一个用例,语料库与Android的安全使用。在过去的十年中,部分恶意软件的传播以非常高的速度使用持久性和复杂的技术 7]。这种情况导致研究者对设计各种分析、检测、和缓解方法,导致建筑大量文献。连续不断的研究增加安卓平台和恶意软件导致了极大的文学。本研究当代文学提供了众多的研究前景和颁布领域内的挑战。我们所知,没有文献调查这些挑战和研究方向基于使用半自动的机器学习方法。不同于以往的作品,本研究是远远超出任何通用的研究移动攻击向量或防御 8- - - - - - 11]。相反,它面向新兴研究趋势和还建议使用定量的半自动方法未来的发展方向。被采用的技术和所选择的数据集,本研究试图回答以下研究问题框架的研究社区 12]:

RQ1:拟议的框架可以发现研究领域中主要研究人员?

RQ2:这些框架足够健壮以确定最调查研究领域?

RQ3:拟议的框架揭示主题的重点如何在每个核心研究领域随时间改变了?

RQ4:它能展开未来方向的研究领域内选择吗?

众多话题建模技术等潜在语义分析(LSA),潜在狄利克雷分配(LDA),概率潜在语义分析(向量),和相关的话题建模(CTM)进行比较和总结在表 1。LSA发现适合这个工作,因为它成功地部署了各种研究人员分析等领域的研究趋势自愿地理信息( 13),建筑信息模型( 6)、供应链管理( 14),及OpenStreetMap ( 5]。几项研究已经证明了LSA的有效性在构建一个框架,利用semantic-driven分析识别和推断的信息内容。Semantic-driven分析理解的文本结构,单词,和文档中讨论的话题 15- - - - - - 29日]。LSA是值得信任地有效地简化数据恢复和问题。它认可的整体设置,一个词可以显示和数字如何设置一个典型因素解决基本思想。考试在脑科学建议LSA反映了人类大脑筛选的语义内容。

表1

比较的话题建模技术。

技术名称	特征	限制	区域
潜在语义分析	使用奇异值分解特性,LSA可以执行TF-IDF降维。LSA同义词的单词。	专家的帮助总是所需标签的主题。加载值的解释有时变得繁琐。	(我)垃圾邮件过滤(2)自动化论文评分(3)主题识别。

概率潜在语义分析	主题可以很容易地通过多项随机变量来表示。能力部分处理一词多义。	无法执行文档级建模。	(我)自动化论文评分(2)自动化问题的建议。

潜在狄利克雷分配	提供了多项分布在单词和狄利克雷分布的话题。能够处理长度文档。	无法预测之间的关系的话题。	(我)的自动贴标(2)情感话题(3)情绪汇总。

相关主题模型	对主题聚类使用对数正态分布。产生主题图也。	涉及复杂的计算处理。通用词太多可能会导致低效率。	(我)查询分类(2)主题识别(3)图像检索。

作者在 30.)提出了一个方法称为word2vec-based文理学院作为一种新的主题建模技术研究区块链技术的趋势分析。他们提出的方法组成的神经网络嵌入和球形 K——集群。他们还讨论了传统方法的缺点,比如文献和frequency-based分析。他们也将他们的研究结果与查询词。在他们的研究结果,查询不成功捕获文档的上下文,而他们提出的方法能够捕捉真实数据的上下文。作者在 31日)回顾了各种LSA的理论方面和空间模型。他们讨论了各种特征和属性赋予LSA建模技术作为一个合适的话题。他们还透露了一些限制和LSA相关的误解。他们认为,文理学院有很多旅行提供好的结果相比其他模型。未来的范围,他们提到,不同模型的融合会产生一个连贯的生态系统。作者在 32使用LSA)进行文本挖掘和非负矩阵分解(NNMF)。他们讨论了LSA的优势来处理高度稀疏文档矩阵计算开销较小。他们讨论结果和集群的稳定性能,同时部署LSA方法。他们还集成 K——他们提出的集群形成的方法。在[ 33),作者利用LSA重建作为一个应用程序来确定内存。救生设备应用测试,睡眠减少记忆的语义一致性。在[ 34),作者试图使用LSA增加部署内核矩阵估计模糊图像的清晰度。作者在 35)定义的适用性LSA航天科学的确定问题。作者在 36LSA)利用提取特征在不同的信息系统和运营管理等知识领域。在[ 37),作者研究了高等教育技术强化学习的影响。从语料库的话题被发现和分析相关技术强化学习。作者在 38)提出了一种新的分类和未来研究方向在工业使用LSA 4.0。各种研究主题相关领域被发现和讨论。

安卓系统安全是一个有趣的探索领域。恶意软件作者倾向于植物恶意代码矩阵内部合法应用程序解锁他们肆无忌惮的动机。持续的线程的恶意软件扩散让研究团体执行各种研究与Android恶意软件检测和分析技术。文献计量分析或frequency-based等传统方法分析侧重于定量分析而不是定性分析( 30.]。这些方法是高度effort-demanding和耗时,进行趋势分析。作者需要执行全文Android安全领域的调查研究的趋势( 39- - - - - - 41]。这些方法并没有揭示文学的见解,他们认为有限的数据库与有限的时间框架。主题建模技术等潜在语义分析(LSA)已经确认其效用决定全面和详细的趋势分析。研究[ 42- - - - - - 45)见证了使用主题建模识别研究趋势在很大程度上,优于传统方法。表 1显示了LSA的比较与其他主题建模技术。LSA着重揭示了不同主题出现在给定的时间和提供了一个定量和定性评价。结果由LSA帮助从业者追求各种潜在的研究机会。LSA上使用这个矩阵大大减少向量大小语料库和捕捉潜在的主题,而能够推断出有关条款之间的关系和各自的文件,没有任何上下文的损失。

本文的其余部分被安排如下:部分 2描述了简要介绍烤焦的框架。材料和方法讨论了部分 3。部分 4论述了研究问题,并探讨未来的研究方向。部分 5检查大纲建议的解决方案作为一个暗示未来的考试而部分 6讨论调查的局限性。结论和结果讨论部分 7。部分 8探讨了研究的现实意义和未来的途径。

2。提出了烤焦框架

拟议的烤焦框架在给定的序列图 1。

步骤1:这一步涉及数据采集方法,创建存储库和XML解析器,文件转换成文本文件。

步骤2:这一步涉及语料库的数据预处理。停止词和标点符号应该从数据集,它应该规范化之前执行任何文本挖掘的任务。

步骤3:这一步实现了TF-IDF和奇异值分解技术,进一步讨论的部分。

步骤4:这一步涉及核心的识别研究领域和研究趋势。它还侧重于映射的研究趋势与研究领域。

图1

烤焦的框架的序列图。

烤焦框架使用一个叫做LSA语义分析技术。这是一个行之有效的算法将原始非结构化文本数据转换为有组织的信息对象,进一步分析这些对象识别模式学习的启示 2, 46, 47]。它雇佣了一个系统的和全面的方法来发现一个巨大的文学研究的趋势数据集( 3, 21, 24, 25, 48- - - - - - 52]。本研究旨在地图文档和术语的语义关系在大型语料库,揭示了不同上下文使用LSA潜类。

对Android应用LSA安全语料库中的步骤是与之前报道的研究 3, 51, 53- - - - - - 57]。下面的章节将讨论这项研究的详细过程。

3所示。烤焦的用例框架:TRENDMINER

TRENDMINER是烤焦的用例框架将文本文档作为输入,如图 2和 3。444摘要被认为是足够大足够的数据集进行文本挖掘,为解释 3]。Python 3.7编程语言被用来执行所有的实验。表 2显示了我们工作中所使用的软件版本。用于实验的机器配置了英特尔酷睿i5 6200 u 2.4 GHz和8 GB RAM。一次文献数据集在Android上安全TRENDMINER成功上传,这是美联储进一步潜在语义分析(LSA),这是一个TRENDMINER的骨干。文理学院是一个文本数据挖掘、自然语言处理技术用于检索和查询大规模语料库文献[ 51, 56, 58]。作为一个科学和可测量的策略,LSA是用来识别潜在的概念在文本数据在语义级别( 59- - - - - - 63年]。

图2

TRENDMINER上传界面。

图3

TRENDMINER文件被上传。

表2

软件规范。

图书馆	版本	实现TRENDMINER	开源
PDFMiner	≥20140328	用于数据采集(解析pdf文本)	是的
NLTK	≥3.4	预处理(所有任务)	是的
Scikit-Learn	≥0.20 rc1	数据分析	是的

3.1。第一步:数据采集

这部分揭示了关键字,搜索策略,选择标准用于大型语料库做准备。认为数据库是用于研究文章的集合在Android上安全。包含和排除标准应用于改进搜索结果相关的研究文章。存储库是实现标准一致性的研究文章。

3.1.1。任务一:数据准备

第一个任务是准备TRENDMINER文献数据集。随访收集文献数据集的方法主要是专注于Android应用程序的结构,现有的应用程序开发中可能的漏洞以及采用恶意软件识别和缓解的方法。搜索和选择文献采用的策略被定义为3 c的公式,描绘在图 4:

图4

数据集准备使用3 c的公式。

(1)组件1:关键字。文章选择使用关键字如“恶意软件”,“漏洞”,“安全”,“隐私”“监视”“应用程序,”“智能手机”,“android”“病毒”的“静态”,“动态”,“检测”和“数据流”。

(2)组件2:搜索策略。TRENDMINER认为认为研究IEEE Xplore等著名的数据库,ACM计算图书馆,科学指引,施普林格,谷歌学术搜索查询收集高质量的论文在Android恶意软件分析和检测技术。斯高帕斯索引文章从著名的数据库已包括在搜索文献。图 5说明了斯高帕斯的比例在我们的语料库索引文章。

图5

斯高帕斯分配索引数据库的文章。

(3)组件3:选择标准。生从上面提到的数据库结果提炼基于Android操作系统。论文等操作系统塞班和iOS被丢弃。

3.1.2。TRENDMINER任务B:创建一个存储库

Mendeley、工具从爱思唯尔 64年),已被用于建立文献数据库。它提供了一个系统的方法来检索作者,年,抽象的研究论文索引到它的文件系统并导出所有的引用和XML树结构。合成的解析XML树结构在这项研究的一个重大挑战。一个一致的命名惯例为整个文学的数据集是必要的。重命名的文章使用特定对象共同研究文档将会对他们的未来产生重大影响。

模块在TRENDMINER发达,被称为XML解析器。故意生成的XML语料库进一步解析更加结构化的格式,即。逗号分隔值(csv)。图 6显示了泛型转换过程流。

图6

解析一个XML到CSV。

导出文件的元数据信息,比如作者、出版、出版商。以下的观察是在预备考试分析的语料库。基于事件的数据集的数量,最多的顶级研究人员出版物在Android上2010 - 2019年期间安全计算和呈现在图 7。

图7

在Android系统安全的研究人员。

图 8显示了前十五Android安全相关的期刊出版的文章。图 7解释,作者是王,和江,Xuxian,有13出版物,周,12日Yajin密切关注。从分析获得的图上执行所选择的数据集,如上所述。图 8确定电脑和安全(爱思唯尔)和IEEE,最大的出版商,出版在Android恶意软件和安全领域的研究。nds,施普林格,ACM密切关注他们。

图8

顶级期刊上关注Android安全领域。

3.1.3。任务C:解析文本的PDF文档

pdf转换成文本,随后执行数据输入准备,与TRENDMINER兼容。转换过程可用各种工具选项,即PDFMiner Tika, Textract。PDFMiner [ 65年)是选择的实验研究,因为以下好处: (我)

PDFMiner可以获得文本在页面上的确切位置以及字体或行数等信息。

(2)

它促进了PDF文件转化为其他文本格式(例如HTML)。

(3)

它提供了准确的结果即使在极端条件下,如解析大型语料库。

3.2。第二步:预处理文本文件

成功转换为文本文件后,下一步是使用预处理程序。预处理模块TRENDMINER有助于获得质量信息的文本采用适当的预处理技术。对于任何文本挖掘算法,收集数据的预处理是必不可少的一步 66年, 67年]。这涉及驱逐名字、数字、缩写、俚语、首字母缩写、标点符号、和N个字符推荐( 3]。

语料库的预处理涉及下列程序的执行,在Python开发平台使用NLTK的包。NLTK自然语言工具包( 68年]。

3.2.1之上。任务标记()

在这一步中,大块的文本被标记成句子,然后句子成单词。

3.2.2。任务B(删除停用词)

停止词使用NLTK支持和常用单词(样本,良性的,学习、恶意软件检测恶意软件、检测、培训、层、通道,攻击者,密码,市场,电话,警告,算法,安装探测器,插座,等等)被移除。

3.2.3。任务C(归一化)

标准化应用在文字介绍文本文档之间的统一性和一致性维护。标准化的任务是由几个子任务如把标点符号从文本、改变整体内容类似案件中大写或小写,并将数字转换为字。标准化有助于保持所有单词等效平衡允许文本数据的平滑处理。

3.2.4。任务D(阻止和Lemmatizing)

进一步处理的文档,字典的大小必须减少,应该填充独特的单词。阻止和lemmatizing执行的技术减少变形。这个想法是为了减少公共根形式。阻止,基本形式被称为干在lemmatizing的情况下,它被称为一个引理。茎可能不是实际或真正的话说,但另一方面,前题是实际的语言文字。这两个技术帮助实现更快的处理文本文档。

3.2.5。任务E(字符过滤)

所有单词小于长度4都省略了( 3]。

要指出的是,初始数据集包含60184令牌代表的长度在语料库的全部词汇。数据集被用来喂养其他计算步骤之前,它必须是nonredundant和自由从任何类型的噪音。在应用适当的预处理程序如前面所讨论的,单词列表保留了1944令牌。在这项研究中,444个文档,导致单词表的1944令牌代表列和行,分别。创建一个词频率在每学期地图的计数在每个文档中出现的次数。此外,这个矩阵转化为一个加权矩阵使用TF-IDF加权方案。

3.3。步骤3:使用信息建模数据分析和机器学习技术

这项工作利用建模技术来加快数据的信息语料库分析过程。与信息建模和机器学习技术的结合,人类可判断的主题可以从文档中提取语料。机器学习方法提高信息建模技术的能力,允许研究人员智能提取和管理关键的信息做出聪明的决定。部署潜在语义分析(LSA)作为信息建模技术可以自动识别主题和揭开隐藏的模式在广阔的语料库的数据。LSA使用矩阵方法称为奇异值分解(计算)从广泛的矩阵数据构建一个低秩近似。圣言会LSA的主要力量,是一个基本的机器学习算法。它能减少的尺寸数据不丢失大量的信息。主要的思想是应用LSA文档集和非监督机器学习方法在降低维度将组织类似的文件根据他们的领域。 K则,即非监督机器学习方法,安装在LSA模型来发现潜在的语料库的结构。

3.3.1。任务:从文件到Matrices-TF-IDF(词频率逆文档频率)

在这项研究中,文档的映射需要调查的主题,他们都涉及到。最重要的话,确认可以后导致的潜在主题的发现。TRENDMINER利用技术的本质,称为词频率逆文档频率(TF-IDF)。还有其他的加权方法可用于分析。最常见的加权方案TF-IDF log-entropy。按照研究[ 3),一个潜在的弱点log-entropy被发现,它被证明是偏向高频的数据集。例如,log-entropy产生一个更好的结果与文章标题或与一个简短的文本文件。TF-IDF执行更好的发现模式在大型的语义空间更大的组。出于这一发现,我们利用TF-IDF技术研究中的加权法。

潜在语义分析(LSA)主题模型算法需要document-term矩阵作为主要输入。TF-IDF有助于保持document-term矩阵描述术语的频率出现在文档的集合。文档和词在一个矩阵对应列和行,分别。TF-IDF已经广泛使用了更好的主题分析( 3, 69年, 70年]。结果document-term矩阵的例子在前面的例子提出了表 3。

表3

Document-term矩阵描述的频率。

条款	Doc1	Doc2	Doc3	Doc4	Doc5
访问	0	0	0	0	1
品	1	1	1	1	1
日历	0	1	0	0	0
连接	0	0	1	0	0
联系	0	1	0	0	0
呆立	0	0	0	1	0
数据	0	1	0	1	0
德维克	2	0	0	0	0
确切的	0	0	1	0	0
找到	0	0	1	0	0
Identifi	1	0	0	0	0
就像	0	1	0	0	0
列表	0	1	0	0	0
Locat	0	0	1	0	0
Malwar	1	1	0	1	0
Messag	0	0	0	0	1
甜点	0	1	0	0	1
网络	0	0	1	0	0
数量	0	1	0	0	0
电话	0	1	0	0	0
读	1	0	0	0	0
记录	0	0	0	1	0
发送	0	0	0	1	0
服务器	0	0	0	1	0
塔	0	0	1	0	0
跟踪	1	0	1	0	0
Uniqu	1	0	0	0	0
Usag	0	0	0	1	0
用户	1	1	1	0	0
各种各样的	0	0	0	1	0
无线网络	0	0	1	0	0

(1)特遣部队(频率)。It过程标准化的术语频率(TF),确定为一个词出现频率在一份报告中,被记录的完整的术语,指的是方程( 1)。TF矩阵如表所示 4: (1) 特遣部队 t , d = 数出现的术语 t 出现在文档 d 在文档总数的术语。

表4

词频率分数为每个文档。

文档	词频率分数
Doc1	{“Malwar”: 0.1111111111111111,“品”:0.1111111111111111,“读”:0.1111111111111111,“uniqu”: 0.1111111111111111,“德维克”:0.2222222222222222,“identifi”: 0.1111111111111111,“跟踪”:0.1111111111111111,“用户”:0.1111111111111111}

Doc2	{“Malwar”: 0.09090909090909091,“品”:0.09090909090909091,“甜点”:0.09090909090909091,“用户”:0.09090909090909091,“数据”:0.09090909090909091,“喜欢”:0.09090909090909091,“电话”:0.09090909090909091,“数量”:0.09090909090909091,“接触”:0.09090909090909091,“名单”:0.09090909090909091,“日历”:0.09090909090909091}

Doc3	{“品”:0.1,“跟踪”:0.1,“确切”:0.1,“locat”: 0.1,“用户”:0.1,“发现”:0.1,“无线”:0.1,“网络”:0.1,“塔”:0.1,“连接”:0.1}

Doc4	{“malwar”“各种”:0.1111111111111111:0.1111111111111111,“品”:0.1111111111111111,“记录”:0.1111111111111111,“呆”:0.1111111111111111,“usag”: 0.1111111111111111,“数据”:0.1111111111111111,“发送”:0.1111111111111111,“服务器”:0.1111111111111111}

Doc5	{“访问”“品”:0.25:0.25,“messag”: 0.25,“甜点”:0.25}

(2)IDF(逆文档频率)。这估计是多么重要的一个术语。IDF的对数处理的数量记录在语料库孤立的数量报告特定的词出现的地方。尽管如此,它是意识到特定的术语,例如,“,”“的”和“,”或空间明确的话说,似乎很多次但是没有意义。通过这种方式,需要过载连续条件,同时增加罕见的,通过计算条件2。IDF网格介绍表 5: (2) 以色列国防军 t , d = 日志文档的总数文件的术语 t 在这。以下方程( 3)提出了TF-IDF分数: (3) w t , d = 特遣部队 t , d × 日志 N d f t 。

表5

逆文档频率分数为每个术语。

条款	IDF得分
访问	2.098612
品	1.000000
日历	2.098612
连接	2.098612
联系	2.098612
呆立	2.098612
数据	1.693147
德维克	2.098612
确切的	2.098612
找到	2.098612
Identifi	2.098612
就像	2.098612
列表	2.098612
Locat	2.098612
Malwar	1.405465
Messag	2.098612
甜点	1.693147
网络	2.098612
数量	2.098612
电话	2.098612
读	2.098612
记录	2.098612
发送	2.098612
服务器	2.098612
塔	2.098612
跟踪	1.693147
Uniqu	2.098612
Usag	2.098612
用户	1.405465
各种各样的	2.098612
无线网络	2.098612

在方程( 3), t意味着条款, d意味着每个记录 N显示完整的报告。考虑表 6,地址最近的报告词格得分TF-IDF表达模型。学期将有巨大的体重的时候遇到整个语料库存档还不一致。恶意软件可能这个词经常出现在存档,但因为它是完全可能的合理预期剩余的语料库。披露之间的连接词和记录和捕捉潜在的主题在Android安全数据集降维必须被执行,如在以下区域检查。

表6

TF-IDF代后改变了词的频率。

条款	Doc1	Doc2	Doc3	Doc4	Doc5
访问	0.000000	0.000000	0.000000	0.000000	0.589463
品	0.160859	0.164157	0.165134	0.176043	0.280882
日历	0.000000	0.344502	0.000000	0.000000	0.000000
连接	0.000000	0.000000	0.346553	0.000000	0.000000
联系	0.000000	0.344502	0.000000	0.000000	0.000000
呆立	0.000000	0.000000	0.000000	0.369447	0.000000
数据	0.000000	0.277942	0.000000	0.298067	0.000000
德维克	0.675160	0.000000	0.000000	0.000000	0.000000
确切的	0.000000	0.000000	0.346553	0.000000	0.000000
找到	0.000000	0.000000	0.346553	0.000000	0.000000
Identifi	0.337580	0.000000	0.000000	0.000000	0.000000
就像	0.000000	0.344502	0.000000	0.000000	0.000000
列表	0.000000	0.344502	0.000000	0.000000	0.000000
Locat	0.000000	0.000000	0.346553	0.000000	0.000000
Malwar	0.226081	0.230717	0.000000	0.247423	0.000000
Messag	0.000000	0.000000	0.000000	0.000000	0.589463
甜点	0.000000	0.277942	0.000000	0.000000	0.475575
网络	0.000000	0.000000	0.346553	0.000000	0.000000
数量	0.000000	0.344502	0.000000	0.000000	0.000000
电话	0.000000	0.344502	0.000000	0.000000	0.000000
读	0.337580	0.000000	0.000000	0.000000	0.000000
记录	0.000000	0.000000	0.000000	0.369447	0.000000
发送	0.000000	0.000000	0.000000	0.369447	0.000000
服务器	0.000000	0.000000	0.000000	0.369447	0.000000
塔	0.000000	0.000000	0.346553	0.000000	0.000000
跟踪	0.272357	0.000000	0.279596	0.000000	0.000000
Uniqu	0.337580	0.000000	0.000000	0.000000	0.000000
Usag	0.000000	0.000000	0.000000	0.369447	0.000000
用户	0.226081	0.230717	0.232090	0.000000	0.000000
各种各样的	0.000000	0.000000	0.000000	0.369447	0.000000
无线网络	0.000000	0.000000	0.346553	0.000000	0.000000

3.3.2。任务B:学习文档之间潜在的关系使用圣言(LSA)

利用奇异值分解,两组载荷矩阵是LSA的生产作为输出。一个是document-to-topic矩阵和另一个是一个term-to-topic矩阵。主题的解决方案是研究主题文献中数据集的数量。高项或文档加载在基质细胞透露一个特定的词或文档更倾向于一个特定的主题的解决方案。研究人员可以调整一些主题的详细级别的解决方案识别研究领域和发展趋势。较小的价值观主题解决方案的代表共同研究的核心领域,和更高的价值主题解决方案的代表主要研究趋势 51]。

截断奇异值分解是一个框架variable-based数学方法,分解TF-IDF晶格分为三个网格的结果: U , Σ , 和 V 。圣言会解体所示 (4) 一个 = U × Σ × V T 。

在这里, 一个地址TF-IDF晶格, U地址document-to-topic框架描述文件附加到不同的概念之间的关系, V 地址term-to-topic描述概念和术语之间的关系,和 Σ 由非负数字。

假设 d记录的数量, t是文件的条款, k被认为是hyperparameter示威的点的数量从语料库中分离出来。一个_k是矩阵的低秩估计一个并且可以利用缩短圣言会继续在交付 (5) 一个 k = U k × Σ k × V k T , 在哪里 U_kdocument-to-topic矩阵( d× k), V k 是一个term-to-topic矩阵( t× k), Σ k 是一个话题到另一个话题矩阵( k× k)。表 6显示了词频率后续应用TF-IDF改变。计算过程必须应用到TF-IDF矩阵中引入表 6。

表 7和 8包含的因子载荷值任意积极和消极。条款和文件的设置需要映射的潜在主题。解释加载值的意义,被称为方差极大旋转技术是应用于术语和文档加载矩阵。方差极大旋转有助于揭示的最佳关联的潜在主题。旋转放大协会条款和文件的主题。此外,需要选择阈值发现重要的讨论( 3, 5]。经验概率分布是用来选择的阈值不同因素的解决方案。加载值转换为一个向量,按照降序排序,从而将阈值定义为保留1 / n的载荷 n解释的因素的解决方案( 5, 6]。对每个因素的解决方案,加载值分组,考虑他们的绝对值推出潜在的主题。作为应用程序的LSA其次是一种无监督的机器学习方法,进一步讨论了,它将有助于识别主题的解决方案。

表7

Term-loading五个潜在的主题。

	话题1	话题2	话题3	主题4	主题5
访问	0.198118	−0.244194	−0.399978	0.007002	−0.317144
品	0.348381	−0.034393	−0.080514	−0.037085	−0.120670
日历	0.166381	−0.098917	−0.004802	0.024460	0.299730
连接	0.107482	0.219059	−0.075849	−0.241415	0.008454
联系	0.166381	−0.098917	−0.004802	0.024460	0.299730
每天	0.128417	−0.108420	0.265857	−0.127129	−0.161347
数据	0.237841	−0.167279	0.210618	−0.082833	0.111647
Locat	0.107482	0.219059	−0.075849	−0.241415	0.008454
Malwar	0.284974	−0.031505	0.205508	0.104866	0.037136
Messag	0.198118	−0.244194	−0.399978	0.007002	−0.317144
甜点	0.294076	−0.276820	−0.326574	0.025384	−0.014050
网络	0.107482	0.219059	−0.075849	−0.241415	0.008454
数量	0.166381	−0.098917	−0.004802	0.024460	0.299730
电话	0.166381	−0.098917	−0.004802	0.024460	0.299730
读	0.130719	0.160295	0.045805	0.259253	−0.082933
记录	0.128417	−0.108420	0.265857	−0.127129	−0.161347

表8

文档加载与五个潜在的主题。

	话题1	话题2	话题3	主题4	主题5
Doc1	0.542964	0.677204	0.434886	0.487392	0.471276
Doc2	0.491949	−0.297480	0.654891	−0.304044	−0.429196
Doc3	0.129873	−0.013342	−0.209489	0.688773	−0.649469
Doc4	0.640698	0.592341	−0.581166	−0.287077	0.919112
Doc5	−0.189251	0.670234	0.187921	−0.336431	−0.414465

TRENDMINER用于识别的核心研究领域和重要研究趋势Android安全,和一个最优值 k主题的解决方案必须确定。选择一个最优值 k永远是一种挑战;因为尺寸的数量越多 k选择越多,将感应噪声的数据的风险 58, 71年]。然而,与此同时,选择一个较小的值 k会导致失去重要的语义。这是一个很好的实践,包括一个更大的 k作为一个方法来演绎更多的趋势或许多趋势到一个单独的类别进行分类 72年]。一个 k迭代过程已经应用于揭示的核心研究领域及其子分类相关的趋势。圣言会提供了矩阵奇异值的定义为特征值的平方根。这些值提供概念的力量和按降序排列。的 k奇异值选择使用一块小石子如图 9。如研究[ 24),高水平的主题必须选择使用实证方法,涉及多个LSA的试验。许多因素在个别试验范围从2到10。分别在回顾/文档的每个因素解决方案方面,专家决定设置三个核心高层研究领域。应该注意的是,它还取决于选择的语义空间的实验。

图9

小石子阴谋。

此外,根据专家意见和小石子情节分析( 14, 73年维度),27日的主题是重要的手肘测试点通过迭代发现对数似然比特征值( 74年]。最优数量的27主题解决方案可以被认为是最佳的描绘一个大型语料库的研究趋势在Android安全;此外,三个主题的解决方案被认为是描述的核心研究领域。主题聚类、主题标签,详细分析在进一步讨论部分。

3.3.3。任务C:主题聚类

所( 3),聚类和因子分析是两个分析步骤参与post-LSA程序。作者讨论的主要事项,让从业人员、决策者、研究部署这些分析步骤按他们的需求。他们专注于LSA一直用于聚类和因子分析的目的。基于语义空间创建在这项研究中,领域专家决定追求集群技术。通过聚类的方法实现 K则算法。可以使用机器学习的结果在潜在语义分析的应用显著减少手动工作由领域专家在确定文档最亲密的话题。 K则是一种无监督的机器学习技术时通常使用没有标签的数据点,学习他们基于向量空间的相对位置。质心特征权重可以用来识别集群而定义组织的性质,可用于标签新数据( 75年, 76年]。 K则很容易实现,可以处理非常大的样本 77年]。通常,输入 K则是通过一个降维算法。文理学院, K——应用于线性组合的解释结果发现类似的文档及其关联条款中包含的文本语料库[ 78年- - - - - - 80年),完成推荐研究论文对应于一个特定的主题标签。结果的解释是特定于域的。例如,如果数据点在广泛的文献,研究文章在Android上安全 K则将隔离整个文档 k子组。的安卓系统安全域的研究趋势是每个子群或集群的一部分有一些共同的特征,用于进一步分析。集群的数量被选为三,选择迭代完成的。是指出,太少的选择集群可能不显示实际的潜在关系,而集群可能占太多噪音,不会用于任何进一步分析输出。输出,在多维数组的形式,是由所有文档的标题集群贴上相应的数字。把组件的点积获得LSA与集群重心,获得的结果排序,只显示前主题对应于每个集群,需要合理的话题标签作为下一节讨论。

3.3.4。任务D:主题标签

term-to-topic和document-to-topic矩阵包含重要值来揭示主题。每个细胞在两种矩阵表示的加载值后在降序排序。前面的步骤的结果TRENDMINER成为成功的话题标签输入。分别条款和文件一起检查和合理的标签有三个和27主题的解决方案,如图 10和 11。我们已经实现了德尔菲法( 81年)执行主题标签的过程。德尔菲法的图形表示也显示在图 12。主题标签是一个集体智慧的任务,涉及最可靠的一组专家的意见。Delphi方法是一个迭代的方法,监测和控制工作的反馈机制来构建健壮的共识。

图10

映射3.2核心研究领域和发展趋势。

图11

映射3.3核心研究领域和发展趋势。

图12

德尔菲法的工作流程。

3.4。步骤4:结果和发现

因此,三个主题的解决方案目前主要的核心研究领域,如图 13和 14随着明智的话题标签。每个主题的解决方案来标示 Tm.n在哪里米表示主题的解决方案而 n表示一个 nth的因素米主题的解决方案。例如,T27.3说明了27主题的第三个因素的解决方案。所有点的绘制图形化表达安排同样给计数每个主题的出版物分销解决方案三个独特的时期内2010 - 2019,如图 13和 15。检查与科目安排有关地址分布的意义比较研究区域内部,主题安排。此外,揭示考试模式和未来安卓领域的安全范围,27点安排被发现数据中所描绘的一样 (15日)和 15 (b)。27日主题之间的语义关系安排和三个核心研究领域协助识别研究模式在每个中心勘探区安卓系统的安全性、数据的描述 10和 11。

图13

出版数三因子解决方案在三个不同的时期。

图14

词云TRENDMINER三主题生成的解决方案(一)- (c)。3.1 (a)词云主题的解决方案。3.2 (b)词云主题的解决方案。3.3 (c)词云主题的解决方案。

(一) (b) (c)

图15

27因素解决方案在三个不同的时间段(a)和(b)。

(一) (b)

3.4.1。任务:识别安卓系统安全的核心研究领域

核心研究领域如图 13发现了三个主题的解决方案,专注于“应用程序结构分析”(T3.1)、“静态级别监控”(T3.2),和“自动恶意软件分析”(T3.3)。这个词云解决方案如图三个主题 14。这些文章强调必要的技术分析、检测和评估Android恶意软件。

结果表明,各种high-stacking分布与勘探地区之一,即。“静态级别监控”(T3.2)安排的三个主题。静态调查是最常用的检查恶意软件战略调查;因此,很明显,“静态级别监控”(T3.2)住在移动勘探地区随着时间的推移,2010 - 2019。结果同样表明,“自动恶意软件分析”(T3.3)此外变成了一个移动的勘探地区在2015年- 2019年。然而,“应用程序结构分析”(T3.1)影响较小的论文收集在这个研究。

语料库的方法依赖于静态监测(T3.2)是最著名的技术水平(大约74%)利用科学家捕捉到安全危险的Android系统。恶意软件自动分析(T3.3)约为20%,和应用结构分析(T3.1)为6%。2009年首次介绍了静态分析技术( 82年),在2010年,和动态分析技术最初是由研究人员探索( 83年, 84年]。前调查违反安全策略的应用程序的数据流存储在应用程序的配置。后者确定了数据泄漏敏感的应用程序的来源。尽管静态和动态方法,存在两个半斤八两的混合方法,利用静态和动态等调查。这些技术通常首先应用静态调查识别潜在的安全威胁在Android系统和执行动态过程来提高其准确性,摒弃虚假警报。例如,在[ 85年),作者首先使用了静态调查区分可能脆弱的应用程序。

3.4.2。安卓系统的任务B:识别安全研究趋势和任务C:核心研究领域和趋势的映射

TRENDMINER发现27日主题核心研究趋势显示在数字 (15日)和 15 (b)。数据 10和 11显示核心领域的研究主题的关系。执行依赖于相似性得分的关系。文档被聚集到一个较小的许多主题的解决方案作为一个开始,而以后选择更高的价值。点比较过去在某种程度上被确认和检查之前,利用相似分数。相似分数确定,因为字符串协调,字符串比喻表示亲密的主题安排的低和高的优点。这样做是为了验证结果而选择一个低价值的理解主题的解决方案会有所对应在选择一个相对较高的值。相似分数存在一个合理的连接核心领域和他们之间的连接模式,这同样批准创建的技术来显示他们的语义关联。

(1)应用结构分析(T3.1)。基于元数据的趋势研究(T27.4)和应用水平特性(T27.2)揭示了利用元数据。这种模式被发现在系统命名WHYPER [ 86年),研究者们提到的应用程序的开发者的权限,利用自然语言处理(NLP)算法来搜索应用程序描述句子提供了合法的要求提到的权限。同样,在另一个工作,加速了会计的研究元数据附加信息,如应用程序的屏幕截图,价格,类别、标题、开发者ID,网站,宣传视频。此外,应用程序元数据的分析是使用机器学习算法执行。应用程序级别的趋势特征(27.2)展开的使用CPU和内存使用情况跟踪恶意应用程序。在项目命名为夫人,运行的进程、CPU利用率、内存状态,wi - fi,蓝牙设备的被认为是训练 k最近邻居算法有效检测( 87年]。

(2)静态水平监控(T3.2)。它是最调查研究领域。图 1027主题的解决方案表明,二十研究趋势等目的监测(T27.15),类型和模型Checking-Based分析(T27.5),内存映射(T27.18),符号执行(T27.9),过程间控制流图(T27.16),分析基于网络地址(T27.1),程序切片(T27.25),上下文敏感(T27.22),基于文本分析(T27.26),磁场灵敏度(T27.19),基于分析(T27.11),采用分析(T27.21),数据流跟踪(T27.6), Dex文件(T27.7),研究对象的敏感性(T27.3),流敏感性(T27.24)污点分析(T27.27),硬件组件的检查(T27.12),估计在字符串匹配(T27.8)和路径敏感(T27.13)映射到T3.2。

在主题的解决方案采用分析(T27.21),授权扮演不可或缺的组件报复性的应用程序的检查,因为大多数操作需要显式的同意记忆完成的最终目标 88年]。权限清单文件中声明,因此,容易获得。许多系统,在研究开发( 86年, 89年, 90年),使用静态检查来评估风险的Android同意系统和单独的应用程序。

另一个重要研究趋势成为分析基于网络地址(T27.1),专注于网络地址。恶意软件作者利用网络地址建立通信与指挥控制(C&C)工人发送客户的机密信息。分析人士发现IP地址是一个关键的静态组件进行调查( 91年- - - - - - 93年]。

另一个考试模式,出现在这个空间研究敏捷记录(T27.7),发挥了至关重要的作用在理解敏捷文件,通常难于解释的人类。认识到恶意代码部分,科学家首次对敏捷代码进行反编译等更多可能的组织收集、Smali, Dalvik字节码,源代码,容器,Jimple或Java字节码( 94年]。这一趋势可以进一步与大量文章和工具部署人员dexdump[等成功的翻译 95年],飞马[ 96年],d [ 97年),南非空军( 98年],PScout [ 89年],AppSealer [ 99年),d /敢[ One hundred.],dedexer [ 90年],dex2jar [ 101年],FlowDroid [ 102年]。

核心研究领域发现了有趣的研究趋势等数据流跟踪(27.6),过程间控制流图(27.16),(27.11)和基于分析。所有出现的趋势与一个有趣的和关键的分支领域的静态安全机制来识别强占了安卓系统的漏洞。数据流跟踪(T27.6)处理跟踪敏感信息的流动从设备向外部实体应用程序执行时( 103年- - - - - - 107年),是重要的和一致的主题。流检测和控制流信息调查帮助理解保护泄漏等危险的实用性和沟通政府滥用( 95年, 108年, 109年)通过跟踪信息的流动在不同的执行。

字节码控制流图调查识别所有可能的方法,应用程序可以同时执行。这些推断趋势有助于培养推进调查,通过创建控制流字节码图(CFG) intraprocedural分析或过程之间的调查(跨越不同的策略)。创作者在[ 110年)正式Dalvik字节码到控制流investigation-based语义标记识别恶意软件应用程序。研究[ 89年, 95年, 96年, 102年, 104年, 108年, 111年)利用趋势数据流跟踪(27.6),过程间控制流图(27.16),(27.11)和基于分析。

意图的趋势监控(T27.15)相关概念,应用程序清单文件中声明的意图能够足够的泄漏数据服务器。意图对象用于从一个活动到另一个利用Android应用程序的小部件。从一项活动开始,开始一个服务,和交付的三个基本用例是一个广播的意图,有助于在几个方面建立组件之间的通信。这一趋势是流行的研究发现 91年, 112年]。前者使用很多机器学习算法等 K则, k最近的邻居,朴素贝叶斯分析的意图,权限,组件和api从清单文件中提取。后者采用支持向量机来检测恶意软件,实现94%的检出率。另一个趋势的硬件组件的检查(T27.12)反映了硬件组件的分析中列出申请静态调查。研究人员在 91年)利用组件清单文件中声明进行分析。这可以令人信服的恶意应用程序与特定需求阐述了所有的硬件,例如,摄像头,GPS和麦克风。

估计在字符串匹配(T27.8)被发现在这个领域另一个重要趋势,分析发现在各种字符串可以在Android应用程序。的研究人员完成的工作( 113年)表示,这是一个广泛使用的策略来识别恶意软件通过分析字符串,可以在安卓文件。科学家利用向量空间模型(VSM) ( 114年)和处理字符串作为一个多维向量空间。除此之外,科学家们利用估算距离曼哈顿距离、欧氏距离,余弦相似性学习数据的不规则性。研究人员评估了超过666个样本的Android应用程序和结果的测试完成了83.51%的准确率。

(3)自动恶意软件分析(T3.3)。图 11T3.3下展示了研究趋势。这个核心研究探讨了研究趋势模式评估(T27.20),输入匹配(T27.14),重新打包应用程序识别(T27.23),正式的分析(T27.10)和机器学习方法(T27.17)相关的自动化识别Android恶意软件。收集一组预定义的应用特性,研究人员重点首先分析应用程序的静态或动态。此外,建立检测模型能够识别恶意软件和良性的应用程序基于训练数据集。趋势也证明了探索和有前途的研究人员使用许多不同的特性,比如API调用序列的组合,许可要求,包装信息,硬件组件、应用程序类别,和网络活动建立检测模型,在研究[ 91年, 115年- - - - - - 118年]。另一个探索模式,出现重新打包应用程序识别(T27.23)。很多文章等( 119年]近年来有关这一趋势发表。DroidMoss [ 88年],Droidsim [ 120年],DNADroid [ 121年],ViewDroid [ 122年],ResDroid [ 123年],AnDarwin [ 124年)见证了驯服重新包装的问题。

趋势模式评估(T27.20)发现了这一事实,攻击者可以推断出用户的敏感信息通过访问共享资源的行为模式。这一趋势的影响已经在各种各样的文章( 125年- - - - - - 129年),侧槽通信是妥协来推断机密的输入模式如针,密码,或屏幕水龙头。

4所示。讨论和潜在的未来的发展方向

本节确定的结果TRENDMINER可以用来回答节中提到的研究问题 1。

4.1。RQ1:拟议的框架可以发现研究领域中主要研究人员?

数据 7和 8现在的顶级期刊和Android安全领域的主要研究人员。的一些顶级期刊列表包括计算机和安全、IEEE法医和安全事务上的信息,未来一代计算机系统,信息安全与应用程序和网络和计算机应用》杂志上。苏亚雷斯Tangil有重大贡献的科研界谁陷害了各种防病毒技术,如Alterdroid [ 130年,树状的 131年],Droidsieve [ 132年]。一个完全自动化的恶意软件识别机制明显的准确性82.93%已经被王陷害et al。 133年]。Enck et al .,提出一个项目名为Taintdroid [ 83年),是这个领域的主要研究人员。他发明了一种有效的模型跟踪敏感信息泄漏的第三方应用程序。除此之外,许多其他动态分析工具如Andrubis [ 134年]和Droidbox [ 135年被部署。他第一次执行设备内置恶意软件评估,作者定义的一组规则来识别危险权限授予在安装应用程序之前,由安全服务称为麒麟( 136年]。检测内核级攻击,燕和阴提出一个项目名为Droidscope 137年),这是一个独特的方法保持其动态分析的过程模拟器,可以达到不错的效果。Faruki et al。 138年)提出了一种方法叫做Androsimilar生产是通过将明显强大的组件,来识别有害的Android应用程序。提出的策略是强大的代码时和重新包装方法,一般还会造成隐藏已知恶意软件的变化通过避免AV签名。

4.2。RQ2:这些框架足够健壮以确定最调查研究领域?

考试的结果表明,静态级别监控(T3.2)一直是最通常在Android恶意软件调查和研究点的位置。静态下的策略运用水平监测(T3.2)分析了代码没有Android模拟器或设备上运行应用程序。静态调查的好处是,计算费用低,不沉闷,和低资产使用。图 16显示,大部分的下降趋势倾向于主题的解决方案静态监测(T3.2)水平。20的研究趋势,11这种趋势显示在时间框架2显著上升(2015 - 2019)比时间1 (2010 - 2014)。变化的速度从0.82%到4.01%不等。9这种趋势显示时间框架2中垮台。考试在这个工作发现,研究发现静态显著水平观察围绕网络地址,信息流、控制流、字符串协调,批准,敏捷文档,设置,和目的。

图16

影响时间2015 - 2019年期间的研究趋势。

静态监测水平成为一个重要的技术来完成各种检测私有数据泄漏等安全问题,检测组件劫持或意图注入,建筑框架组件之间的漏洞和内容机构漏洞,危险的恶意应用程序所使用的权限,能源消耗问题通过Android应用程序,Android应用程序复制检测相比,自动测试生成测试用例,并通过代码检查Android应用程序的正确性验证。经过进一步的调查,我发现有各种工具可用于静态监测,如烟尘,Dex2jar, Dexdump, Dedexer, d,敢和WALA。烟尘是最支持工具采用静态监测、Jimple是广泛使用的中间表示(IR)格式为Android应用程序的进一步分析。图的趋势线 16说明具体的研究趋势东方敏感性。敏感性最大化静态监测的精度和召回。趋势领域的研究敏感性(T27.19),上下文敏感(T27.22)和流敏感性(T27.24)主要是考虑Android研究社区。其他研究的趋势,如路径敏感(T27.13)和对象的敏感性(T27.3),没有得到研究人员的广泛关注。趋势线还透露,污染趋势分析(T27.27)广泛应用于数据跟踪成为最应用技术在静态监测。

4.3。RQ3:拟议的框架揭示主题的重点如何在每个核心研究领域随时间改变了?

在这项研究中,2010 - 2014和2015 - 2019两个时间框架被用来维持有效的解释和比较的话题之一。表 9显示各个核心研究领域的主要话题的焦点改变随着时间的推移。它描绘了范式转变的时间窗口从2010 - 2014到2015 - 2019。这项研究提出以下看法: (一)

机器学习方法被证明是令人信服的其他严重的方法在Android恶意软件的位置。这些方法都是在调查,并承诺期间2015 - 2019。

(b)

检测应用程序使用的图表调查/信息随后使用人工智能计算,期间2015 - 2019。

(c)

权限已经发现很可能最利用静态元素识别Android恶意软件应用程序。在2010 - 2019年的流行趋势。一些特定的权限清单文件中声明激活某些事件在一个Android生态系统。

(d)

静态分析在很大程度上是由研究人员解决安全和隐私问题,由于其易于实现。然而,静态分析是脆弱的隐形技术,如加密和本机代码,导致垮台的使用纯静态的解决方案。然而,它仍然是受欢迎的在研究社区。

(e)

在出版物污点分析是一种广泛应用的技术。这种信息流分析的对象是污染使用数据流分析和跟踪。

(f)

在2015 - 2019年,一个研究趋势成为“分析基于网络地址”(T27.1),专注于网络地址。恶意软件作者利用网络地址建立通信与指挥控制(C&C)服务器发送用户的个人机密数据。研究人员发现网络地址作为一个关键的静态特性进行分析。

(g)

这种趋势“文本分析”(T27.26)依赖于提取关键短语和关键字,例如,敏感的api和权限分析。这一趋势在2015 - 2019年的时间框架。

(h)

这种趋势“象征性执行”(T27.9)显示2015 - 2019年的时间框架的垮台。它处理生成所有可能的程序输入探索所有条件分支内的路径。这一过程可能耗时,因此变得不那么流行的研究社区在2015 - 2019。

(我)

另一位研究趋势,出现“重新打包应用程序识别”(T27.23)。重新包装是一种流行的技术被受雇于恶意软件作者产生欺诈重新打包的应用程序。很多文章都与这一趋势发表在2015年至2019年的时间框架。

(j)

“基于元数据的研究趋势”(T27.2)发现了利用元数据来识别和解剖Android恶意软件应用程序。元数据包括必需的授权、描绘、形式,最后刷新,评级机构,工程师数据。2015 - 2019年期间这种模式遇到失败。

(k)

表 9显示,这一趋势“程序切片”(T27.25)已经形成势头在2015 - 2019。“程序切片的趋势”(T27.25)指定技术通过关注语义的选择方面简化了程序。切片避免程序的部分可能没有恶意的行为引起的,而不是只关注那些部分可能包含恶意行为的程序。这种技术会减少程序行为的集合,从而成为趋势在2015 - 2019。

(左)

趋势”字段敏感性”(27.19)似乎是最被认为是在所有的敏感性,表中描述 9。这可能是由于原因由于Android应用程序是用Java编写的,面向对象的语言对象字段在哪里普遍用于保存数据。研究趋势,如“上下文敏感”(T27.22)和“流敏感性”(T27.24)也在很大程度上考虑。至少考虑灵敏度是“路径敏感”(T27.13)和对象的敏感性(T27.3);或许,正是因为它提出的可伸缩性问题。

(m)

”类型的趋势和模型Checking-Based分析”(T27.5)突然下降期间2015 - 2019。当一个开发Android应用程序对于某些任务,通常定义一个应用程序必须满足特定的属性。模型检查有助于确保给定系统满足给定的规范或正确性的属性。类型检查确保给定的程序是类型安全的通过保持类型错误的可能性(例如,应用整数操作浮点数字)降到最低。

(n)

另一个研究的趋势是“Dex文件研究”(T27.7),发挥了至关重要的作用在理解敏捷文件是受欢迎的在2010年至2014年的时间框架。敏捷代码通常由人类繁琐的解释,因此显示了在2015 - 2019年垮台。

(o)

研究趋势”采用分析”(T27.21),权限清单文件中声明,因此,容易获得,这可能是它的流行的原因研究人员在2010 - 2014。然而,检查只在检测恶意应用程序权限不是有用的。因此,这种趋势出现在2015 - 2019年垮台。

(p)

有趣的研究趋势,如“数据流跟踪”(27.6),(27.16)“程序间控制流图”,和“基于分析”(27.11)的数据结构分析。数据流分析和控制流分析有助于了解不安全功能,如隐私泄露和滥用的电话服务跟踪信息的流动在不同的执行。字节码的优点是控制流图调查识别所有可能的方法,应用程序可以同时执行,因此流行期间2015 - 2019。

(问)

“目的监测”的趋势(T27.15)与概念,应用程序清单文件中声明的意图能够足够的泄漏数据服务器。意图对象用于从一个活动到另一个利用Android应用程序的小部件。从一项活动开始,开始一个服务,和交付的三个基本用例是一个广播的意图,这有助于在几个方面建立组件之间的通信。这是更受欢迎的时间2010 - 2014比2015 - 2019年的时间框架。

(右)

另一个趋势,“硬件组件的检验”(T27.12),反映了在申请上市的硬件组件静态分析调查。它可以令人信服的恶意应用程序与特定需求阐述了所有的硬件,例如,摄像头,GPS和麦克风。这一趋势逐渐减少2015 - 2019年的时间框架。

(年代)

另一个重要趋势,“估计在字符串匹配”(T27.8),分析发现在各种字符串可以在Android应用程序。2015 - 2019年期间稍微的影响。

(t)

这种趋势“应用程序级别功能”(27.4)展开的使用CPU和内存使用情况跟踪恶意应用程序。2015 - 2019年期间仍然是热门。

表9

话题的焦点改变随着时间的推移,从2010年到2019年。

没有话题。	标签	2010 - 2014	影响时间1 (%)	2015 - 2019	影响时间框架2 (%)	+ /−
T27.1	分析基于网络地址	6	6.45	24	10.17	+ 3.72
T27.3	对象的敏感性	3	3.23	4	1.69	−1.53
T27.5	Checking-Based类型和模型分析	7	7.53	12	5.08	−2.44
T27.6	数据流跟踪	7	7.53	23	9.75	+ 2.22
T27.7	Dex文件研究	8	8.60	9	3.81	−4.79
T27.8	估计在字符串匹配	5	5.38	19	8.05	+ 2.67
T27.9	符号执行	6	6.45	9	3.81	−2.64
T27.11	图论分析	3	3.23	13	5.51	+ 2.28
T27.12	硬件组件的检查	7	7.53	10	4.24	−3.29
T27.13	路径敏感	5	5.38	3	1.27	−4.11
T27.15	目的监测	6	6.45	11	4.66	−1.79
T27.16	程序间控制流图	0	0.00	8	3.39	+ 3.39
T27.18	内存映射	7	7.53	13	5.51	−2.02
T27.19	场灵敏度	3	3.23	16	6.78	+ 3.55
T27.21	采用分析	10	10.75	11	4.66	−6.09
T27.22	上下文敏感	2	2.15	7	2.97	+ 0.82
T27.24	流敏感性	2	2.15	10	4.24	+ 2.09
T27.25	程序切片	3	3.23	15	6.36	+ 3.13
T27.26	基于文本的分析	2	2.15	7	2.97	+ 0.82
T27.27	污染分析	1	1.08	12	5.08	+ 4.01
T27.10	形式分析	2	13.33	9	12.33	−1.00
T27.14	输入匹配	3	20.	8	10.96	−9.04
T27.17	机器学习方法	2	13.33	29日	39.73	+ 26.39
T27.20	模式的评估	6	40	13	17.81	−22.19
T27.23	重新打包应用程序识别	2	13.33	14	19.18	+ 5.84
T27.2	应用程序级别的特性	4	50	12	63.16	13.16
T27.4	基于元数据的研究	4	50	7	36.84	−13.16

4.4。RQ4:它能展开未来方向的研究领域内选择吗?

许多Android恶意软件设定的障碍,这需要认真解决后彻底的观察。基于TRENDMINER的结果,毫无疑问,显然,Android安全最近发表的文献中已经大量的考虑。也许,这主要是由于无处不在的Android作为一个著名的操作系统在社区。重要的模式是在过去十年,反映在撰写本文调查的后遗症。因此,基于TRENDMINER的结果,讨论了一些建议,如下: (一)

映射的API使用权限来实现更细粒度的结果:使用API调用和传输敏感信息在网络上进行通信。恶意软件等家庭Fakeinst、Opfake Smsreg利用API调用,如sendSMS()和readSMS(),这意味着收集的信息可能通过短信发送。迫切需要深入分析API调用这些API模式和权限需求 139年]。

(b)

并发症在静态分析:静态分析技术无法应用程序时使用伪装技术( 39, 139年- - - - - - 143年]。静态分析也会导致大量的假阳性( 7, 144年]。

(c)

进化智能恶意软件:应用程序倾向于使用技术,如加油,antidebugging,代码混淆和内核级特性来躲避检测过程( 145年, 146年]。尽管如此,大多数的方法仍然实现模拟器。有限是努力减少远程触发。它增强了隐匿性的恶意软件允许恶意软件作者随时触发和执行恶意软件( 147年]。

(d)

发展反直观的功能强大的恶意软件分析和检测方法:静态和动态特性需要探索下一个层次来描述应用程序的行为 146年)更好。攻击者重新包装的合法应用程序中插入恶意代码片段和分发通过商店( 88年]。

(e)

需要自动化的恶意软件分类:semisupervised方法来检测恶意应用程序的开发( 146年, 148年),需要更快的检测和分类的恶意软件的家庭( 141年]。家庭的功能和特点,可以用来分类恶意软件到一个特定的家庭中不讨论研究社区 7]。

(f)

阻碍动态分析的有效性:计算时间和资源约束的主要原因是阻碍性能的动态分析 7, 39, 140年, 143年]。确保一个应用程序都引发了其恶意行为(所有执行路径遍历)在动态分析是一种关注( 141年, 142年, 144年]。

(g)

有限的可用性数据集:ransomware供应有限的数据集和缺乏理解的智能策略限制的有效性检测机制( 149年]。一般来说,研究人员下载样本VirusTotal [ 150年]。

(h)

精度预测机制:被研究者所面临的最大挑战是预测ransomware虚报率高。大多数的技术产生大量的假阳性和假阴性的警报,从而影响检测机制的准确性。需要一个前沿方法生产更少的假警报( 149年]。

研究发现,检查恶意软件的方法结合静态检查和动态调查或者两者的混合。静态检查基本上围绕着拆除代码,落后的手工检查代码中的有害的例子。另一方面,动态调查执行代码在虚拟平台和分解其执行遵循注意到应用程序的有害行为。静态检查有助于遵循独特而完整的执行方式;随后,它给总代码内容;然而,最后它经历晦涩的代码。应用程序必须首先解码执行静态调查。顽固的问题错综复杂破坏考试。动态检查更有效率和不需要麻烦可执行卸载或复原。检查的应用程序在一个受控的安排。 This cycle is time and asset devouring. It additionally raises adaptability issues. Besides, some malevolent conduct may be unseen on the grounds that the environment does not fulfill the setting off conditions. Besides, malware creators utilize mechanization innovation to produce a colossal measure of new malware variations, accordingly representing a major test to malware experts. The current situation with the-workmanship requests the combination of existing crude strategies with valuable methods to accomplish a powerful arrangement. The yield of TRENDMINER proposes that strengthening strategies ought to be utilized to supplement the arrangement of quickly developing Android malware families. Beneficial methods can end up being viable in deciding strange current vindictive conduct or security weaknesses. In view of the assortment of information got by this investigation, a plan for designing a cutting edge environment has been imagined for the characterization of Android malware families, as examined in the next section.

5。对工程Visualization-Based解决方案

恶意软件是快速发展的恶意软件的创造者的能力改变小块的源代码产生新的恶意软件变种。恶意软件变异可以被想象为灰度图像。一张照片能赶上甚至小的变化。因此,在当前的工作中,提出了一种认知结构减少默默无闻的影响通过改变恶意软件的noninstinctive组件成独特的手指印象图像Android恶意软件家庭的安排。拟议的方法,被称为SWAYAM(停止为Android恶意软件)系统如图 17。

图17

建议他为Android恶意软件(停止)系统。

5.1。模块我

这个模块处理将恶意软件样本转化为数字图像。恶意软件的二进制文件首先被转换成8位向量,然后转换成灰度图像。灰度图像的整体结构是由各个部分组成的。每个部分都有一个固定宽度,但高度是根据文件大小不同。简而言之,恶意软件样本往往表示为图像和有一种强烈的倾向,恶意软件变种相同的家庭形式相似和视觉的影响( 151年]。另一方面,来自不同家庭的恶意软件样本显示不同的结构和视觉影响。

5.2。模块二世

一旦图像转换为数字图像,下一步是提取图像的特性。功能发挥了重要作用在恶意软件样本分类到特定的家庭。各种图像描述符如全球形象描述符(要点),灰度共生依赖于应用灰度共生矩阵建立()和局部二值模式(LBP)从图像中提取特征,从而形成一个特征向量。纹理模式,强度、颜色模式和频率在图像构成的图像特征样本。欧氏距离或标准差可以用来测量在特征空间的距离 152年]。

5.3。第三模块

进一步的机器学习算法或神经网络受聘在特征向量来确定样本的家庭。例如,在资讯的方法,样本是家庭f1如果分类 k最近的邻居属于家庭f1。是指出,许多解决方案利用机器学习和大数据技术发展出现恶意软件检测模型( 153年- - - - - - 155年]。计算机视觉技术已经成为研究社区中流行的恶意软件检测和分类应用程序( 156年, 157年]。

6。这项研究的限制

这项研究中遇到的一些问题可能出现在文献的收集数据集在Android上安全。它取决于某些因素,例如,在准备使用的类型的查询和来源文献的数据集。发现适当的出版物,文章选择使用“恶意软件”或“脆弱性”或“安全”或“隐私”或“监控”或“应用”或“智能手机”或“安卓”或“病毒”或“静态”和“动态”或“检测”或“数据流”的搜索关键词。著名的数据库中剩下的自动搜索也浏览出版在该地区的影响。相关论文被使用纳入和排除标准筛选搜索结果限制当前研究的目的。尽管如此,这有可能,一些重要出版物过程中可能已经离开了。

TRENDMINER得到的潜在语义分析(LSA)技术。文理学院是一个无监督的方法发现同义词提高了向量空间模型。然而,许多问题的解决方案不能决定统计。为了缓解这种情况,一个最优的值许多主题的解决方案是强化与专家讨论后决定。最终,这项工作推断话题标记的过程纯粹是基于人类的判断,这可能导致主观偏见。

可能存在的障碍与投机的结果。随后的逐步过程推断核心研究领域和研究趋势。过程包括文献收集、预处理的数据集,代TF-IDF矩阵,截断奇异值分解,标签和话题。每一步的算法往往会影响结果。例如,结果将影响如果在这项研究中使用的数据集是修改作文的标题或长篇文章。

做完的LSA表示一些文件,新建一个文档不能被添加到这个集合。一个新文档,因此,只能逐步添加。不能捕捉新文档添加的元素。因此,LSA的性能降低添加新文档,允许重新计算。

7所示。结论

最关键的一个灵感的工作,传统的手工文学评论往往没有准备好利用巨大的文学,因为人类的障碍物和洞察力。因此,本研究提出另一个文献回顾的方法来应对这一挑战。这项研究发布了一个框架称为烤焦的框架,它可以执行主观和定量调查在巨大的文学。这是一个适应力强、多才多艺的框架画信息调查和概念化的进步倾斜测量任何领域的文学研究。烤焦框架利用信息建模技术的线性组合,即。,LSA紧随其后 K——聚类算法,使连接和分组被认可,通常错过了通过手工技术构成人类解释。机器学习技术在很大程度上减少了手动工作在确定文档最亲密的话题。

TRENDMINER烤焦的用例设计框架。展示的效用和使用TRENDMINER, Android安全领域的广泛文献利用的背景调查。框架需要444摘要的研究文章的贡献分配期间2010 - 2019。本研究确定了三个核心研究领域和27研究趋势的结果。结果表明,特定的研究模式保持可靠的检查时间。分类和Android安全领域的未来研究方向提供了在这个研究。时间趋势图讨论了每个因素的解决方案。一些研究趋势发展虽然也同样拒绝。TRENDMINER放大了效用和承诺提出未来研究方向在发展研究减轻人类的倾向。这项研究还强调回答研究的问题框架的技术被采用和选择的数据集。 This paper additionally exhibited general suggestions to help new researchers to comprehend the idea of Android security research and assess their regions of interest for their latent capacity research alongside the related research pattern.

这次考试另外建立客观、观测建立未来的方向对Android的结构和分析分解安全研究。特定的研究领域和趋势发现在这个工作可以让未来的研究维度,可以利用的研究科学家和行业。此外,研究人员可以选择至少一个研究领域,使另一个调查与等效或另一种方法。尽管如此,其他实际因素调查策略可以适用于这个探索。未来工作,研究者可以将类似的技术应用到一个不同的可比数据集的倾向和体面的各种核心研究领域内和趋势相关的文章。增加这项研究的应用领域,烤焦的框架可以增强通过构建一个动态查询系统在相同或不同的语料库运用深度学习模型。

8。实际意义和未来的研究方向

这手稿展品的全景Android安全领域。这项研究有一定的有趣的实际意义。首先,研究领域和趋势发现在这个工作可以接触未来的研究维度,可以利用这项新的研究科学家和行业。分析获得的研究可以帮助他们理解的多样性和深度Android安全领域。第二,学术大学可以提高他们的教学内容和学生的动机通过修改课程更关注Android安全领域相关的研究活动。

第三,视角的研究将帮助受人尊敬的期刊的编辑计划特别会议在Android恶意软件研究主题如Android应用程序的静态分析,对物联网安全和隐私和多媒体设备,应用级威胁,Android恶意软件分析和检测的新领域,cryptojacking,基于组件的Android恶意软件分析,深度学习为Android恶意软件分类、深度学习数字取证和网络安全。有未来研究的方向进行了讨论如下。

8.1。排名权限为Android恶意软件分析和检测

使用太多的特性为Android恶意软件分析和检测是一项繁琐的任务。安卓系统的权限作为一种特殊特性清单中。安卓系统文件的xml文件的结构。执行application-sensitive操作所需的权限。他们是嵌入到清单中。xml文件以文本的形式。他们扮演着至关重要的角色在检测可疑的Android设备上运行的应用程序。一些恶意软件作者的权限使用利用敏感信息的设备 access_coarse_location, access_ ne_location, access_network_state, access_wi _state, battery_stats, answer_phone_calls, bind_carrier_messaging_service, read_contacts, read_call_log, read_phone_state, read_external_storage, read_sms, record_audio, request_install_packages, read_calendar, bluetooth_privileged, read_history_bookmarks和许多更多。最重要的权限恶意数据集可以使用技术术语识别频率逆文档频率(TF-IDF)稍后可以导致发现的恶意应用程序。这将有助于维持一个application-permission矩阵,描述权限的频率发生在恶意应用程序的集合。TF-IDF分配每个许可的权限值,并计算每个应用程序利用其重量的敏感值公式,讨论了这项工作。此外,机器学习算法可以部署到Android恶意软件应用程序的执行检测或分类。

8.2。众包用户评论在应用程序商店

评估发现的可疑的应用程序也可以在应用程序商店用户评论。用户的反馈是至关重要的,因为他们倾向于写评论的特定应用程序基于实时使用和体验。安全公司不能忽视评论无论是积极的还是消极的。用户评论等各种目的的表达功能,UI(用户界面)/设计,电池消耗报告,和其他应用程序的安全问题。此外,应用程序中的安全问题大致分为四类:恶意代码注入到应用程序对货币的好处,垃圾邮件,信息泄漏,在应用程序中使用超水准的权限。潜在语义分析可以应用于众包应用程序的用户评论发现安全问题。初始步骤,相关评论可以从喧闹的众包过滤审查通过预处理技术的使用在这个手稿。相关条款的审查可能与Android API文档然后映射形成集群基于组件的审查。

假设板球游戏应用程序的用户评论,“每当我打开这个CRC联盟应用程序,它会自动点击我的照片,也从我的账户中扣除了1美元。我也收到了消息,说谢谢你订阅IOIO服务。“阅读本文之后,无疑认为这是一个恶意的应用程序。可能有成百上千的评论与此相关的上下文。这里的数据驱动的分析可以了解文本结构,单词,和审查讨论的话题。本文反映了这个应用程序访问摄像头,发送短信,从用户帐户扣除金额。有人可能认为板球游戏永远不可能执行这些类型的敏感操作。这个场景中只描述了应用程序的安全问题。因此,回顾可以发现的语义标记这些应用程序使用LSA是可疑的。

8.3。保护Android开发者的专有权利

重新包装是一个开放的问题在Android恶意软件检测和分析领域。使用这种技术,恶意软件作者第一次下载的合法应用程序从应用程序商店,然后提取所有应用程序的文件和文件夹。提取过程后,注入恶意代码或部分应用程序和上传相同的其他应用程序商店。他们也吸引用户下载恶意应用程序通过执行社会工程活动。无辜用户没有意识到这个事实被困和下载恶意合法应用程序的版本。这样,恶意软件渗透的电话,他们的设备被破坏。重新包装从而打开恶意软件作者的其他维度生成恶意复制或抄袭合法版本的应用程序。简而言之,开发人员广泛的专有权利剥削、虐待在恶意软件作者合法应用程序的创建克隆Android恶意软件变种。此外,他们还部署逃避技术规避检测过程。在这个场景中,LSA可以用来推断语义语料库的源代码文件。 The degree of similarity can be measured by comparing the code segments of the source code files.

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

本研究工作是自筹资金。

白色的

一个。

施密特

K。

系统的文学评论

补充疗法在医学 2005年 13 1 54 60

10.1016 / j.ctim.2004.12.003

2 - s2.0 - 18744394988

D。

科罗斯兰德

m D。

播种与文本挖掘研究文献的调查和分析

专家系统与应用程序 2008年 34 3 1707年 1720年

10.1016 / j.eswa.2007.01.035

2 - s2.0 - 37349049764

Evangelopoulos

N。

张

X。

Prybutok

诉R。

潜在语义分析:五个方法建议

欧洲信息系统杂志》上 2012年 21 1 70年 86年

10.1057 / ejis.2010.61

2 - s2.0 - 84863011331

李

年代。

首歌

J。

金

Y。

四个文本挖掘方法的实证比较

《计算机信息系统 2010年 51 1 1 10

10.1109 / hicss.2010.48

2 - s2.0 - 77951709869

Sehra

年代。

辛格

J。

意大利广播电视公司

H。

利用潜在语义分析来识别openstreetmap的研究趋势

ISPRS国际信息杂志》上 2017年 6 7 195年

10.3390 / ijgi6070195

2 - s2.0 - 85026401383

的契机

M。

辛格

V。

建筑信息模型(BIM)模式和趋势研究:潜在语义分析

自动化建设 2015年 59 68年 80年

10.1016 / j.autcon.2015.07.012

2 - s2.0 - 84940861504

谢

N。

王

X。

王

W。

刘

J。

指纹android恶意软件的家庭

计算机科学的前沿 2019年 13 3 637年 646年

10.1007 / s11704 - 017 - 6493 - y

2 - s2.0 - 85049153785

比结

M。

Freiling

f . C。

霍夫曼

J。

霍尔兹

T。

Uellenbeck

年代。

狼

C。

移动安全迎头赶上?揭示的螺母和螺栓的安全移动设备

学报2011年IEEE研讨会上安全和隐私

2011年

美国奥克兰

IEEE

Enck

W。

保护用户对智能手机应用程序:技术和未来的发展方向

《2011年国际会议上的信息系统安全

2011年

加尔各答,印度

施普林格

10.1007 / 978 - 3 - 642 - 25560 - 1 _3

2 - s2.0 - 81855220939

Faruki

P。

Bharmal

一个。

你的事迹

V。

Ganmoor

V。

白肢野牛

m . S。

孔蒂

M。

Rajarajan

M。

Android安全:一个调查问题,恶意软件渗透和防御

IEEE通信调查和教程 2014年 17 2 998年 1022年

Suarez-Tangil

G。

Tapiador

j·E。

Peris-Lopez

P。

Ribagorda

一个。

进化,检测和分析恶意软件的智能设备

IEEE通信调查和教程 2013年 16 2 961年 987年

Kitchenham

B。

珍珠Brereton

O。

Budgen

D。

特纳

M。

贝利

J。

执火把的人

年代。

系统的文学评论在软件工程系统的文献回顾

信息与软件技术 2009年 51 1 7 15

10.1016 / j.infsof.2008.09.009

2 - s2.0 - 56649086628

看到

穆尼

P。

香

G。

廷

精梳机

一个。

大霸王

J。

弗里茨

年代。

Kerle

N。

江

B。

Laakso

M。

众包、公民科学或自愿地理信息吗?众包地理信息的当前状态

ISPRS国际信息杂志》上 2016年 5 5 55

10.3390 / ijgi5050055

2 - s2.0 - 84968593362

茶室

一个。

耆那教徒的

V。

库马尔

年代。

钱德拉

C。

旅行从规范行为在供应链运营管理:回顾利用潜在语义分析

专家系统与应用程序 2015年 42 2 796年 809年

10.1016 / j.eswa.2014.08.035

2 - s2.0 - 84907494965

Altszyler

E。

里贝罗

年代。

西格曼

M。

费尔南德斯Slezak

D。

梦的解释的意义:解决歧义利用潜在语义分析在小型语料库的文本

意识与认知 2017年 56 178年 187年

10.1016 / j.concog.2017.09.004

2 - s2.0 - 85029711052

Balahur

一个。

Mihalcea

R。

Montoyo

一个。

计算方法主观性和情绪分析:现在和设想的方法和应用

电脑语音和语言 2014年 28 1 1 6

10.1016 / j.csl.2013.09.003

2 - s2.0 - 84885404179

德布尔

j . N。

Voppel

答:E。

Begemann却

m . j . H。

Schnack

h·G。

Wijnen

F。

大梁

即C。

精神病学和神经病学临床使用的语义空间模型:系统回顾和荟萃分析

神经科学和生物行为的评论 2018年 93年 85年 92年

10.1016 / j.neubiorev.2018.06.008

2 - s2.0 - 85049330464

出来后

o . B。

Mellouli

年代。

Trabelsi

Z。

从公民到政府决策者:社交媒体数据分析

政府信息的季度 2019年 36 560年 570年

10.1016 / j.giq.2019.05.002

2 - s2.0 - 85066121980

Elghazel

H。

Aussem

一个。

Gharroudi

O。

Saadaoui

W。

整体多标记文本分类基于旋转森林和潜在语义索引

专家系统与应用程序 2016年 57 1 11

10.1016 / j.eswa.2016.03.041

2 - s2.0 - 84962381092

20.

高

G。

刘

Y.-S。

林

P。

王

M。

顾

M。

勇

黄永发。

Bimtag: concept-based在线BIM产品资源的自动语义标注

先进的工程信息 2017年 31日 48 61年

10.1016 / j.aei.2015.10.003

2 - s2.0 - 84951112625

关

J。

Manikas

答:S。

博伊德

l . H。

55:生产国际期刊的研究内容驱动审查和分析

国际期刊的生产研究 2019年 57 15 - 16岁 4654年 4666年

10.1080 / 00207543.2017.1296979

2 - s2.0 - 85014457376

和记黄埔

p D。

Daigle

r . J。

乔治

B。

潜在语义分析AIS学术研究中的应用

会计信息系统的国际期刊 2018年 31日 83年 96年

10.1016 / j.accinf.2018.09.003

2 - s2.0 - 85054446593

金

H。

李

H。

搜索引擎优化

J。

一个可靠的FAQ检索系统使用一个查询日志分类基于潜在语义分析的技术

信息处理与管理 2007年 43 2 420年 430年

10.1016 / j.ipm.2006.07.018

2 - s2.0 - 33750451224

Kulkarni

美国年代。

的利润率

美国米。

Evangelopoulos

n E。

利用潜在语义分析运营管理研究

决策科学 2014年 45 5 971年 994年

10.1111 / deci.12095

2 - s2.0 - 84915733969

林

X。

李

Y。

王

X。

社交商务研究:定义、研究主题和趋势

国际信息管理杂志》上 2017年 37 3 190年 201年

10.1016 / j.ijinfomgt.2016.06.006

2 - s2.0 - 84979681305

穆勒

O。

Schmiedel

T。

Gorbacheva

E。

Vom Brocke

J。

对业务流程管理专业人士的类型学:识别能力通过潜在语义分析的模式

企业信息系统 2016年 10 1 50 80年

10.1080 / 17517575.2014.923514

2 - s2.0 - 84945443384

Pilato

G。

D 'Avanzo

E。

数据驱动的社会情绪分析通过情感的概念化的指纹

Procedia计算机科学 2018年 123年 360年 365年

10.1016 / j.procs.2018.01.056

2 - s2.0 - 85045661201

Tonta

Y。

Darvish

h·R。

扩散的潜在语义分析作为研究工具:一个社会网络分析方法

情报计量学杂志》 2010年 4 2 166年 174年

10.1016 / j.joi.2009.11.003

2 - s2.0 - 77649239350

29日

魏

C.-P。

杨

C . C。

林

C.-M。

一个潜在语义indexing-based多语言文档聚类方法

决策支持系统 2008年 45 3 606年 620年

10.1016 / j.dss.2007.07.008

2 - s2.0 - 44949210319

30.

金

年代。

公园

H。

李

J。

Word2vec-based潜在语义分析(W2V - LSA)主题建模:研究区块链技术趋势分析

专家系统与应用程序 2020年 152年 113年 401年

10.1016 / j.eswa.2020.113401

31日

Jorge-Botana

G。

张艺泷

R。

吕宋岛

j . M。

衔接理论之间语义表示模型没有排名的压力:LSA的一些经验教训

认知过程 2020年 21 1 1 21

10.1007 / s10339 - 019 - 00934 - x

2 - s2.0 - 85074016031

Hassani

一个。

Iranmanesh

一个。

Mansouri

N。

文本挖掘使用非负矩阵分解和潜在语义分析

神经计算和应用 2021年

柏林,德国

施普林格

10.1007 / s00521 - 021 - 06014 - 6

任

X。

Coutanche

m . N。

睡眠减少的语义连贯记忆:一个应用程序潜在语义分析研究记忆的重建

心理环境通报与评论 2021年 28 1336年 1343年

10.3758 / s13423 - 021 - 01919 - 8

Gowthami

年代。

Harikumar

R。

传统神经网络的盲图像模糊修正使用潜在语义

软计算 2020年 24 15223年 15237年

10.1007 / s00500 - 020 - 04859 - y

即将

F。

委拉斯凯兹

一个。

德莱昂

l S。

褐煤

J。

罗德里戈

J。

方法解决冗余的逆问题基于潜在语义分析的方法。应用程序一个喷气式飞机发动机

航空航天科学技术 2020年 102年

105854年

10.1016 / j.ast.2020.105854

Evangelopoulos

N。

Amirkiaee

s Y。

提取LSA主题作为文本分类器的特征在不同的知识领域

质量和数量 2020年 54 1 249年 261年

10.1007 / s11135 - 019 - 00954 - x

沈

C。

何

J。

技术强化学习高等教育:文献计量分析和潜在语义的方法

电脑在人类行为 2020年 104年

106177年

10.1016 / j.chb.2019.106177

Wagire

答:一个。

拉索尔教授

一个。

耆那教徒的

R。

4.0工业分析和合成研究景观

生产技术管理杂志》上 2019年 31日

10.1108 / jmtm - 10 - 2018 - 0349

2 - s2.0 - 85068131574

•拉扎克

m·f·A。

Anuar

n . B。

Salleh

R。

Firdaus

一个。

“恶意软件”的崛起:恶意软件研究的文献计量分析

网络和计算机应用》杂志上 2016年 75年 58 76年

10.1016 / j.jnca.2016.08.022

2 - s2.0 - 84984616675

刘

K。

徐

年代。

徐

G。

张

M。

太阳

D。

刘

H。

回顾android恶意软件检测方法和基于机器学习

IEEE访问 2020年 8 124579年 124607年

10.1109 / access.2020.3006143

垫

s . r . T。

阿瑟•拉扎克

m F。

Kahar

M·n·M。

Arif

j . M。

穆罕默德

年代。

Firdaus

一个。

对系统的描述字段使用文献分析:恶意软件进化

科学计量学 2021年 126年 3 2013年 2055年

10.1007 / s11192 - 020 - 03834 - 6

阿马多

一个。

科特斯

P。

丽塔

P。

莫罗

年代。

在大数据市场营销研究趋势:基于文本挖掘和主题建模的文学分析

欧洲研究在管理和商业经济学 2018年 24 1 1 7

10.1016 / j.iedeen.2017.06.002

2 - s2.0 - 85021832314

Kavvadias

年代。

Drosatos

G。

Kaldoudi

E。

支持生物医学文献中主题建模和趋势分析

生物医学信息学杂志 2020年 110年

103574年

10.1016 / j.jbi.2020.103574

南部

M。

Salminen

J。

请耐心

Wirtz

J。

人工智能营销:主题建模、科学计量分析,研究议程

商业研究杂志》 2021年 124年 389年 404年

10.1016 / j.jbusres.2020.10.044

Rumbut

J。

方

H。

王

H。

主题建模的系统回顾视觉分析不完整的纵向行为试验数据

聪明健康 2020年 18

100142年

10.1016 / j.smhl.2020.100142

一个

J。

金

K。

Mortara

李

年代。

派生技术从专利情报:preposition-based语义分析

情报计量学杂志》 2018年 12 1 217年 236年

10.1016 / j.joi.2018.01.001

2 - s2.0 - 85041468981

Hurtado

j·L。

阿加瓦尔

一个。

朱

X。

话题发现和未来趋势预测文本

《大数据 2016年 3 1 7

10.1186 / s40537 - 016 - 0039 - 2

2 - s2.0 - 85013900908

Evangelopoulos

n E。

潜在语义分析

威利跨学科评论:认知科学 2013年 4 6 683年 692年

10.1002 / wcs.1254

2 - s2.0 - 84885809882

拉森

k·R。

Monarchi

d E。

定性数据的数学方法分类和标签:潜在的分类方法

社会学研究方法 2004年 34 1 349年 392年

10.1111 / j.0081-1750.2004.00156.x

2 - s2.0 - 16244393059

Lopez-Quintero

j·F。

Cueva Lovelle

j . M。

冈萨雷斯克雷斯波

R。

Garcia-Diaz

V。

个人知识管理元模型基于语义分析和社会信息

软计算 2018年 22 6 1845年 1854年

10.1007 / s00500 - 016 - 2437 - y

2 - s2.0 - 84995381344

Sidorova

一个。

Evangelopoulos

N。

Valacich

j·S。

Ramakrishnan

T。

发现的知识信息系统学科的核心

MIS的季度 2008年 32 3 467年 482年

10.2307 / 25148852

道

H。

李

J。

罗

T。

王

C。

研究基于加权k - means主题趋势

学报2017年第七届IEEE国际会议上电子信息和应急通信(ICEIEC)

2017年

澳门,中国

IEEE

10.1109 / iceiec.2017.8076604

2 - s2.0 - 85035799324

陈

J。

魏

W。

郭

C。

唐

太阳

文本分析和可视化数据挖掘的研究趋势电子健康记录

卫生政策和技术 2017年 6 4 389年 400年

10.1016 / j.hlpt.2017.10.003

2 - s2.0 - 85034959586

Goyal

年代。

Ahuja

M。

关

J。

信息系统研究主题:十七年数据驱动时序分析

通信协会的信息系统 2018年 43 1 23

10.17705/1 cais.04323

2 - s2.0 - 85054489898

江

H。

羌族

M。

林

P。

主题建模基础文献水电研究的探索

可再生能源和可持续能源的评论 2016年 57 226年 237年

10.1016 / j.rser.2015.12.194

2 - s2.0 - 84952916182

Kamber

M。

裴

J。

数据挖掘 2006年

美国伯灵顿

摩根考夫曼

年轻的

T。

哈札里卡

D。

云苓

年代。

威尔士

E。

最近的趋势在基于深度学习的自然语言处理

IEEE计算机情报杂志 2018年 13 3 55 75年

10.1109 / mci.2018.2840738

2 - s2.0 - 85051085274

Deerwester

年代。

杜迈

s T。

Furnas

g·W。

蓝道

t·K。

Harshman表示

R。

潜在语义索引的分析

美国信息科学学会杂志》上 1990年 41 6 391年 407年

10.1002 / (sici) 1097 - 4571 (199009) 41:6 < 391:: aid-asi1 > 3.0.co; 2 - 9

侯赛因

M . M。

Prybutok

V。

Evangelopoulos

N。

因果潜在语义分析(CLSA):一个例证

国际商业研究 2011年 4 2 38

10.5539 / ibr.v4n2p38

Kherwa

P。

邦萨尔

P。

潜在语义分析:一种方法来理解语义的文本

学报2017年国际会议上当前的趋势在计算机、电气、电子和通信(CTCEEC)

2017年

迈索尔,印度

IEEE

10.1109 / ctceec.2017.8455018

2 - s2.0 - 85054052036

61年

金

c·S。

崔

美国J。

Kwahk

k . Y。

调查研究的趋势在信息系统领域使用主题模型和时间序列回归分析

数字杂志内容的社会 2017年 18 6 1143年 1150年

62年

Sehra

美国K。

Brar

y S。

考尔

N。

Sehra

美国年代。

研究软件工作评估的模式和趋势

信息与软件技术 2017年 91年 1 21

10.1016 / j.infsof.2017.06.002

2 - s2.0 - 85020853907

63年

太阳

阴

Y。

发现主题和运输使用主题建模研究的趋势

交通研究部分C:新兴技术 2017年 77年 49 66年

10.1016 / j.trc.2017.01.013

2 - s2.0 - 85010808868

64年

爱思唯尔

Mendeley桌面

2020年

https://www.mendeley.com/download-desktop/

65年

Shinyama

Y。

PDF矿工 2004年

66年

费尔德曼

R。

桑格

J。

文本挖掘手册:先进的方法分析非结构化数据 2007年

英国剑桥

剑桥大学出版社

67年

曼宁

C。

Raghavan

P。

Schutze

H。

信息检索概论

自然语言工程 2010年 16 1 One hundred. 103年

68年

Python

自然语言工具包(Nltk)

2020年

https://www.nltk.org/

69年

沉重的一击

j . H。

小说TF-IDF加权方案有效的排名

美国第36届国际市立图书馆会议在信息检索的研究与开发

2013年

爱尔兰都柏林

ACM

10.1145/2484028.2484070

2 - s2.0 - 84883106273

70年

索尔顿海

G。

巴克利

C。

Term-weighting在自动文本检索方法

信息处理与管理 1988年 24 5 513年 523年

10.1016 / 0306 - 4573 (88)90021 - 0

2 - s2.0 - 45549117987

71年

杜迈

s T。

潜在语义分析

信息科学和技术的年度审查 2004年 38 1 188年 230年

72年

布拉德福德

r B。

一个实证研究大规模潜在语义索引应用程序所需的维数

第17届ACM会议程序信息和知识管理

2008年

美国纳帕谷,CA

ACM

10.1145/1458082.1458105

2 - s2.0 - 70349242386

73年

Wagire

答:一个。

拉索尔教授

答:p S。

耆那教徒的

R。

4.0探索的支柱产业利用潜在语义分析技术

智能制造和能源的可持续性 2020年

柏林,德国

施普林格

711年 719年

10.1007 / 978 - 981 - 15 - 1616 - 0 - _69

74年

朱

M。

Ghodsi

一个。

自动维度选择小石子的情节可能通过使用配置文件

计算统计和数据分析 2006年 51 2 918年 930年

10.1016 / j.csda.2005.09.010

2 - s2.0 - 33750328441

75年

摘要旌表

R。

Shaohong

Y。

数据挖掘中聚类算法的研究和改进

学报2010年的第二次国际会议上的信号处理系统

2010年

大连,中国

IEEE

10.1109 / icsps.2010.5555239

2 - s2.0 - 77957276664

76年

斯

M。

莫汉

c K。

使用增量和层次聚类方法有效的聚类方法

《2010年国际神经网络(IJCNN)联合会议

2010年

西班牙巴塞罗那

IEEE

10.1109 / ijcnn.2010.5596666

2 - s2.0 - 79959417490

77年

辛格

年代。

亚达夫

一个。

研究k - means和增强的k - means聚类算法

国际高级研究计算机科学杂志》上 2013年 4 10

78年

Dhillon

i S。

Modha

d S。

使用集群概念分解为大型稀疏的文本数据

机器学习 2001年 42 1 - 2 143年 175年

10.1023 /:1007612920971

2 - s2.0 - 0034824884

79年

耆那教徒的

答:K。

k - means之外的数据聚类:50年

模式识别的字母 2010年 31日 8 651年 666年

10.1016 / j.patrec.2009.09.011

2 - s2.0 - 77950369345

80年

Rangrej

一个。

Kulkarni

年代。

Tendulkar

答:V。

集群技术的比较研究短的文本文档

20国际会议的程序的同伴在万维网上

2011年

海得拉巴,印度

ACM

10.1145/1963192.1963249

2 - s2.0 - 79955132812

81年

Linstone

h·A。

Turoff

M。

Delphi方法 1975年

波士顿,美国

addison - wesley

82年

福克斯

答:P。

乔杜里

一个。

福斯特

j·S。

SCanDroid:自动化安全认证的android应用程序

2009年

美国马里兰州大学公园

马里兰大学

技术报告

83年

Enck

W。

吉尔伯特

P。

汉

年代。

Tendulkar

V。

春

b G。

考克斯

l . P。

荣格

J。

麦克丹尼尔

P。

Sheth

a . N。

Taintdroid:信息流跟踪系统实时监控智能手机隐私

ACM交易计算机系统(toc) 2014年 32 2 5

10.1145 / 2619091

2 - s2.0 - 84904095463

84年

Faruki

P。

库马尔

V。

阿玛

B。

白肢野牛

m . S。

你的事迹

V。

孔蒂

M。

为分析恶意软件和资源平台中立沙箱火车司机的应用

《2014年国际会议在通信网络安全和隐私

2014年

中国,北京

施普林格

85年

Sounthiraraj

D。

长官

J。

格林伍德

G。

林

Z。

汗

SMV-hunter:大规模、自动化检测的SSL / TLS中间人在android应用程序漏洞

《21年度网络和分布式系统安全座谈会

2014年

圣地亚哥,加州,美国

10.14722 / ndss.2014.23205

86年

Pandita

R。

肖

X。

杨

W。

Enck

W。

谢

T。

WHYPER:对自动化风险评估的移动应用程序

学报》第二十二届USENIX安全研讨会

2013年

美国华盛顿特区

87年

Dini

G。

Martinelli

F。

Saracino

一个。

Sgandurra

D。

夫人:多层次异常探测器为android恶意软件

《2012年国际会议上的数学方法,对计算机网络安全模型和体系结构

2012年

俄罗斯圣彼得堡

施普林格

10.1007 / 978 - 3 - 642 - 33704 - 8 - _21

88年

周

W。

周

Y。

江

X。

宁

P。

检测重新包装在第三方安卓智能手机应用程序市场

第二届ACM会议数据和应用程序的安全性和隐私

2012年

圣安东尼奥,德克萨斯州,美国

ACM

10.1145/2133601.2133640

89年

非盟

k . w . Y。

周

y F。

黄

Z。

谎言

D。

PScout:分析android许可规范

学报2012年ACM关于计算机和通信安全的会议

2012年

美国罗利数控

ACM

90年

感觉

答:P。

下巴

E。

汉娜

年代。

首歌

D。

瓦格纳

D。

Android权限启发

学报18 ACM关于计算机和通信安全的会议

2011年

美国芝加哥

ACM

10.1145/2046707.2046779

2 - s2.0 - 80755187788

91年

Arp

D。

Spreitzenbarth

M。

大

M。

吹牛的人

H。

Rieck

K。

西门子

C。

DREBIN: android恶意软件的有效和可辩解的检测在你的口袋里

诉讼的2014网络和分布式系统安全座谈会

2014年

圣地亚哥,加州,美国

10.14722 / ndss.2014.23247

92年

Chaabouni

N。

Mosbah

M。

Zemmari

一个。

Sauvignac

C。

Faruki

P。

基于学习物联网安全网络入侵检测技术

IEEE通信调查和教程 2019年 21 3 2671年 2701年

10.1109 / comst.2019.2896380

2 - s2.0 - 85071375386

93年

公司

Z。

杨ydF4y2Ba

N。

肖

W。

Zhaoguo

W。

Yibo

X。

A3: android恶意软件的自动分析

学报第一国际云计算和信息安全研讨会

2013年

西澳大利亚大学,澳大利亚珀斯

10.2991 / ccis-13.2013.22

94年

Tam

K。

Feizollah

一个。

Anuar

n . B。

Salleh

R。

Cavallaro

android恶意软件和android的进化分析技术

ACM计算调查(CSUR) 2017年 49 4 76年

10.1145 / 3017427

2 - s2.0 - 85011342663

95年

金

J。

尹

Y。

易

K。

胫骨

J。

中心

年代。

丑闻:静态分析器在android应用程序检测隐私泄露

大多数 2012年 12 110年 1

96年

陈

k . Z。

约翰逊

n·M。

德席尔瓦

V。

戴

年代。

业务

K。

Magrino

t·R。

吴

e . X。

Rinard

M。

首歌

d . X。

在android应用程序上下文策略实施许可事件图

诉讼的2013网络和分布式系统安全座谈会

2013年

圣地亚哥,加州,美国

97年

Desnos

一个。

Gueguen

G。

Android:扭转反编译

《2011黑帽

2011年

阿布扎比,阿拉伯联合酋长国

77年 101年

98年

霍夫曼

J。

Ussath

M。

霍尔兹

T。

Spreitzenbarth

M。

切片机器人:程序切片smali代码

28届ACM学报》研讨会上应用计算

2013年

Coimbra、葡萄牙

ACM

99年

张

M。

阴

H。

Appsealer:为防止组件自动生成vulnerability-specific补丁劫持攻击在android应用程序

2014年nds学报》上

2014年

圣地亚哥,加州,美国

10.14722 / ndss.2014.23255

One hundred.

Enck

W。

Octeau

D。

麦克丹尼尔

p D。

乔杜里

年代。

android应用程序安全性的研究

学报2011 USENIX安全研讨会

2011年

旧金山,加州,美国

101年

Gibler

C。

Crussell

J。

埃里克森

J。

陈

H。

AndroidLeaks:自动检测潜在的隐私泄漏在大规模的android应用程序

《2012年国际会议上信任和值得信赖的计算

2012年

奥地利的维也纳

施普林格

10.1007 / 978 - 3 - 642 - 30921 - 2 - _17

2 - s2.0 - 84863084209

102年

医生

年代。

Rasthofer

年代。

弗里茨

C。

古水盆海湾

E。

Bartel

一个。

克莱因

J。

Le Traon

Y。

Octeau

D。

麦克丹尼尔

P。

FlowDroid:精确的背景下,流、字段object-sensitive和lifecycle-aware污点分析为android应用程序

ACM Sigplan通知 2014年 49

纽约,纽约,美国

ACM

259年 269年

10.1145/2666356.2594299

103年

冯

Y。

阿南德

年代。

Dillig

我。

艾肯

一个。

基于语义Apposcopy:通过静态分析检测android恶意软件

22 ACM SIGSOFT学报》国际研讨会软件工程的基础

2014年

中国香港

ACM

10.1145/2635868.2635869

2 - s2.0 - 84986888961

104年

李

Bartel

一个。

Bissyande

t F。

克莱因

J。

Le Traon

Y。

医生

年代。

Rasthofer

年代。

古水盆海湾

E。

Octeau

D。

麦克丹尼尔

P。

ICCTA:检测在android应用程序组件间隐私泄露

软件工程学报》第37届国际会议上

2015年

意大利的佛罗伦萨

IEEE出版社

10.1109 / icse.2015.48

2 - s2.0 - 84943159826

105年

太阳

M。

魏

T。

他

J。

android TaintART:一种实用的多级信息流跟踪系统运行时

学报2016 ACM SIGSAC计算机和通信安全会议

2016年

奥地利的维也纳

ACM

106年

魏

F。

罗伊

年代。

欧

X。

罗比

Amandroid:一个精确的和一般的国际米兰-组件数据流分析框架的安全审查的android应用程序

学报2014 ACM SIGSAC计算机和通信安全会议

2014年

美国亚利桑那州斯科茨代尔

ACM

107年

吴

年代。

王

P。

李

X。

张

Y。

有效的android恶意软件检测基于数据流的使用api和机器学习

信息与软件技术 2016年 75年 17 25

10.1016 / j.infsof.2016.03.004

2 - s2.0 - 84961588444

108年

格蕾丝

M。

周

Y。

张

Q。

邹

年代。

江

X。

Riskranker:可伸缩的和精确的零日android恶意软件检测

学报第十届国际会议在移动系统中,应用程序和服务

2012年

温德米尔湖,英国

ACM

109年

周

Y。

王

Z。

周

W。

江

X。

嘿,你,我的市场:检测恶意程序在官方和替代安卓市场

2012年nds学报》上

2012年

圣地亚哥,加州,美国

110年

Karlsen

h·S。

Wognsen

e·R。

奥尔森

m . C。

汉森

R R。

研究中,formalisa-tion, dalvik字节码的分析

学报2012年7日研讨会字节码语义、验证、分析和变换

2012年

爱沙尼亚塔林

111年

Faruki

P。

你的事迹

V。

白肢野牛

m . S。

维诺德

P。

矿业控制流图作为API call-grams检测便携式可执行的恶意软件

学报》第五届国际会议信息和网络的安全

2012年

印度斋浦尔

ACM

112年

吴

d . J。

毛

c . H。

魏

t E。

李

h . M。

吴

k P。

通过清单和API调用Droidmat: android恶意软件检测跟踪

《2012年第七届亚洲联席会议在信息安全

2012年

日本东京

IEEE

10.1109 / asiajcis.2012.18

2 - s2.0 - 84868259476

113年

Sanz

B。

桑托斯

我。

Ugarte-Pedrero

X。

Laorden

C。

Nieves

J。

Bringas

p·G。

异常检测使用字符串分析为android恶意软件检测

2014年国际联合会议SOCO13-CISIS13-ICEUTE13学报》上

2014年

西班牙萨拉曼卡

施普林格

10.1007 / 978 - 3 - 319 - 01854 - 6 _48

2 - s2.0 - 84927663087

114年

Baeza-Yates

R。

Ribeiro-Neto

B。

里贝罗

b d。a . N。

现代信息检索 1999年 463年

纽约,纽约,美国

ACM的新闻

115年

美国陆军和空军交易服务处

Y。

杜

W。

阴

H。

DroidAPIMiner:矿业在android api级功能强大的恶意软件检测

《2013年国际会议在通信系统的安全和隐私

2013年

澳大利亚悉尼

施普林格

10.1007 / 978 - 3 - 319 - 04283 - 1 - _6

116年

Avdiienko

V。

“库兹涅佐夫”

K。

Gorla

一个。

西

一个。

医生

年代。

Rasthofer

年代。

古水盆海湾

E。

矿业应用异常敏感数据的使用

软件工程学报》第37届国际会议上

2015年

意大利的佛罗伦萨

IEEE出版社

10.1109 / icse.2015.61

2 - s2.0 - 84951865145

117年

戴夫

J。

撒哈拉沙漠的

年代。

Faruki

P。

你的事迹

V。

白肢野牛

m . S。

删除处理获得随机加密存储

《2017年国际会议上的信息系统安全

2017年

印度孟买

施普林格

10.1007 / 978 - 3 - 319 - 72598 - 7 - _10

2 - s2.0 - 85038216404

118年

彭

H。

盖茨

C。

Sarma

B。

李

N。

气

Y。

Potharaju

R。

Nita-Rotaru

C。

莫雷

我。

使用概率生成模型排名android应用程序的风险

学报2012年ACM关于计算机和通信安全的会议

2012年

美国罗利数控

ACM

10.1145/2382196.2382224

2 - s2.0 - 84869432690

119年

周

Y。

江

X。

解剖android恶意软件:特征和演化

学报2012年IEEE研讨会上安全和隐私

2012年

旧金山,加州,美国

IEEE

10.1109 / sp.2012.16

2 - s2.0 - 84878368035

120年

太阳

X。

中洋

Y。

鑫

Z。

毛

B。

谢

检测代码重用在android应用程序使用基于组件的控制流图

《2014年联合会国际信息安全会议

2014年

摩洛哥马拉喀什

施普林格

10.1007 / 978 - 3 - 642 - 55415 - 5 _12

121年

Crussell

J。

Gibler

C。

陈

H。

克隆人的进攻:检测克隆的应用程序在android市场

学报2012年欧洲研讨会在计算机安全研究

2012年

比萨、意大利

施普林格

10.1007 / 978 - 3 - 642 - 33167 - 1 _3

2 - s2.0 - 84865590234

122年

张

F。

黄

H。

朱

年代。

吴

D。

刘

P。

对obfuscation-resilient ViewDroid:移动应用程序重新包装检测

学报2014年ACM大会在无线和移动网络安全和隐私

2014年

牛津大学,英国

ACM

123年

邵

Y。

罗

X。

羌族ydF4y2Ba

C。

朱

P。

张

对一个可伸缩的因方法检测重新包装的android应用程序

30年计算机安全应用研讨会论文集

2014年

新奥尔良,洛杉矶,美国

ACM

10.1145/2664243.2664275

2 - s2.0 - 84954509918

124年

Crussell

J。

Gibler

C。

陈

H。

AnDarwin:可伸缩的检测语义上类似的android应用程序

《欧洲研究在计算机安全研讨会上

2013年

艾格汉姆、英国

施普林格

10.1007 / 978 - 3 - 642 - 40203 - 6 _11

2 - s2.0 - 84884778087

125年

Al-Haiqi

一个。

伊斯梅尔

M。

Nordin

R。

在最好的传感器对安卓按键推理攻击

Procedia技术 2013年 8 947年 953年

10.1016 / j.protcy.2013.12.285

126年

Deshotels

听不清声音的秘密通道移动设备

第八届USENIX攻击技术研讨会学报》上

2014年

圣地亚哥,加州,美国

127年

Miluzzo

E。

Varshavsky

一个。

巴拉科瑞斯南

年代。

Choudhury

R R。

Tapprints:手指水龙头有指纹

学报第十届国际会议在移动系统中,应用程序和服务

2012年

英国低木湾湖区

ACM

128年

施莱格尔

R。

Kapadia

一个。

王

X。

Soundcomber:隐形和上下文感知声音智能手机木马

2011年nds学报》上

2011年

圣地亚哥,加州,美国

129年

徐

N。

张

F。

罗

Y。

贾

W。

宣

D。

腾

J。

隐形视频捕获者:一个新的视频在3 g智能手机间谍软件

第二届ACM无线网络安全会议上

2009年

瑞士苏黎世

ACM

130年

Suarez-Tangil

G。

Tapiador

j·E。

Lombardi

F。

Di Pietro

R。

Alterdroid:微分混淆智能手机恶意软件的故障分析

IEEE移动计算 2015年 15 4 789年 802年

10.1109 / tmc.2015.2444847

2 - s2.0 - 84963891446

131年

Suarez-Tangil

G。

Tapiador

j·E。

Peris-Lopez

P。

Blasco

J。

树状的:文本挖掘方法在android恶意软件分析和分类代码结构的家庭

专家系统与应用程序 2014年 41 4 1104年 1117年

10.1016 / j.eswa.2013.07.106

2 - s2.0 - 84888348488

132年

Suarez-Tangil

G。

破折号

美国K。

艾哈迈迪

M。

友善

J。

Giacinto

G。

Cavallaro

DroidSieve:快速和准确的分类混淆android恶意软件

第七届ACM学报》上的数据和应用程序安全会议上和隐私

2017年

美国亚利桑那州斯科茨代尔

ACM

133年

王

W。

李

Y。

王

X。

刘

J。

张

X。

检测android恶意程序和分类良性应用分类器的合奏

未来一代计算机系统 2018年 78年 987年 994年

10.1016 / j.future.2017.01.019

2 - s2.0 - 85011337840

134年

Lindorfer

M。

Neugschwandtner

M。

Weichselbaum

Fratantonio

Y。

Van Der Veen

V。

Platzer

C。

Andrubis 1000000应用程序后:对当前android恶意软件的行为

学报2014年第三届国际研讨会上构建分析数据和收集经验回报安全(獾)

2014年

波兰弗罗茨瓦夫

IEEE

10.1109 / badgers.2014.7

2 - s2.0 - 84968718794

135年

Desnos

一个。

Lantz

P。

Droidbox: android应用程序沙箱进行动态分析

2011年

瑞典隆德

隆德大学

技术报告

136年

Enck

W。

Ongtang

M。

麦克丹尼尔

P。

在轻量级的移动电话应用程序认证

学报》第16届ACM关于计算机和通信安全的会议

2009年

美国芝加哥

ACM

10.1145/1653662.1653691

2 - s2.0 - 74049155830

137年

杨ydF4y2Ba

l·K。

阴

H。

Droidscope:无缝地重构操作系统和dalvik为动态android恶意软件分析语义视图

21届USENIX安全研讨会学报》上

2012年

贝尔维尤,佤邦,美国

138年

Faruki

P。

你的事迹

V。

Bharmal

一个。

白肢野牛

m . S。

Ganmoor

V。

Androsimilar:健壮的签名android恶意软件的检测变体

《信息安全与应用程序 2015年 22 66年 80年

10.1016 / j.jisa.2014.10.011

2 - s2.0 - 84983140489

139年

Kabakus

a . T。

Dogru

我一个。

深入分析了android恶意软件使用混合动力技术

数字调查 2018年 24 25 33

10.1016 / j.diin.2018.01.001

2 - s2.0 - 85041198583

140年

傅

J。

雪

J。

王

Y。

刘

Z。

山

C。

恶意软件可视化的细粒度的分类

IEEE访问 2018年 6 14510年 14523年

10.1109 / access.2018.2805301

2 - s2.0 - 85042078959

141年

倪

年代。

羌族ydF4y2Ba

Q。

张

R。

恶意软件识别使用可视化图像和深度学习

电脑与安全 2018年 77年 871年 885年

10.1016 / j.cose.2018.04.005

2 - s2.0 - 85048590017

142年

太阳

年代。

傅

X。

阮

H。

杜

X。

罗

B。

Guizani

M。

实时为android应用程序行为分析和识别

IEEE访问 2018年 6 38041年 38051年

10.1109 / access.2018.2853121

2 - s2.0 - 85049688030

143年

杨ydF4y2Ba

J。

气

Y。

饶

Q。

LSTM-based层次去噪网络为android恶意软件检测

安全性和通信网络 2018年 2018年 18

5249190

10.1155 / 2018/5249190

2 - s2.0 - 85042639045

144年

李

J。

太阳

杨ydF4y2Ba

Q。

李

Z。

Srisa-an

W。

叶

H。

重要的权限识别machine-learning-based android恶意软件检测

IEEE工业信息 2018年 14 7 3216年 3225年

10.1109 / tii.2017.2789219

2 - s2.0 - 85041186267

145年

Faruki

P。

Fereidooni

H。

你的事迹

V。

孔蒂

M。

白肢野牛

M。

Android代码保护通过模糊技术:过去、现在和未来的方向

2016年

https://arxiv.org/abs/1611.10231

146年

王

W。

高

Z。

赵

M。

李

Y。

刘

J。

张

X。

Droidensemble:检测android恶意应用程序与合奏字符串和结构的静态特性

IEEE访问 2018年 6 31798年 31807年

10.1109 / access.2018.2835654

2 - s2.0 - 85046759191

147年

Hyun

年代。

赵

J。

赵

G。

金

H。

设计和分析的恶意软件——基于android的推送通知

安全性和通信网络 2018年 2018年 12

8510256

10.1155 / 2018/8510256

2 - s2.0 - 85050820781

148年

刘

Y。

郭

K。

黄

X。

周

Z。

张

Y。

检测android malwares高效混合分析方法

移动信息系统 2018年 2018年 12

1649703

10.1155 / 2018/1649703

2 - s2.0 - 85045041051

149年

赛门铁克

2018年互联网安全威胁报告》

2018年

https://www.symantec.com/content/dam/symantec/docs/reports/istr - 23 - 2018 en.pdf

150年

Al-rimy

b . a S。

Maarof

m·A。

Shaid

美国z . M。

Ransomware威胁成功因素,分类,和对策:一项调查和研究方向

电脑与安全 2018年 74年 144年 166年

10.1016 / j.cose.2018.01.001

2 - s2.0 - 85041383923

151年

Nataraj

Karthikeyan

年代。

雅各

G。

希莫

B。

恶意软件图片:可视化和自动分类

学报》,第八届国际研讨会上可视化网络安全

2011年

美国宾夕法尼亚州匹兹堡

ACM

152年

Nataraj

Kirat

D。

希莫

B。

豇豆属

G。

SARVAM:搜索和检索的恶意软件

美国计算机安全年会(ACSAC)研讨会下一代恶意攻击和防御(NGMAD)

2013年

西澳大利亚大学,洛杉矶,加州,美国

153年

Bakour

K。

Unver写道

h . M。

VisDroid: android恶意软件分类基于局部和全局图像特征,袋视觉单词和机器学习技术

神经计算和应用 2021年 33 8 3133年 3153年

10.1007 / s00521 - 020 - 05195 - w

154年

Mahindru

一个。

Sangal

a . L。

MLDroid-framework android恶意软件检测使用机器学习技术

神经计算和应用 2021年 33 10 5183年 5240年

10.1007 / s00521 - 020 - 05309 - 4

155年

赵

Y。

李

王

H。

蔡

H。

Bissyande

t F。

克莱因

J。

心胸狭窄的人

J。

的影响样品重复machine-learning-based android恶意软件检测

ACM交易软件工程和方法论 2021年 30. 3 1 38

10.1145 / 3446905

156年

辛格

J。

Thakur

D。

阿里

F。

基拉

T。

夸克

k . S。

深android恶意软件图像的特征提取和分类

传感器 2020年 20. 24 7013年

10.3390 / s20247013

157年

Vasan

D。

Alazab

M。

Wassan

年代。

Naeem

H。

Safaei

B。

郑

Q。

IMCFN:基于图像的恶意软件分类使用微调卷积神经网络架构

计算机网络 2020年 171年

107138年

10.1016 / j.comnet.2020.107138