文摘

人类大脑皮层的工作原理后,分层时间内存模型提出了这是一个序列学习的理论框架。分类和数值类型的数据都是由HTM处理。语义折叠理论(SFT)是基于HTM代表数据流进行处理稀疏分布的形式表示(SDR)。对自然语言认知和生产、SFT提供一个坚实的结构背景语义描述证据基础的语义基础阶段的语言学习。从数据流异常的模式,不遵循预期的行为。任何流的数据模式可以有一个数量的异常类型。在数据流中,一个单一的模式或模式密切相关,发散和偏离标准,正常,或预期称为静态(空间)异常。时间异常是一组模式之间的意想不到的变化。当改变第一次出现,这是记录为异常。如果这种变化的次数,然后它被设置为“新常态”,作为一个异常终止。 An HTM system detects the anomaly, and due to continuous learning nature, it quickly learns when they become the new normal. A robust anomalous behavior detection framework using HTM-based SFT for improving decision-making (SDR-ABDF/P2) is a proposed framework or model in this research. The researcher claims that the proposed model would be able to learn the order of several variables continuously in temporal sequences by using an unsupervised learning rule.

1。介绍

如今,异常行为检测在流媒体应用中是一项非常具有挑战性的任务。系统必须处理的数据,然后输出一个决定实时快速的决定,而不是让许多传递或批文件。通常在许多情况下实际的情景中,传感器的样品流足够巨大的有一个小机会,更不用说专家的干预。操作在一个无监督,自动化方式通常是必需的,和作为,探测器应该继续学习和适应不断变化的统计数据,同时进行预测。大多数时候,真正的目标重点是预防,而不是检测,所以它是极其需要,还需要尽可能早地检测异常行为,给予足够的可操作的信息最好之前任何系统故障的机会。这是一个艰巨的任务来检测异常行为和比较它与任何现有标准。此外,此外,实时应用程序实施自己的特定需求和挑战,必须考虑之前决定的结果。

1.1。需要异常行为的检测

异常定义良好的数据模式,不符合预期行为(1]。包含不同的数据流模式可以有几种类型的异常。空间(静态)异常在某些情况下是一个单一的模式或可以是一组相对密集的数据流模式偏离标准,正常,或预期。时间异常是一组惊人的模式之间的转换(2,3]。它是非常困难的,在许多情况下,是不可能检测时空异常,如果数据流模式高度随机和突然。然而,它可以检测随机数据的分布的变化,指示为分布异常(4,5]。这些类型的异常命名为临时异常。首先当一个独特的变化出现,那么它是一个异常。如果它出现的次数,那么它被称为“新常态”或行为变化不是异常(6]。

1.2。研究动机

分层时间内存(HTM)是一个学习系统,不断地从环境中学习在线(7- - - - - -9];它检测到临时异常,立即将他们当他们新的标准。HTM功能是输入数据的类型、数值和分类。两种数据类型可以合并在一个输入数据流HTM因为他们都转化为稀疏分布式表示使用编码器(SDR)。每一次,HTM计算反常积分的新模式在进入[10- - - - - -13]。如果收到的是对称的预测模式,那么异常分数是零。如果模式是完全不同的,那么比分是1。部分预测模式有一个分数在0和1之间。特别提款权的输入数据流确定相似。之间的“相似”的实际收到的基础模式和预测模式HTM得分。较大的实际和预测输入模式之间的重叠导致最小或使异常分数较小。

HTM学习使用破裂过程的开始。破裂发生如果没有一个细胞(比特)列预测;然后,所有的细胞都是活跃的。它发生在没有上下文。在每次实例,异常分数计算简单的分数破裂的数量列列除以总数量的活跃。一开始的训练,异常分数将会很高,因为大多数模式将是新的。HTM学习,异常分数会降低,直到有一个流的变化模式。

1.3。问题公式化

保持在查看HTM模型中,主要研究的问题是制定如下:

我们如何开发一个健壮的框架,可以检测异常行为实时数据流(微博),并将其转换成同步预测向量基于阈值进行比较,计算使用基于HTM语义折叠呢?

1.4。研究的贡献

(我)一个健壮的异常行为检测框架使用HTM基于SFT对提高决策(SDR-ABDF / P2)(2)该模型能够学习的几个变量连续时间序列通过使用一个无监督学习的规则(3)拟议的技术也是Yelp数据集上进行了测试,结果是非常显著的。这工作显示96%的准确率(iv)许多实验在不同的数据集样本已实现该模型成功地执行(v)NAB (Numenta异常基准)是另一个基准,试图提供一个工具来测试和测量控制和可重复的环境流数据不同的异常检测算法

本文的其余部分组织如下:部分2概述这项工作中使用的基本概念;节3我们回顾文献;部分4提出描述方法;节5结果的分析和讨论,最后,部分5重点是结论和未来的工作。

2。初步的概念

新技术的发展对机器智能的发现大脑皮层的工作原理。

2.1。大脑皮层

大脑皮层是大脑没有the75%。大脑皮层使用非常普遍的学习算法在视觉,听觉,触觉,行为,发现了35年前的一切(14]。大脑皮层是一个器官的记忆学习通过感觉器官的活动,如视网膜,耳蜗,体细胞。他们对皮层形成相似的匹配模式的操作2,15- - - - - -17]。大脑皮层学习从连续变量的感官数据预测模型。生成的预测模型、异常和行动(行为)。大部分的感官变化是由于感觉器官的运动。大脑皮层学习一个sensory-motor-model来自世界各地。大脑新皮层是哺乳动物大脑知识思想的基础。视觉、触觉、听觉、语言、运动和高水平的规划都是由大脑皮层(18- - - - - -20.]。给出这样一个收集不同的认知功能,它可以将大脑皮层的发明是一个同样多样化的专业神经算法套件。这并非如此。大脑皮层显示神经回路的显著的坚定不移的模式(21,22]。生物学证据表明大脑皮层实现一套很常见的算法来执行许多不同的智能功能。皮质学习算法是令人难以置信和巨大的可接受的语言、工程、科学和艺术。它提供了一组原则。然而,皮质学习算法不提供最佳解决方案的任何问题,但一个通用和灵活的解决方案23- - - - - -25]。人们喜欢通用解决方案的问题,没有什么是比人类大脑皮层更普遍。

2.2。分层时间记忆

HTM缩写层次时间记忆,大脑皮层的一个术语,用来描述模型(14]。HTM是一个机器学习技术,旨在捕捉大脑皮层的结构和算法性能(8]。HTM只提供了一个理论框架来理解大脑皮层和它的许多功能(26]。htm可以被视为一种类型的神经网络。然而,就其本身而言,“神经网络”一词不是很有用,因为它已经被应用于各种各样的系统(27]。HTM模型神经元(HTM模型中,他们被称为细胞),安排在列,在层的地区,在一个层次结构(28]。

顾名思义,HTM基本上是一个基于内存的系统。HTM网络训练的时变数据和取决于存储大量的模式和序列。数据存储和检索逻辑上是一个不同的方式从今天程序员所使用的标准模型。现有的计算机内存有一个平坦的组织和没有一个固有的观念和时间观念。一个程序员可以实现任何类型的数据组织和结构的平板计算机内存。他们有控制和信息存储(29日]。相比之下,HTM内存限制。HTM内存层次组织,本质上是基于时间的。信息总是存储在一个分布式的方式。HTM指定的用户层次结构的大小和训练系统,但HTM控制信息存储(存储在哪里以及如何30.]。

HTM网络更不同于经典的计算;它可以用于通用计算机模型这些htm只要他们统一的关键功能层次结构,时间,和稀疏分布表示。将创建专门的硬件来生成专用HTM网络(29日,31日]。

更频繁,这说明HTM性质和原则使用例子来自人类的视觉,触觉,听觉,语言和行为。这样的例子是有用的,因为他们是直观和容易理解。然而,重要的是要记住,HTM能力一般。他们可以很容易地接触到非人类的感官输入流,如雷达和红外、或单纯的信息输入流,如金融市场数据,气象数据,网络流量模式,或文本。htm机器学习和预测,可以应用于许多类型的问题(14]。

2.3。语义折叠技术

HTM的基础上,特别提款权或语义折叠技术数据编码的机制(32,33)使用以下属性:(我)许多位用来表示一个数据项,也许在数千人。每一位表示一个神经元(称为细胞)。在某种程度上,活动是由1,不活跃的神经元为0(2)其中一些是1的,大多数都是0。例如,在2000位,只有2%是活跃的。稀疏意味着大多数神经元活动因此由0(3)每一位被称为语义有一些意义。每一位代表一个特定的功能(iv)这代表的意义是后天习得的。通常最高四十属性来表示数据

基本区别HTM序列前生物启发记忆和序列学习模型是使用特别提款权模型(34]。在大脑皮层,信息主要是由健壮的少量的神经元的激活在任何时候,称为稀疏编码(21,35]。通常,HTM序列内存使用特别提款权来表示时间序列。基于数学的特性特别提款权(26,32),HTM序列中的每个神经元(称为细胞)内存模型可以地学习和分类大量模式下不同寻常和嘈杂的环境13]。一个具有讽刺意味的分布式神经表示时间序列的发展从HTM序列计算内存。虽然重点是序列预测,这种表示方法是有价值的任务,如异常检测(36)和序列分类。

使用一个灵活的编码方案对在线流媒体数据分析很重要,在一些独特的象征,往往是未知的。所以经常,它需要能够在运行时改变编码方案的范围而不影响之前的学习。这需要一个灵活的算法使用一个灵活的编码方案,它可以代表很多独特的符号或大范围的数据(13]。中使用的特别提款权HTM有非常大的编码能力和允许的瞬时表示多个预测以最小的碰撞。这些特性让特别提款权理想编码格式为下一代的神经网络模型(37,38]。

3所示。回顾文献

异常被定义为在某一特定时间点,系统的性能不熟悉,明显改变了从以前的性能。根据这一解释,没有必要,一个异常推断问题。

3.1。之前的作品

虽然HTM模型使用语义折叠技术的使用是最新的异常行为检测模型,然而流数据的异常严重经过多年研究[14]。创始人Subutai艾哈迈德和斯科特Prudy HTM的工作模型。在时间序列数据,异常检测是自1972年以来大量研究[6]。监督和semisupervised方法被用于分类。虽然标签数据给改善结果,监督方法不恰当的异常行为检测(11]。持续学习,在我们的案例中是普遍的要求是不可能监督或semisupervised学习算法进行了研究。其他方法,如计算阈值,使得数据集群和指数平滑法,只能用于空间异常检测(39]。Holt-Winters预测的一般实现商业应用是后者的一个例子40]。最常用的是变化点检测方法时间异常的识别能力。另一个模型方法是帧时间序列数据的两个独立的移动窗口,和变化检测时间序列指标显著偏差(41,42]。这些方法往往是非常快速的计算和内存需求较低。统计方法的异常检测性能始终依赖于e windows和阈值的大小。数据的变化,由于假阳性结果拒绝了值,所以需要更新和变化阈值,以减少假阳性,检测异常。结合不同的统计算法,地平线项目提供了一个开源实现的几个统计技术来检测异常流数据(39]。异常检测问题也被广泛研究机器学习方法在计算机安全文献,基于命令创建用户配置文件序列,将目前的输入序列比作概要文件使用相似度度量。系统学习分类当前行为与过去一致或异常行为(43]。异常行为检测在拥挤的场景在计算机视觉领域(数据流)评估基准数据集包含了各种各样的问题与人类的人群,结果证明该方法最好最先进的方法(44]。其他一些算法在复杂场景中使用的检测时间异常。检测异常,ARIMA建模时间数据是一个通用的方法(与普通模式)与季节性45),当数据发生在普通模式。已研制出许多扩展克服季节性周期确定的问题(46]。改进ARIMA技术应用多元数据集来检测异常也被深入研究[5]。分割的时间序列数据对网络异常检测,一个名叫贝叶斯的方法变化点检测方法是使用47,48]。雅虎公布的天哪是一个开源框架结合常见的异常检测算法的异常检测与时间序列预测技术(49]。另一个开放源码的异常检测算法对时间序列数据发布的Twitter (50]。有几个模型方法应用于特定的领域,例如,在飞机发动机测量,异常检测方法2),温度变化在云数据中心(3),和检测欺诈行为的ATM (51]。一些其他的彻底审查(1,52,53]。但在这里,我们的重点是使用HTM异常行为检测。来自大脑皮层的工作原理,机器学习算法HTM有趋势模型空间和时间模式在连续的数据流(38,54]。在序列预测,HTM比较复杂non-Markovian序列(34,55]。htm不断学习模型,自动吸收变化的统计数据,这是一个属性适合流媒体数据分析。最近的反常行为的另一种方法是在测试LGMAD NAB算法的数据集使用长短期记忆和高斯混合模型(56)与实现卓越的精度。

3.2。研究差距基于以前的研究的局限性

一个健壮的异常行为检测框架使用HTM基于SFT对提高决策(SDR-ABDF / P2)是必需的,这是我们的地址。模型应该能够学习的几个变量连续时间序列通过使用一个无监督学习的规则。

4所示。提出的方法

domain-dependent评论或微博的实时数据流(来自yelp数据集)被送到编码器将数据转化为特别提款权的表示。这些sdr是应用于HTM模型。HTM算法工作,发现任何异常行为在输入数据流从domain-dependent微博或评论。

提出的方法命名为SDR-based语义折叠技术基于HTM理论(SDR-ABD / P2),如图1

特别提款权的文本输入,生成方法和我们的学习行为从一个给定的文本并检测异常或不是一个异常。如果一个文本被确定为异常,即。,its behavior is different from already existing texts, the learning process will update itself from this anomaly to set the behavior for next coming inputs (texts). If next text T2 behaves normally, it means the proposed system has learned from previous detected anomaly; otherwise, given text will be excluded from this cluster.

4.1。HTM模型实现

稀疏分布式表示二进制向量为HTM模型的操作而设计的。这些向量命名为特别提款权HTM提供输入。将标量值的自然语言文字转换成二进制向量用最少的“积极”位,使用编码器。这些sdr结合通过池过程导致语义空间有百分之二活性位向量的2048位(14]。HTM模型使用一组对称模型的参数的实验。

4.2。编码

借助在线手腕子,词块编码到SDR。重叠的编码器创建表示输入类似在一个或多个特征的数据。

4.3。池

这是一个临时空间存储同义词(从WordNet用作腕)的话语从所有文本没有复制文字。这里,池更新和同义词提取过程都是迭代由于每个文本的本质有多个模块,每一个模块有多个同义词。

4.4。特别提款权

它是一个二进制向量在第一行代表了桶同义词第一个文本和第二行表示一桶第二个同义词等等,和第n行表示一桶同义词第n个文本。每一行是一个列表为每个文本。每个词的索引池/池的同义词。学习的过程是基于每个到来的特别提款权的类比,将工会与以前的联合列表。

4.5。数学模型

(1)让向量 代表一个输入的状态编码的形式特别提款权从实时微博系统在某一瞬时的时间t。一个连续的数据流的输入是暴露在我们的模型 (2)在一个特定的时间 在每一个点,它是了解系统的行为,通常的或不寻常的。这个决心必须做过实时时间 ,没有任何向前看。HTM这是一个机器学习算法试图实时匹配这个条件。由于HTM网络不断学习和吸收的时空特征输入如果一个输入 给系统,那么向量 稀疏表示的二进制代码的输入吗 在时间 (3) 是一个输入向量代表一个预测向量 ,即。,a prediction of the next input (4)之间的差异和偏差计算模型的预测输入和实际输入和标签作为原始异常分数。实际和预测之间的交集稀疏向量的方法用于计算。在时间 ,原始异常分数是贴上 因此它可能是 如果模型的预测是正确的,精确的预测输入向量的向量是一样的,那么其他原始异常分数是0,1如果完全相反或不同。如果的价值 是在0和1之间,它显示了输入和预测向量之间的相似度。(5)基于HTM模型预测的历史,异常可能是唯一值定义了“反常的当前状态是如何”。

如果 作为一个联盟的个人预测,然后HTM模型有助于表示多个预测。与二进制向量稀疏足够扩展维度,用特殊的错误机会,许多预测可以同时在布鲁姆过滤器(39,57]。

4.6。生异常分数计算

原始异常分数之间的偏差计算实际所需的测量和预测输出在特定的时间。它是计算从预测和实际稀疏向量之间的十字路口。异常的计算似然值,一个窗口的最后一个 生异常分数。HTM系统模型分布为正态分布。 连续样本均值和方差计算和更新从之前的异常分数。如图所示(下39),

被建模为一个滚动的正态分布分布的均值和方差的不断升级之前的异常分数。然后平均最近的异常分数计算和应用高斯尾数概率阈值(Q-function, (58])做出决定异常的宣言。我们使用这个可能性值作为补的尾概率(39]。 在哪里

反常行为将被报道

代表短期移动平均线窗口,在那里

SDR-ABDF / P2阈值 并描述了检测到异常如果它非常接近1。

如果 作为一个联盟的个人预测,然后HTM模型有助于表示多个预测。与二进制向量稀疏足够扩展维度,用特殊的错误机会,许多预测可以同时在布鲁姆过滤器(39,57]。

输入文档的文档
输出集群preCluster
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
处理池和特别提款权
PoolSDR()函数
d的文档:
wtSet = (word_tokenize (d))
t wtSet:
ww = sentiwordnet.senti_synsets (t)
如果len (ww) > 0, t stop_words:
ww: w的
如果w.synset [0]。在bucketArray:
bk = [i t bucketArray.index (w.synset.name ()))
bucket.append (bk)
如果len(桶)> 8:
打破
其他:
bucketArray.append (w.synset.name ())
bk = [i t bucketArray.index (w.synset.name ()))
bucket.append (bk)
如果len(桶)> 8:
打破
如果
如果
结束了
如果
结束了
结束了
结束函数
聚类过程
集群()函数
i = 1
集群= " "
b在桶:
如果([0]= =我):
集群= str(集群)+ " + str (b [2])
其他:
preCluster.append(集群)
集群= " "
我+ 1 =
集群= str(集群)+ " " + str (b [2])
如果
结束了
结束函数

5。结果与讨论

我们有一组文字命名为t1 t8, t1, t2和t3属于同一集群和t4文本一直作为一个局部异常。提出了系统从t4,没有发现t5部分异常,因为系统已经更新它从以前的输入。接下来,t6部分异常,系统不会更新根据新的输入,即。t6,所以它将被视为一个纯粹的异常。文本表所示1

5.1。池流程应用程序

2显示了一个使用WordNet池过程的输入向量,,1列包含所有块的同义词在t1,第二列包含所有块的同义词在t2,第三列包含所有块的同义词在t3,等等。

3说明了池格式,所有单词表2建立索引的方式重复单词删除。因此,57个单词索引从0到56。

5.2。特别提款权的一代

4显示八列,由八个文本的分析。在1“大”列,价值[1,0]讲述词的同义词在t1呈现“大”“0”指数池等等。所有列都是基于相同的类比。

之后,一个特别提款权向量生成的文本,例如,第一行的特别提款权t1获得第1列的表4从每个单元格显示,通过提取最后价值(“0”,“1”,“1”“2”“1”,“1”,“1”“0”“3”“4”“4”“5”,“6”,“5”)。这样的特别提款权为所有文本如表所示5

5.3。异常行为检测和学习过程

据推测一开始,提出工作的大脑是空的,和t1包含目标文本,该系统将检测相似的文本,将学习新的文本(数据流)。这里,学习是通过给定文本与之前发现的工会联盟,保持在开始认为工会是空的,所以t1将被认为是集群的一部分(见表6与先前的联盟),然后结合本文,如下表所示。

现在的相交SDR t2与以前的联盟,t2的元素是确定。元素的数量是5,在拟议的系统中,阈值设置为5,所以t2将被认为是类似的,即。,正常的文本如表所示7。现在特别提款权的t2,新联盟更新。

再次重复这一过程,特别提款权的元素从十字路口t3与先前的联盟,获得数量的元素是8,所以t3被认为是类似的,即。,正常的文本如表所示8。后来,新的联盟更新,t3的特别提款权。

再次,通过确定SDR的元素从路口t4与先前的联盟,这些元素是0,所以t4文本被认为是部分异常如表所示9然后更新了新的联盟t4的特别提款权。

如果不视为成功的文本部分异常,t4就不是一个纯粹的异常。现在确定SDR的元素从十字路口的t5与先前的联盟,获得元素的数量是5,所以t5将被认为是类似的,即。,正常的文本如表所示10,所以t4不是一个纯粹的异常和更新的新联盟t5的特别提款权。

确定SDR的元素从十字路口的t6与先前的联盟,获得元素的数量是0,所以t6将被视为部分异常文本如表所示11。再次,新联盟更新t6的特别提款权。

同样,特别提款权的元素从十字路口的t7与先前的联盟,获得元素的数量是0,所以t7将被视为部分异常文本如表所示12,所以t6是一个纯粹的异常,而不是局部异常。因此,新联盟的特别提款权t7更新。

在最后一步中,通过确定SDR的元素从路口与先前的联盟,t8元素的总数是20,所以t8将被视为正常的文本如表所示13。再一次,新联盟的特别提款权t8更新。

准确地说,从上面的过程,得出t1、t2、t3、t4 t5, t8有类似的行为,但又部分异常,因为t5显示正常的行为。因此,t6被视为纯粹的异常,因为t7已经证明了自己是一个局部异常原因由于t8又是正常的文本,如图2

在我们的例子中,文本的总数是8,我们已经考虑阈值等于5,也就是,

我们发现这些异常基于不同的值,但发现不准确的结果。在值6和7,它是发现,t2, t4, t5, t6, t7异常如图3

尽管SDR-ABDF / P2使用HTM作为基本的时序模型,技术并不特定于HTM的可能性。它可以用于任何其他算法,输出一个稀疏的代码或标量异常分数。的总体质量检测器将依赖于底层的模型来表示域的能力。

5.4。统计分析
5.4.1之前。数据源

数据已经收集了来自Yelp数据集(公开可用的设置或评论)进行研究。大约一百五十的评论被认为足够的测试和验证我们的异常行为检测框架命名为SDR_ABDF / P2。收集到的评论被转换为特别提款权。样品清单的数据集提出了表14显示三列预测和实际值的假设。

实际的类别:“公元前”代表行为变化而“A”代表异常,并分配给BC的数值是“1”和“0”

真正的行为改变(流化床燃烧器):如果我们提出系统确定评审为“1”的值和实际值也是“1”,这意味着它是时间待定。

错误的行为改变(时间待定):如果我们提出系统确定评审为“1”的值和实际值为“0”,这意味着它是流化床燃烧器。

真正的异常(助教):如果我们提出系统确定评审为“0”的价值和实际价值也“0”,这意味着它是助教。

错误的异常(足总):如果我们提出系统确定的价值评估为“0”和实际值为“1”,这意味着它是足总。

5.4.2。混淆矩阵的措施

特别在机器学习和统计分类混淆矩阵,也称为一个误差矩阵,是一个特定的表,允许的可视化在监督学习算法的性能,在无监督学习,它被称为匹配矩阵。矩阵的每一行表示一个预测类的实例,而每一列表示一个实际的类的实例,反之亦然(59]。很明显从矩阵的名称混淆矩阵可以方便地查看系统是否混淆两类(即。,一般不当一个作为另一个)。它也定义为特殊类型的可能性表,有两个维度,一个是“实际”,另一个是“预测”,和相同的“类”两个维度(集60]。如果在任何实验我们已经“P”积极和“N”-实例的任何条件,制定四个结果 混淆矩阵可能是如下(61年,62年]。

从混淆矩阵分析后,提出的方法取得了96%的准确率和剩余的措施如表所示15

的图形表示样本yelp的数据集的结果如图4:

6。结论和未来的工作

6.1。结论

在人类大脑皮层的工作原理,HTM模型开发了杰夫霍金斯,这是一个提出了序列学习理论框架。这两种类型的数据数值和分类输入类型HTM模型无疑是最适合的工作。SFT基于HTM代表数据流进行处理稀疏分布的形式表示(SDR)。SFT提供了一个框架来展开对自然语言语义信息是如何被操纵的观察和创造,对语义基础的细节在语言学习的初期阶段。

所有的数据模式,不同于期望基于被称为前输入。这些异常可以是不同的类型。单个数据模式或一组密集当偏离其正常行为模式被称为空间(静态)异常。当模式之间发生一些令人惊讶的变化时间异常。突然改变时记录,这是一个异常,但是当这种变化出现的次数,那么它被称为新常态。由于持续的学习特性,一个HTM主要检测到一个异常,然后迅速转换到一个新的正常如果持续不断的变化。

一个健壮的异常行为检测框架使用HTM基于SFT对提高决策(SDR-ABDF / P2)是一个拟议的框架或模型在这个研究。研究者声称,该模型能够学习的几个变量连续时间序列通过使用一个无监督学习的规则。拟议的技术也是Yelp数据集上进行了测试,结果是非常显著的。这工作显示96%的准确率。许多实验在不同的数据集样本已实现该模型成功地执行。NAB (Numenta异常基准)是另一个基准,试图提供一个工具来测试和测量控制和可重复的环境流数据不同的异常检测算法。

6.2。未来的建议

(1)每当使用语言模型在传统的自然语言处理与语义背景下,提出可以使用系统SDR_ABDF / P2(2)数字测量解释作为语义实体词等其他活跃的研究领域。这样的研究将使用日志文件的历史测量数据而不是参考文本的语义基础。测量的相关性将遵循系统特定的依赖关系(3)下一个和最佳的研究领域是开发的硬件架构。这将提升的速度相似性计算过程。在非常大的语义搜索系统持有数十亿文档,瓶颈是相似度计算。使用内容可寻址内存(CAM)机制,search-by-semantics的类似作用将加速在非常高的速度

数据可用性

可以提供基础数据支持结果发送请求到相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这个项目是由院长以来科研阿卜杜勒阿齐兹国王大学(域),吉达,在批准号rg - 12 - 611 - 38。因此,作者承认和感谢安全域的技术和财政支持。