文摘

监测电力消耗在家里是一个重要的方式来帮助减少能源使用。不干扰负荷监控(NILM)是现有技术帮助我们有效监控电力消耗和昂贵的。NILM是一种很有前途的方法来获得单个设备的电力消费的估计从聚合测量电压或电流的分配制度。在先前的研究中,基于隐马尔可夫模型(HMM)模型研究了。然而,增加设备,电器的多态,类似的设备功耗NILM最近的三大问题。在本文中,我们解决这些问题通过提供我们的贡献如下。首先,我们提出了最先进的能源崩溃基于长期短期记忆递归神经网络(LSTM-RNN)模型和其他先进的深度学习。其次,我们提出了一个新颖的签名来提高分类性能多态模型的设备情况。我们应用该模型对两个数据集,如UK-DALE和REDD。通过我们的实验结果,我们已经证实模型优于先进的模型。 Thus, we show that our combination between advanced deep learning and novel signature can be a robust solution to overcome NILM’s issues and improve the performance of load identification.

1。介绍

全球对能源的需求正在迅速增长,对电能的需求增长更为迅速(1]。电力能源需求将在2010年至2050年间将增加一倍2]。然而,随着全球人口持续增长和化石燃料日益枯竭,全球目前电力生产方法是不可持续的。国际电工委员会(IEC)已经表示,智能和经济使用的电力,作为主要的能量来源,将是最重要的因素在解决能源问题3]。因此,研究如何有效利用能源在工厂进行,建筑,和家庭。

研究领域的工厂,工厂正在进行能源管理系统(《)高效电能使用。最近,它与工业的网络物理系统(CPS) 4.0,和相关研究将更加活跃在这一领域(4]。领域的建筑,建筑能源管理系统的研究正在进行中(bem)来减少不必要的能源消耗(5]。根据不同的外部环境,空调可适当减少电能使用控制。通过监测可减少不必要的能源消耗。在家里,智能电网将能够有效地监控和管理能源,因为它变得越来越现实6]。

增加国内电力使用效率的一种方法是激发积极的消费者行为变化(7]。这可以通过分析能源使用。不干扰负荷监控(NILM)是一种选择。NILM过程分析电压和电流的变化进入房子,推导使用电器的房子连同他们个人的能源消耗。将住宅电力负荷信息的初始概念提出了哈特(8]。他演示了如何不同的电器产生不同的签名,包括他们的有功功率,电流,电压(图1)。他展示了开关事件足以描述一些电器的使用。许多研究人员研究这个概念和改进NILM模型。

以分解基于NILM功耗,我们必须理解电器的功能。哈特定义了三种类型的设备模型根据特性。三种类型是开/关,有限状态机(FSM),连续变量(8,9]。

第一种开/关二进制各州权力的一盏灯和一台烤面包机等。图2(一个)显示模式的光的力量。当它打开,从10到12瓦功率增加。1型可以很容易地分类的电器,因为明确的功能。然而,如果两个电器也有类似的功耗运行,他们无法区分。在这种情况下,一个分类模型并不知道哪些设备是当前发电。因此,我们需要一个额外的因素来区分它们。

第二种类型FSM有多个州的权力如灯和风扇。灯的功率模式如图2 (b)。三种操作状态灯显示亮度。这种设备可以通过FSM模型。所以它可能是简单的对一个设备2型进行分类。然而,当多个功耗总结,分类变得复杂,因为很难找出当前权力起源于变量的模式。因此,我们需要观察一段时间模式为分类电器。

第三类有一个连续的权力模式如洗衣机和一个光衰减器。在图2 (c),功耗波动而加热/清洗或清洗/干燥的衣服。严格地说,它是一个多个国家家电但不能建模由于无限的中间状态。分类3型电器,我们必须理解功能,观察远程模式。

最后,我们定义一个额外的类型总是在。类型4的电器总是操作一个特例除外。例如,一个冰箱在图2 (d)是操作一致。4设备类型可能有一个周期模式或单一模式。根据情况,我们可以减少电器当我们训练分类模型。

这项工作的主要贡献包括两点。第一个是建设先进的NILM模型。该模型健壮的反对增加设备由于降低了时间复杂度。虽然我们使用低采样率数据,跨州电器和类似的电力设备可以有效地分类。作为学习远程电源模式的结果,我们可以解决前面的问题,提到的部分3。我们通过实验结果表明,该模型优于UK-DALE和REDD。第二个是发现小说的签名。拟议的签名多态设备提高分类的性能。通过强调权力变化当我们训练模型,变化可以明显训练有素。我们展示效率通过验证实验部分5。3

本文组织结构如下。我们给问题陈述在部分相关工作和提出解决方案2。部分3描述了两个NILM数据集用于我们的实验。节5我们进行两个主要的实验。第一个实验是关于小说签名的验证预期的影响和学习体系结构。第二个实验是关于测量的整体性能和比较现有模型和状态的艺术。最后一节中,我们总结我们的工作和提供结论。

2.1。基于签名的方法

有两种不同的签名。第一个特征是稳定状态。它利用稳态特性,导出稳态运行下的电器。哈特提出了概念NILM和力量变化的方法同时在他的论文(8]。在这种方法中,真正的权力( )和无功功率( )被用作输入签名。通过计算的变化 ,电器是机密的。哈特演示了如何不同电器功耗产生不同的签名。他显示开/关事件足以描述一些电器的使用。这种方法的优点是,我们可以使用一个低采样数据集,很容易识别设备能耗高。然而,很难分类器具有低功耗和跨州电器类型2 - 4图2。除此之外,电器有类似的功耗不能分类。改善NILM,其他研究也尝试并提出替代签名识别技术。Najmeddine等人,Figueiredo等人目前的使用 和电压 签名(11,12]。他们提取特性,比如均方根(RMS)的电流和峰值。这些特性非常适合分类的电器在厨房里。然而,跨州电器不能分类。的一个签名从高采样率的数据中提取的谐波电流。有几个研究获取谐波通过傅里叶级数(13- - - - - -16]。类型1和4的电器很机密的电流谐波。但它需要谐波的所有电器的组合。增加设备的数量,谐波对分类指数增长。这不是一个实际的方法和记忆问题可能发生。为NILM研究有奇特的方法。林等人提出了设备基于形状的分类方法 轨迹(17]。他们分类的电器与高精度8组。古普塔等人试图识别设备根据设备运行产生的噪声(18]。然而,噪声很容易受到环境的影响。所以它不能高效签名。此外,我们需要装备设备测量噪声。因此,它不能实用方法。

第二个签名是瞬态。这个签名不重叠与稳态相比签名。然而,高采样率的要求,以捕获瞬变是主要缺点。张等人表明,功耗,同时打开一个设备可以计算为一个签名(19]。五年之后,他们发现了权力的瞬态物理行为通过使用小波变换(20.]。另一种方式的分类、状况等人提出了包络谱分析方法通过短时傅里叶变换(STFT) [21]。通过这种方式,利用瞬态功率作为签名的方法适用于分类类型1 - 3。但它不能赶上type 4。Norford和状况表明,瞬态数据的形状可以是一个功能(22]。科尔和Albicki使用功率峰值产生的过渡状态(23]。这个签名是有效的分类,但它应用于几个特定的设备。这样,使用当前的方法瞬态当电器打开适合分类类型1和2。但它不能赶上类型3和4。Patel等人采样的电压噪声提取暂态事件(24]。他们定义了三种类型的噪声:开/关瞬态噪声、稳态电压噪声和稳态连续噪声。然而,使用这种方法,我们需要知识的力量流如无功功率、有功功率,相位的电压与电流。使用电压噪声的方法适用于多态电器的分类。

2.2。基于学习模型的方法

一些有用的图形模型,变异嗯,用于NILM。使用FHMM Zoha等人提出了一个解决方案识别设备特定的负载模式从聚合能力测量25]。他们定义的五个功能组合的功率测量等实权,无功功率和电压波形。他们完成了 测量0.614五电器使用多态FHMM时。科特勒和约翰逊也用FHMM NILM [26]。他们已经收集了自己的数据集称为REDD计划将解释的部分4。平均准确率为47.7%。使用FHMM改善研究,许多研究人员已FHMM延期。金等人开发的设备行为的概率模型使用变体FHMM [27]。变异的阶乘隐半马尔科夫模型(FHSMM)条件FHHH (CFHMM)和条件FHSMM (CFHSMM)。图3显示FHMMs变体之间的关系和他们的性能比较。

科特勒和Jaakkola FHMM添加剂FHMM和差异(28]。推测,他们提出了一个附加分数近似映射(AFAMAP)算法。他们为7电器取得了0.603的回忆。牧师el人提出不同的变体嗯和扩展的维特比算法(29日]。Zeifman与稀疏的转变提出了维特比算法(巨大的)30.]。他使用马尔可夫链对NILM (MC)。

3所示。问题陈述并提出解决方案

3.1。问题陈述

NILM的数据被收集在一个时间序列。因此,模型处理顺序数据用作设备分类模型。模型通常使用隐马尔可夫模型的阶乘(FHMM)基于马尔可夫过程和它的变体(32]。然而,这些模型有三个问题分类的电器。存在的问题如下:(我)第一个问题是关于时间的复杂性。FHMM,时间复杂度 在哪里 是电器和的数量吗 可能的隐藏状态的单位和吗 是观测序列的长度。随着设备数量的增加,时间复杂度也呈指数增加。这将导致减少模型的分类性能。(2)第二个问题是关于跨州设备分类的困难。的多态设备设备的多个状态功耗。区分它们,远程模式应该被训练。然而,现有的模型是基于一阶马尔可夫过程。因此,该模式不能有效地训练。此外,低采样率数据收集的数据(例如,1 ~ 6赫兹采样率)是不适当的多态分类的电器。如果我们使用NILM高采样率的数据,这个问题可能得到解决由于捕捉瞬时能耗的变化。但有一个限制的现实生活,因为高成本的设备需要收集高采样率数据。(3)第三个问题是一个困难的分类器具有类似的功耗。如果我们只使用能耗作为观察FHMM,模型不能区分类似的电力设备。

我们调查的基本模型和相关作品NILM迄今为止。然而,有一些问题从原始NILM的基础知识。在本节中,我们总结了三个。

问题1。研究人员使用FHMM和NILM FHMM变异(25- - - - - -27,29日]。正如我们所知,FHMM的时间复杂度 在哪里 是电器和的数量吗 可能的隐藏状态的单位和吗 是观测序列的长度。因此,增加设备的数量,时间复杂度也增加成倍增长。因此,分类模型的性能下降。我们可以很容易地注意到,在图3 (b)

问题2。第二个问题是,FHMM和FHMM变异很难分类类型2到4电器。长期模式是需要学习,但大多数模型都是基于一阶马尔可夫链(35]。这些模型预测当前状态通过之前的状态。因此,FHMM FHMM变异有限制多态分类的电器。此外,还有另一个问题是基于签名的视角。在基于签名的方法,我们可以把低采样率的签名和高采样率的签名。第一个签名的优点是,我们可以很容易地收集数据从一个简单的传感器。然而,低采样率的签名不适合分类类型最研究[2到48,11,12]。为了解决这个问题,我们需要更精确的数据和高采样率的签名。这个签名的人员分类所有类型的设备。然而,特定的设备应该配备为了得到签名。这意味着应用程序所需的高成本是真实的生活。这不是一个好方法推广NILM。

问题3。最后一个问题是难以分类的电器有类似的功耗。在前面的模型,观察只是一系列的功耗。软件还处理操作时间但是我们怎么能知道每个设备的持续时间?持续时间不稳定,这是一个非常无聊的业务提取时间为每个设备。例如,在图4,我们提取的空调模式从一个房子。我们可以注意到,时间是不同的。它取决于用户的行为。

通过总结的问题,我们得出的结论是,问题从FHMM FHMM变体是FHMM的体系结构的基本问题。因此,我们提出一个基于深度学习NILM模型。同时,我们提出了新型低抽样签名以适用于现实生活。我们有三个挑战深度学习的成功应用。

挑战1我们的模型必须健壮即使电器的数量增加。

基于FHMM NILM模型的重要问题是,性能和增加设备的数量减少。这将是最大的障碍将NILM应用到现实生活中。因此,该模型应该健壮尽管电器的数量增加。

挑战2。多态设备应分类。

问题,当我们使用一个低采样率数据是很难分类跨州电器。这是由于这样的事实,各种模式的设备不能有效反映的主要信号(总功耗)由于宽采样差距。尽管它是1型设备,主要的信号可能是一个多态为每个设备信号的重叠信号。所以我们必须多态电器进行分类。

挑战3虽然有电器拥有类似的功耗,他们应该分类。

如果功耗两个设备之间都是一样的,他们将是相同的设备。除了这种情况下,电器有类似的功耗可以稍微有所不同。为了准确的性能,我们需要区分类似的电器。

3.2。建议的解决方案
3.2.1之上。提出了新颖的签名

序列数据从现实生活可能会选择功耗采样在1到6赫兹。因为成本的传感器,有一个限制收集高采样率的数据。推广NILM,我们必须使用低采样率等数据从一个传感器。节3,我们承认很难分类跨州电器(2型、3型和类型4)当使用低采样率数据。为了解决这个问题,我们提出一个新颖的签名,这是一个关键的输入特性。签名的主要思想是将原始信号,这是低采样率数据(能耗),使用反射率和减去一个变异功率信号从其他变体功率信号。我们表示的区别 代表原始信号的变化。的目的 是强调跨州电器应用的变化与原始信号相同的重要性,训练模型。结果是,设备的性能模型的许多变化可能比只在使用原始信号。

计算 ,我们需要生成变异功率信号。使用变异功率信号的目的是减少噪音。一个意想不到的噪音可能发生和它可以对学习有负面影响的信号模式。我们可以调节声音的反射。反映速率范围从0到0.99。功率信号,增加或减少逐渐反映到变异功率信号,而噪音,这发生在一个时刻,是反映不好。这个低反射速度降低的负面影响的噪音。然而,如果反射率太低,最初的权力模式可能没有反映。因此,它是至关重要的正常设置反射速度。通过实验部分中解释5.3.1经验,我们发现,0.1或0.01是适当的反映速度。

算法1显示了如何生成变异功率信号。该算法有两个输入: 是一系列的原始信号的时间长度 是反映如何,这是一个比反映原始信号之间的变异和变异功率信号。输出 变异功率信号生成的算法。(1)一致,变异功率信号被初始化为零。生成过程中给出了线后(5)。(2)在时间的变化 计算(3),它反映变异信号反射速度 (4)。图5是一个变体功率信号的例子。图5(一个)是一系列的原始信号时间长度为5000。图5 (b)时变异功率信号反射率是0.1。注意,模式是比原来的更平稳。这表明瞬时噪声减少而远程差异依然存在。图5 (c)时变异功率信号反射率是0.01。在这种情况下,原始信号变化缓慢变异功率信号反映出来。用两种不同的变体功率信号,我们可以计算出原始信号的变化。

要求: ,反映速度
确保:
(1)
(2) T
(3)
(4)
(5)结束了
(6)返回副总裁

这部小说签名算法的算法2。两种变体功率信号输入和小说签名代表是输出的一系列变化。 减法计算的输入。在原始信号的规模,小变化很容易忽略。然而,如果我们给予 与原始信号相同的重量,这些小的变化比以前变得更加明显。这种影响小说的签名将在部分验证5.3.2

要求: ,
确保:
(1) T
(2)
(3)结束了
(4)返回

6代表一个计算 由算法1功率信号(图的变体6 (b)从原始信号(图)生成6(一))。我们可以看到变异功率信号的模式根据反射不同的利率。功率信号在图的变体6 (b)可以输入算法2。最后,一系列的变化, ,由算法生成2

3.2.2。学习建筑

在本节中,我们介绍如何应用NILM深度学习。我们选择RNN的学习算法。RNN可以学习顺序数据,如家庭的电力消耗。我们应用LSTM隐层为了禁止梯度消失的问题。我们称之为LSTM-RNN模型。有两个原因申请NILM深度学习。第一个原因是,时间复杂度越来越高的电器数量增加FHMM变体。FHMM的时间复杂度 在哪里 是电器和的数量吗 可能的隐藏状态的单位和吗 是观测序列的长度。正如我们所看到的,电器的数量与时间有密切关系的复杂性。因此,性能下降随着设备数量的增加。在深度学习,主要的时间复杂度是起源于反向传播。随机梯度体面(SGD)通常是用于反向传播(36]。因此,SGD的时间复杂度 在我们的模型中,输出维度是电器的数量。所以时间复杂度不呈指数增加与FHMM相比。如果我们使用基于深度学习的NILM模型,该模型可以相对强劲。此外,深度学习使用通过GPU的并行计算。这意味着即使时间复杂度高,GPU可以减少它。这是其中一个主要原因为什么许多研究人员一直着迷于深度学习。备案,最新的GPU,泰坦X与帕斯卡的架构,有3584个核心,12 GB内存和11 GFLOP。

第二个原因是,长期模式无法学到的FHMM变体(见图7),因为他们是基于一阶马尔可夫链。另一方面,隐藏层LSTM-RNN是一种记忆。垫圈是多态设备的代表。虽然模式是漫长而多变的,可以是学习当我们设定一个LSTM-RNN同样的长度。这个特性可以分类多态电器和家用电器有类似的功耗。

我们意识到NILM模型基于深度学习有很高的可能性实现三个挑战。当使用LSTM-RNN模型的一个重要的事情是如何选择合适的因素的模型。这里我们发现四个因素,这被认为是有效的在我们的模型中。

预处理的方法。一般来说, 评分方法和Min-Max比例被认为是作为深度学习的归一化法。深度学习的模型具有更好的性能,当输入数据的分布接近高斯分布。Min-Max比例是最简单的方法规范化输入数据。它转换规模范围从0到1的最小和最大价值。这种方法把原分布但它不能被高斯分布。 得分方法可实现输入数据通过使用平均值和标准偏差。这种方法不能持有原分布当输入不是高斯分布。然而,重要的是,输入数据的意思是接近于零,因为如果输入都是积极的还是消极的,重量可以更新的一种方法。NILM,输入之一,电力消耗,都是正值。因此,我们使用 分数的预处理方法。我们需要一个实验部分的预处理方法5.4.1之前

重初始化方法。不对称是体重最重要的初始化。我们可以简单的认为如果权值初始化为零,更新可以清楚。但是我们很快就意识到这种方法是错误的。只有偏差值在向前传播。最简单的方式来初始化权重与不对称选择值正态分布或均匀分布。然而,这种方法有问题,输出随输入维度的方差。为了解决这个问题,需要输出的方差除以输入维数的平方根。通过这种方式,Glorot初始化,初始化通常用于初始化的重量。他们的简单的方程式如下: 在哪里 的输入和输出尺寸和数量吗 从随机选择的函数 从正态分布或均匀分布。两个方程是相似的,但他在大范围相对初始化选择的重量值。在RNN等深层神经网络,重量可以很容易地减少时没有值接近于零。这导致梯度消失的问题。因此,我们使用他初始化由于广泛的价值。一个相关的实验将在部分5.4.2

激活函数。一般来说,将softmax激活函数用于多级分类(37]。它可以选择所有类类之一。然而,在NILM,许多电器可能是在同一时间。这意味着我们需要将多个类。因此,我们假设该设备的边界是打开时输出单位价值大于它的边界。要做到这一点,我们将softmax更改为双曲正切(双曲正切)激活函数。通过这种方式,我们可以将多个设备在同一时间。乙状结肠也可以激活函数。然而,尽管乙状结肠的输出不是zero-centered, tanh zero-centered输出。因此,我们可以设置静态边界当我们使用双曲正切激活函数。

优化器。有三个SGD优化。其中一个是Adagrad。它减少学习速率信号时频繁或重量高梯度。在相反的情况下,它增加了学习速率。然而,这种方法有一个低性能由于减少了学习速率快。通过指数移动平均RMSProb解决了这个问题。亚当是RMSProb和动量的组合。它被称为SGD最有效的方法。因此我们使用亚当作为优化器。

输入原始信号(能耗) 输出单元代表每个设备的开/关状态。通过使用新颖的签名 ,我们可以期待的更好的性能分类跨州电器。我们应用辍学在输入层和隐层之间为了防止过度拟合。这是最简单的方法调整权重,适用于神经网络就像一个RNN深处。我们将隐藏单位的数量设置为双输出单元的数量。少量的隐藏单位需要更多的训练时期,而更多的隐藏单元每个时代需要更多的计算时间。我们发现双输出的数量单位是一个适当的数字NILM模型通过启发式实验。根据这些方法,我们构建的体系结构的LSTM-RNN NILM(图8)。

4所示。数据集描述

有几个NILM公共数据集。表1展示了他们的描述。其中,我们集中在两个数据集,如REDD NILM UK-DALE因为适当的。在公共数据集,我们已经收集了6 5个月期间电器和聚合数据。我们将使用我们的私人数据集。

UK-DALE最初在2014年发布,它每年都更新38]。有电力数据5家庭和每个房子都有不同的第一次测量日期。房子1包括3.5年期为52电器功率数据。16赫兹的数据将不会被使用。和房屋1、2和5包括秒的数据但没有带安全标签的数据。因此我们不会使用秒的数据。我们为6秒的数据给一个解释。表2显示了UK-DALE的详细描述。房子1大量的电器。随着设备数量的增加,很难区分NILM模型电器。但缺点是可以克服的,因为很多数据。另一方面,房屋3和4有少量的米。它们的区别是,4米的房子是共享的。例如,“tv_dvd_digibox_lamp”意味着4设备使用相同的表。当NILM模型训练数据集,共享计或做一个区分模式可能导致混乱。节5,我们可以确认共享表的影响。

REDD是第一个公共数据集NILM [26]。REDD计划的主要目的是基准测试的标准数据集NILM算法。在REDD,有交流波形数据与15 kHz的采样率。因此,REDD可以用于每个方法使用高或低的采样数据。从六个不同的采样房屋在马萨诸塞州的美国。有三个分类数据、low_freq high_freq, high_freq_raw。我们将使用low_freq数据摘要。每个房子的主要阶段抽样的数据集是由1赫兹和个人数据的每个设备采样3或4赫兹。表3显示了REDD的详细描述。每个房子都有设备在从11到26。我们重命名相同的电器如kitchen_outlets1和kitchen_outlets2。

UK-DALE和REDD的问题是总负荷和每个设备之间的异步数据由于不同的采样率。所以我们必须综合每个设备的数据生成一个输出数据集。当我们从实际家庭收集数据,噪声可以包含在总负荷。然而,在噪声合成数据不受影响。为了解决这个问题,我们收集数据的六个电器的五个月。私人数据表的描述4

5。实验

5.1。实验描述

实验的目的是满足定义的三个挑战。如下的挑战。

挑战1。我们的模型必须健壮尽管电器的数量正在增加。

挑战2。多态设备应分类。

挑战3。类似的功耗家电应该分类。

在本节中,我们提出两个验证实验的签名和学习方法和性能测量实验。第一个验证实验包括两个单项成绩。第一个是一个启发式的方法测试优化的反映速度。在这个测试中,我们计算三种不同 由三个不同的反射率。通过使用 年代,我们的火车模型相同的条件。第二个分测验与挑战2。节3.2。1这部小说,我们预期,签名可以分类多态电器有许多变化。为了验证这一点,我们训练两个模型 作为输入。然后我们分析结果。

第二个验证实验1和3与挑战。这个实验由四个单项成绩。在第一个分测验,我们要找到一个优化的预处理方法。 分数标准化和Min-Max缩放是流行的预处理方法。没有哪一个规则是适合一个特定的情况。所以我们实验他们选择优化的方法。第二个分测验是关于选择的重量的初始化方法。在初始化方法,Glorot初始化和他初始化是众所周知的提供良好的性能。但它不是透露,哪一个是更好的。因此,我们训练两个模型只有改变初始化方法和比较结果。在第三个分测验,我们比较性能随着设备数量的增加。我们可以确认我们的模型是稳健尽管电器的数量增加。在最后一个分测验,我们合成的抽样数据电器拥有类似的功耗。 Then, we confirm that the appliances are well classified or not.

最后一个实验是关于测量的整体性能。我们将使用UK-DALE和REDD培训/测试数据和测量数据中的每个房子的性能。同时,我们采取同样的实验FHMM和比较结果。实验中使用的所有模型实现和Python编程Theano图书馆。

5.2。性能指标

到目前为止我们普遍认为,最好的方法是测量分类器的性能是由其预测的准确性,也就是说,它看不见的实例的比例正确分类。然而,预测精度本身并不是一个可靠指标分类器的有效性。以及总体预测精度在看不见的情况下通常有助于看到故障分类器的性能;这是一个混淆矩阵Kohavi和院长提出的,在1998年(39]。

混淆矩阵图中描述的是9,包括四类。真阳性(TP)贴上正确积极的例子。假阳性(FP)是指负面例子错误标记为正。真阴性(TN)对应于底片正确标记为负。最后,假阴性(FN)是指正面例子错误地标记为负。

我们假设的积极状态意味着打开一个设备。当设备关闭时,我们把它视为一种消极的状态。基于混淆矩阵,我们可以计算 , , , - - - - - - 评估NILM模型。他们给出的公式计算值

回忆是一个正确分类的数量比实际的总数积极的实例。的意义,回忆高和电器分类NILM模型在实际实例是积极的。精度是一个正确分类的数量比预测的总数积极的实例。的意义,精度高,一个概率的分类时高NILM模型预测的实例。精度是一个正确的分类比总测试数据。 调和平均数的吗回忆精度

5.3。提出了签名验证实验
5.3.1。最佳反应速率

找到一个最佳的反映速度,我们设置三种不同的反射,0.1,0.01,和0.001,计算三个变种的信号。实验中,我们随机选择从UK-DALE 15电器。通过使用不同的信号,我们计算三个 是一个减法的第一信号和第二信号。 是一个减法的第一信号和第三信号。 是一个减法的第二信号和第三信号。图10显示的模式 直观的, 是有偏见的。每一个的值 详细表5。我们可以注意到的均值 1是接近零不像其他人。方差和标准差 1几乎是在中间的人。的规模和范围 是相似的。我们可以知道哪一个是正确的NILM比较实验。

6显示性能结果。所有的表演都是相似的,除了 比其他的要好。因此,我们将使用(0.1,0.01)作为反映速度。

5.3.2。影响小说的签名

在本节中,我们训练的两个模型 作为一个输入。我们提取72天的数据作为训练数据集和30天的数据作为测试数据集。每个模型训练2000时代。当我们解释部分4有六个电器,私人数据集。实际上,这些电器不操作在同一时间。然而,在我们的工作,我们假设多个设备可能是在同一时间。因此, 这是所有电器的组合的数量。我们代表二进制表示的开/关状态。我们改变输出单元值到一个二进制字符串。之后,字符串转换为十进制数,代表相结合。一系列的电器 例如,如果操作洗衣机和烤面包机,二进制字符串 数量和组合将17。

11显示了分类比例模型之间的比较。的 设在和是一个组合 设在分类率。我们很容易注意到,如果我们使用该签名此外,更可以分类组合。30组合分类当我们使用该签名而11组合分类当我们只使用功耗(并不是所有的组合都是包含在数据集)。图12显示每个设备的性能。第二个模型使用 有更好的性能在所有电器除了除湿机。特别是,有洗衣机的差距太大,烤箱,烤面包机。烤箱和烤面包机的操作时间只有1.5小时和2.8小时在30天。即使样本数量很小,第二个模型具有更好的性能比较。

然而,第一个模型的除湿性能高于第二个。我们看到这种性能图13。除湿机的模式很简单。一个波动 可以有效的学习模式,但其他情况下并非如此。因为的重要性 与功耗是相同的,这种简单的模式可以慢慢学。为了证实这一点,我们培训了2000名时代更多的第二模式。在表7除湿机的性能,改善了从0.65到0.82,而其他的表演与之前类似的。因为洗衣机有波动 ,第二个模型是关于双的性能。结果,提出签名可以非常有效的因素分类的多态电器。

5.4。深度学习模型验证
5.4.1之前。最优预处理方法

分数标准化和Min-Max缩放是流行的预处理方法。然而,它并没有透露是哪一个更好。为NILM找到一个最佳的方法,我们训练的两个不同的模型。所有的模型都是相同的数据集。我们从房子5 UK-DALE提取23天的数据。天的数据作为训练数据集和日数据作为测试数据集。每个模型火车1000时代。

14显示了模型的性能结果。我们可以注意到 分数比Min-Max定标方法具有更好的性能。NILM,输入的电能消耗。正如我们所知,所有电力消耗是正的。如果所有的输入数据都积极的价值,所有的重量都可以增加或减少反向传播时处理。因此,NILM应该标准化的数据集。正如预期的节3.2。2, 分数为预处理方法是适当的。

5.4.2。最优权重的初始化方法

重量之间的初始化方法介绍,研究人员通常用Glorot初始化,初始化。但他们仍然认为两种方法之间的更好的方法。使用类似的理论分析的方法。他们发现了一个很好的方差分布的初始参数。这个方差适应使用的激活函数,推导出没有明确考虑分布的类型。因此,他们的理论结论持有任何类型的分布的方差决定。比较重的初始化方法,我们运用相同的分布(均匀分布)的方法。我们提取71天的私人数据集的数据。50天的数据作为训练数据集和21天的数据作为测试数据集。我们训练两个模型在1000年时代为每设置一个时间步长是500,一个损失函数MSE,亚当和优化。

8显示了实验的结果。Glorot初始化的精度远高于他初始化的精度。在召回的情况下,他的方法是高于Glorot的方法。Glorot初始化使用的模型,该模型具有很高的命中率,但分类样本数量较低。使用的模型,他初始化命中率很低,但分类样本很高。的准确性和 1-Score是相似的。在我们选择的方法之前,我们训练的模型在5000年时代。表9显示了结果。训练后超过4000时代,他的方法的精度比前面的结果改进虽然召回被删除。然而,Glorot初始化使用的模型并没有太大的改善指标。他提出了初始化输入数据是积极的。功耗都是积极的价值观 不是。我们无法说服他初始化。但猜测的结果,我们可以知道他为NILM初始化是有效的。因此,我们将使用他初始化,初始化方法的重量。

5.4.3。性能测量和增加设备的数量

在本节中,我们将把一个实验证实了提出模型的鲁棒性,即使电器的数量增加。在实验中,我们认为所有参数除了电器的数量。控制参数表10。15个测量设备的性能选择从房子5 UK-DALE(表20.)。表11显示每个实验使用的电器。观察性能精确,我们合成设备的数据与之前的添加一个设备。

15显示了实验的结果。的 设在是电器的数量。的 1-Score代表模型的整体性能却降低了从2到9。然而,9电器后, 1-Score模式走在从0.8到0.9不等。由于高性能, 在早期阶段1-Score下降。然而,它是上下后期阶段。因此,我们不能得出这样的结论:模型是影响电器的数量。我们比较两个模型;这些数字的设备是13和14。的 1-Score第一模型0.822但增加到0.866时,14电器训练。home_theatre_amp添加设备。总操作时间约为68小时,我们可以注意到,该设备具有很多变体在图16。另一方面, 1-Score下降当电器的数量是7到8人。core2_server添加设备。我们可以注意到,权力模式单调的图17。因此,我们可以认为影响性能的主要因素是数据。因此,我们可以得出结论,该模型对电器的数量NILM强劲。

5.4.4。性能度量的电器有类似的功耗

在本节中,我们将以一个实验为确认设备有一个类似的功耗NILM模型分类的。如果类似的电力设备的操作在不同的时间,可能很难分类模型。然而,能耗和操作时间略有不同,即使电器是类似的电力设备。电力缺口将由该签名和强调操作时间可能记住隐藏神经元的模型。来验证我们的假设,我们收集了11个数字的类似的权力从UK-DALE电器和合成数据表11。和控制参数与前面的实验(表相同10)。表12显示性能度量的结果。我们可以看到,他们好分类虽然类似的电力设备。

来验证我们的假设,我们收集了11号类似的电力设备和3个数字的多态电器从UK-DALE高功耗和合成数据表13。和控制参数与前面的实验(表相同10)。我们训练两个模型。第一个是模型只使用类似的电力设备。在第二个模型中,跨州电器包括另外。作为我们的预期,我们可以观察到从第一个模型的性能下降到第二个模型在表14。尽管性能却降低了,我们可以意识到。

5.5。与现有的模型性能比较

我们可以证实我们提出了NILM签名和模型是有效的通过验证实验。在本节中,我们将比较性能与现有的模型。我们所有的房屋在UK-DALE和REDD的实验。首先,我们训练所有的房屋相比FHMM UK-DALE和结果。UK-DALE实验的参数表15

16显示UK-DALE房屋的整体性能。房子的最低性能是第一个房子。我们证明我们的模型数据的影响。有53个电器在第一个房子。设备数据的可能性减少性能高于其他房子。例如,使用battery_charger和面包师他是非常罕见的。这种设备性能下降的主要原因。我们比较性能与FHMM通过实现它。结果如表所示17。我们可以注意到我们的模型优于FHMM。在大多数房屋性能几乎是两倍。

其次,我们训练,所有的房屋的REDD,结果将与现有的模型相比。结果是好的,所有的房屋(见表18)。我们比较我们的模型有三个现有的模型,如FHMM添加剂FHMM, HieFHMM [28,32]。其中,HieFHMM是最先进的模型(34]。由于一些电器的数量,现有的模型没有测试室2。类似于UK-DALE结果,我们在所有的房屋模型具有最高的性能。的房子4,我们的表现是比最先进的两倍。我们可以确认这个表19

6。结论

在本文中,我们考虑先进的深度学习新方法建立先进的NILM工具。此外,我们提出了一个新颖的签名在NILM克服跨州设备问题。此外,我们提供三个问题声明,然后有效地解决这些问题。通过这种方式,我们做很多实验验证签名和提出的体系结构模型。通过我们的实验结果,我们意识到我们的模型克服了现有能源崩溃的问题。通过测量的整体性能,我们确认我们的模型优于之前的模型。特别是,房子4 REDD的性能数据集的双重结果相比,艺术的状态。

在未来的工作中,我们将重点放在预测每个设备的功耗,因为这个问题是不同分类的任务。目前我们不能应用模型来预测。因此,我们需要修改我们的模型生成模型。如果我们能做到这一点,我们的模型可以应用于气体或水解集。换句话说,我们构建模型用于综合能源管理在家里。

缩写

NILM: 不干扰负荷监控
FHMM: 隐马尔可夫模型!
GPU: 图形处理单元
UK-DALE: 英国国内电力设备水平
REDD计划: 参考能源崩溃数据
嗯: 隐马尔可夫模型
FSM: 有限状态机
议员: 马尔可夫过程
新兴市场: 期望最大化
软件: 隐半马尔科夫模型
DHMM: 隐马尔可夫模型的区别
DBN: 深度信念网络
元: 限制了玻耳兹曼机
人工智能: 人工智能
AAT: 自动选择文本
安: 人工神经网络
双曲正切: 双曲正切
均方误差: 均方误差
CE: 交叉熵
GD: 梯度下降法
RNN: 递归神经网络
BPTT: 反向传播通过时间
RTRL: 实时反复学习
FFNN: 前馈神经网络
LSTM: 长时间的短期记忆
主成分分析: 主成分分析
ReLU: 整流器线性单元
SGD: 随机梯度体面的
RMS: 均方根
STFT: 短时傅里叶变换
FHSMM: 的阶乘隐半马尔科夫模型
CFHMM: 有条件的阶乘隐马尔可夫模型
CFHSMM: 有条件的阶乘隐半马尔科夫模型
AFAMAP: 添加剂部分近似地图
巨大的: 维特比算法与稀疏的转变
主持人: 马尔可夫链
CT: 电流互感器
法蓝: 电力建设水平完全标记数据集解集
结算系统: 卡内基梅隆大学
马塞诸斯州大学: 马萨诸塞大学
他: 家庭用电研究
AMPds: 年鉴的详细数据集
IIIT: Indraprastha信息技术学院
iAWE: 国际风工程协会
TP: 真阳性
外交政策: 假阳性
TN: 真正的负
FN: 假阴性
HieFHMM: 层次隐马尔可夫模型的阶乘
HW: 汉明重量
低: 国际研讨会信息安全应用程序
MBC: 面具基于块梳
NCC: 归一化互相关。

信息披露

金是203房间,她的当前地址我国科学技术研究(709),釜山国立大学Jangjeon-dong, Geumjeong-gu,韩国釜山609 - 735。当前地址Thi-Thu-Huong Le Howon金釜山国立大学,信息安全与物联网实验室,房间6405 - 1,6日Eng。我国(A06),釜山国立大学Jangjeon-Dong, Geumjeong-Gu,韩国釜山609 - 735。资金赞助没有参与这项研究的设计;在收集、分析或解释数据;写的手稿;在决定发布调查结果。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

她金定义三个NILM问题以及NILM的三个挑战。此外,他建议小说签名及其算法。他开发了数据生成过程和数据集的实验。NILM Thi-Thu-Huong Le发达LSTM-RNN模型并进行实验。金教授Howon管理这个项目,回顾了手稿。

确认

这项研究得到了MSIP(科技部、ICT和未来规划),韩国,在行业4.0年代的研究和发展项目(s0604 - 17 - 1002)监督的海椰子(国家信息产业促进机构)。