文摘

哮喘的长期量化喘息设想一个移动医疗传感器系统组成的智能手机和无线声波传感器穿在身上。设备都是权力制约,主要标准指导系统设计归结为能耗的最小化,同时保留足够的呼吸声音分类精度(即。、喘息检测)。系统级功耗评估的关键是理解电力成本之间的权衡计算密集型本地处理和沟通。因此,我们分析电力需求的信号采集、处理、和沟通三个典型的操作场景:(1)流的未压缩的呼吸信号分类的智能手机,(2)信号流利用压缩感知(CS)的数据率,和(3)呼吸声音分类可穿戴传感器上。研究表明,第三个场景具有最低的沟通成本使传感器系统最低的总能耗,从328年到428年<我>μw .在这样的场景中,32位ARM皮层M3 / M4核心通常嵌入蓝牙4 SoC模块特性最优之间的权衡上分类性能和消费。另一方面,研究证实,CS使最高效的设计可穿戴传感器(216年至357年<我>μW)的压缩信号流,第二场景。在这种情况下,一个单一的低功耗ARM Cortex-A53同步实时CS重建的核心是充分的和分类的智能手机,同时保持系统的总功率为未压缩的视频流在预算之内。

1。介绍

哮喘是一种慢性呼吸道疾病,影响超过3亿患者(1]。其具体的症状之一是所谓的发生“哮喘喘息”呼吸的声音,支气管收缩引起的航空公司(2,3]。哮喘喘息评估通过听诊的病人的胸部,背部,或颈部(4,5]。非侵入性和不需要病人合作,喘息了有益的作为一个独立的方法的量化诊断和连续监测哮喘(6]。这是特别适合儿童哮喘的诊断和夜间哮喘(7,8),传统spirometry-based呼吸功能评估方法参数不合适(即。家peakflowmetry)。自动执行量化的喘息在呼吸声音记录由一个声学传感器(4,9]。它需要识别未知数量的间歇性出现,暂时变化的频率,嵌入在呼吸系统噪声(4]。算法实现这种运算任务通常结合spectrotemporal特性来自短期的傅里叶变换(STFT) [10- - - - - -14),Mel-frequency cepstral域(MFC) (15,16),小波变换(17,18),经验模态分解(19),和各种各样的分类方案,包括决策树(10,12),神经网络(18),和支持向量机(13- - - - - -15,18]。详细评论了(12,18,20.报告分类性能范围从90年平均95%的敏感性和特异性。建立在现有的分析低功耗DSP实现喘息检测算法(12,21),我们修复算法选择STFT频率线跟踪算法基于经验的规则(12隐马尔可夫模型(HMM)[]或22,23]。分类的性能都产生相似,代表87 - 89%敏感性和特异性93 - 96%。

通常设想的概念量化的移动医疗传感器系统哮喘喘息由一个智能手机和无线声传感器(24- - - - - -26]。近年来,一些商业产品出现在市场上,以分享服务电子哮喘日记应用程序中,伴随着喘息量化传感器功能的手持随需应变的测量装置(27]。为了让病人连续监测,目前的研究工作旨在使项目建设可穿戴(穿在身上)喘息量化传感器(12,13,16,17,28),包括以下子系统:声学传感器(传感器),模拟信号调理电路、A / D转换器,低功耗数字信号处理单元和低功耗数字无线电通信模块与智能手机。

电池供电,可穿戴传感器和智能手机电量有限设备。因此,移动医疗哮喘的主要标准指导设计量化传感器系统(1)最小化能耗和(2)保留足够的呼吸声音分类精度。之间的权衡标准提到的影响(1)呼吸声音分类算法的选择,(2)系统架构的组织的信号采集、处理、和可穿戴传感器和智能手机之间的通信,(3)硬件组件的特点实现每个特定子系统(29日]。

系统级分析了本文的贡献提出了如何高效组织运算喘息检测传感器系统,组成的无线可穿戴的声学传感器和智能手机。具体地说,我们的目标是量化的普遍权力成本之间的权衡收购,加工,和沟通(29日),为这个特定的运算需求的应用程序。同时,我们提供硬件组件体系结构最佳拟合广义指南应用程序。分析建立在我们之前广泛研究新型节能信号采集与无线传输方案(30.),设计专门的低功耗喘息识别算法适用于跑步机上能源设备(传感器节点和智能手机)12,23),和所有子系统在几个硬件实验室的验证原型(12,22,31日,32]。

本文比较传感器系统的总功率要求在三个不同的操作场景如图1。首先,参照操作场景中,传感器获取的信号在奈奎斯特速率。除了信号采集,没有特别的DSP处理任务执行的传感器。原始信号流压缩通过低功耗无线通信接口的智能手机,哪里呼吸声音分类算法执行(24,26]。场景是出于简化的想法传感器的设计和使用智能手机作为主要的信号处理平台,为了简化呼吸声音分类软件的开发和维护。

为了降低数据率,因此所需的平均功率流,信号从传感器到智能手机,第二个场景中,利用呼吸声音在频域的压缩系数(30.,33)和应用压缩感知(CS)的概念(34,35]。通过结合信号采集和压缩在一个线性变换(即步。CS编码),CS相比经典的音频编码技术(36,37)允许同时降低数据率,同时保留在传感器信号处理的低复杂度。在这里,CS编码传感器是由伪随机二次抽样信号(31日),有效地压缩。压缩信号流到智能手机。通过了解二次抽样模式,CS译码器子系统阻止获得可压缩STFT的重建光谱CS-encoded信号(30.,32]。最后,一个健壮的隐马尔科夫模型(HMM)基于频率线跟踪算法(23)上实现智能手机(22)使喘息从重建光谱检测不到5%的分类精度损失。

在第三个场景中,奈奎斯特率信号采集和呼吸声音分类可穿戴传感器上执行,如在13,16]。在这里,我们比较强劲的处理负担的DSP实现频率线跟踪基于HMM (22,23]提出算法模仿中给出的最近邻协会之前(12),类似于(10]。智能手机的传感器定期报告分类结果。场景的目的是最小化可穿戴传感器和智能手机之间的数据流量,并可穿戴传感器独立对无线电通信线路质量和smartphone-processing资源(38]。

本文的组织结构如下:在部分2,每个传感器子系统的功率效率方面的分析。总功耗传感器在此基础上,分析了每个操作场景的部分3。并行,估计花了车载智能手机节中给出4。最后,传感器系统功耗估计推导部分5。本文的结论部分6

2。权力的分析可穿戴传感器子系统

2.1。传感器和模拟信号调节

要求设计一个声学传感器和相关的模拟信号调节电路来自标准化指南呼吸声音采集(39- - - - - -41]。首先,麦克风和加速度计被评为声传感器。被选出的麦克风具有平坦的频率响应在呼吸的声音(即带宽。,100 to 1000 Hz) and accelerometers featuring a resonant frequency well above the upper corner frequency.

代表声学传感器技术符合这些需求进行评估:驻极体电容式传声器(KEEG1542,诺尔斯),MEMS麦克风与模拟输出(ADMP404模拟装置;Invensense ics - 40310)和MEMS麦克风与数字输出(ADM441,模拟设备)。敏感性测试模拟麦克风从42−−37 dB和数字MEMS麦克风通常−26 dBFS(分贝相对于数字化全面阅读)。信噪比变化从50到62分贝。电容式MEMS加速度计选择进行评估(ADXL337、ADXL345和模拟设备)。

比较表1测试表明,在传感器技术,模拟MEMS麦克风功能功率效率最高。结果表明,功耗低至16<我>μ使用ics - 40310 W可以获得。然而,低功率模拟MEMS麦克风的常见问题是高输出阻抗。驻极体电容式麦克风传统上用于呼吸信号分析明显地表现出功率效率比MEMS同行。加速度计的测试模型,选择适合的功耗预算麦克风,表现出低带宽和低敏感性的缺点对其纵轴,由于力学的微型机械质量的证据。

利用数字芯片系统(SoC)的声学传感器,如ADMP441或ADXL355,集成一个完整的信号链,包括麦克风、音频放大器、ADC、数字化输出信号(即的标准编码。PDM,我<年代up>2年代,或SPI)。然而,这是支付的整体功耗和高(即缺乏灵活性。,没有一个可编程放大器从断电,起床时间长)。

设计模拟信号调节电路的呼吸声音采集提供几个功能。首先是信号放大,典型的传感器输出信号大小驻留在1到10 mV(通过典型敏感表所示1)。特别注意需要在MEMS麦克风的情况下,放大器的输入是需要处理的输出阻抗通常以k<我>Ω。带通滤波角落约100赫兹的频率较低,过滤出心音。上的转角频率滤波器根据信号采样频率调整为了防止抗锯齿。假设麦克风模型选择等过滤掉的低频率的频率特性和抗锯齿由一个被动的RC滤波器,实现一个仪表放大器信号调节需求可能就足够了。这样的调节电路功耗,实现INA333 [48),据估计,85 - 95<我>μW香料仿真。

2.2。信号数字化

两个信号采样场景进行了分析。第一个是奈奎斯特采样率信号2 - 8 kHz的采样率,和第二个是压缩采样(CS)在瞬间暂时不均匀的时候,提出了(31日]。在CS,数模转换器(adc)是测试在250 Hz sub-Nyquist抽样率为1 kHz,对应于信号压缩比8 x 2 x。基于的结果(31日,39]和[12),需要12到16位ADC的分辨率CS DFT / DCT谱重建和呼吸的声音分类。因此,对12 -功率效率的权衡,16 -,2比特逐次逼近(SAR)和法adc相比。

adc被认为操作需求(触发的信号处理器),进入节电状态在完成每个转换(责任循环)。因此,组件支持“突发模态”、“单发,”或“auto-power-down”结合快速唤醒时间选择的分析。不同名义吞吐量的组件比较评估的潜在好处使用活动和长时间睡眠周期短。

评估列表组件与各自的性能表中列出2。每个组件的总活跃时间估计从其升高,样品错误的转换,转换时间。最后,我们推断平均功率,每个组件在采样频率从250赫兹到8 kHz。平均功率获得总活跃时间,权力宣布他们的名义采样率,声明的睡眠模式的力量。

结果如图2确认的最低消费是获得了adc以最低的电源电压和最低的活动和睡眠电流和支持高吞吐量(即。、活动时间短)。专门为所需的样本率的范围,SAR模型显示明显的优势在平均功耗法。12位转换器,SAR收益率约为9倍的平均功率低于可比法模型,在16位,增加到24倍的差异。24位法ADC, 1兆瓦足以获得的平均采样率仅仅是500赫兹。因此,16位SAR ADC建筑被认为是最佳的呼吸声音数字化。它消耗在4到123的范围<我>μW当操作在250赫兹和8 kHz之间的采样率。在对12位SARs, 16位特区需要约50%更多的权力。

2.3。信号处理
2.3.1。处理核呼吸声音分类

喘息的执行检测所需的功耗评估了两种学习算法:对于经验规则提出的算法(12)和HMM-based喘息频率算法(22,23]。首次实现两种算法、训练和测试数据集在Matlab的预先录制的呼吸声音。细节数据集的大小,宪法和起源(12,23]。之后,算法的性能和执行速度分别验证的选择代表处理核心:一个音频DSP TMS320C5505(德州仪器,12]),一只手臂Cortex-M4蓝牙4 SoC BGM113(硅实验室),和一个ARM cortex - a9智能手机SoC Exynos 4(三星Galaxy S2, [22,23])。在以下部分中,我们概括这些发现,通过评估算法的执行效率为范围广泛的商业处理核心架构。

作为一个通用规则,我们专注于处理核具有最低的活动状态的力量在最高工作频率,结合低睡眠国家权力,由于其潜在的收益率最低的平均功率(54,55]。表3总结的列表中使用的核心基准。分析了三种处理核心。第一个是音频DSP处理器。专用的需求方的优点是,他们的专有核心设计功能的建筑特色加速执行DSP功能,如大量增殖和积累单元,桶换档器浮点运算,向量相乘,FFT硬件协处理器,具体数据传输I / O单元如我<年代up>2年代(56]。此外,他们通常支持音频处理软件功能的扩展库。低功耗16位定点DSP核信号处理机上进行评估:TMS320C5535(德州仪器)和ADSP2188N(模拟装置)。他们相比遗留16位56 xxx核心MC56F8006(飞思卡尔半导体)和更高的32位驱动ColdFire核心MCF51MM128(飞思卡尔半导体)。

第二类是通用单片机。这里,我们比较通用,高性能32位ARM Cortex-M3 (STM32L151C8、圣微电子)小功率的手臂Cortex-M0 (LPC1102、线性技术)。另外,32位ARM内核进行评估对专有的16位MSP430 core-executing代码从一个超低功耗铁电(弗拉姆号)程序内存(MSP430FR572x、德州仪器)。同时,专用信号采集控制器基于一个年长的16位手臂7核心加上一个高分辨率ADC (ADUC7060模拟设备)是包含在测试。

第三类是处理核嵌入在芯片系统(SoC)蓝牙通信模块。最新一代SoC由32位ARM Cortex-M3相比(CC2640、德州仪器)是两个不同的手臂Cortex-M4核心(nRF52832北欧半导体;BGM113硅实验室)。提到的核心是相对于上一代soc由小功率处理核心:16位手臂皮层M0 (nRF51422北欧半导体)和8位8051核心(CC2541、德州仪器)。

每个核心基准测试的呼吸声音分类算法(12,23]。数量的数学运算构成每个算法模拟使用解析表达式推导出在12,23),分别;数量的增加和乘法模型分别为基本指令类型与不同的电力成本。各自的执行模型表明,测试算法的执行时间主要依赖于两个因素:(1)观测频率的状态数(箱)<我>米定义的DFT频率分辨率和(2)的光谱内容输入信号。即执行两种算法是线性的频率成正比<我>l。因此,在所有的测试用例,<我>米和<我>l保持相同的两种算法,以便比较。<我>米中不同跨度从32到128年最大频率状态。对于包含喘息的输入信号,发生概率的单组分(<年代pan class="inline_break"> ),双组分(<年代pan class="inline_break"> )和三分量(<年代pan class="inline_break"> )喘息是均匀分布的。

出于执行时间的依赖性信号的内容,构建测试环境,评估平均处理能力的依赖消费对症状的严重程度,模拟现实的操作条件。症状严重程度是由两个变量模型:(1)喘息,和(2)症状。喘息,气喘、呼吸循环阻塞的比例在0%到50%的范围不同(例如,25%的喘息率报告严重的呼吸道梗阻,经历了只有在哮喘发作(7,8,69年,70年])。症状率的频率发生呼吸周期包含喘息,表示为百分数,范围在0到100%之间。

为每个组合的喘息,症状率,频率处理状态(<我>米),每一个算法的执行时间是计算每个处理核心。核心的工作频率,寄存器的宽度对16位数据宽度,和成本的乘法与加法被考虑。了解连续处理任务之间的时间间隔,处理责任周期从执行时间(即计算。,部分时间在活动状态)。最后,平均处理能耗计算,使用权力在活动和睡眠状态。作为处理器一般特性不止一个低功耗状态,睡眠的力量估计对应于低功耗状态,简称为所有必需的外围唤醒和周期性采样ADC (DMA和锁相环)手术,和保留的内存内容。

结果在图例子3显示平均功率的增加和处理责任周期比例喘息的症状率和利率,HMM-based算法。的图对比算法执行两种不同的处理核心:100 MHz 16位音频处理DSP (C5535、德州仪器)和25兆赫16位低功耗单片机MSP430的一般目的。由于低4倍的时钟频率,单片机的处理结果比例更高的处理工作周期(最坏的约。22%的活跃时间,DSP对5%)。然而,由于较低的睡眠单片机的力量,可比能耗是通过两个核心,音频DSP是大约只有7%的效率。

以类似的方式,平均功耗蓝牙4 soc的分布具有不同的处理核心比较图4。最好的结果是获得在64 MHz的手臂Cortex-M4核心(nRF52832),从308年到452年不等<我>μw . 48 MHz手臂Cortex-M3 (CC2640)落后于第二,消费348到505<我>μw . BGM113,虽然有相同的核心nRF52832(手臂皮层M4),产量能耗高出3倍,主要是由于低3倍有功功率和大约2倍时钟频率。遗留蓝牙SoC模块以8051 (CC2541)证明了次优的呼吸声音处理,由于8位体系结构,较低的时钟频率,等等。

总体结果如图5。在图5(一个),所有的核心都是按最坏的处理喘息对能源消耗的功率消耗处理正常呼吸的声音,通过两种算法。结果固定所示,最大<我>米= 128。HMM-based算法可以看出,喘息的处理可能需要大约45%更多的权力比处理正常的呼吸声音。另一方面,参照算法显示差别可以忽略不计,因为它逐渐减少维数的数据。

最好的结果获得了Cortex-M4和M3核嵌入蓝牙4 ARM (nRF52832和CC2640)和专用的低功耗音频C55xx DSP (TMS320C5535)。另一方面,最严重的效率获得ADUC7060信号采集控制器、高性能32位ColdFire音频DSP核心(MCF51-MM128)和遗留16位568 xx DSP核心(MC56F8006)。

平均情况和最坏的处理责任周期比较图5 (b),可能识别核心未能满足约束的实时处理。结果表明,至少由专用的音频资源在需求方TMS320C5535(坏的情况下的处理时间的10%)和ADSP2188N。另一方面,研究表明,由于最大时钟频率较低(只有10 MHz), ADUC7060信号采集控制器很难满足最坏的实时需求HMM-based分类算法(运行时<年代pan class="inline_break"> 隐藏的状态)。同时,高8051,MSP430花部分的处理时间,分别为60%和40%。

最后,HMM-based效率和referent crest-tracking呼吸声音分类算法相比,对处理频率的状态数(箱)<我>米在图6。在最大<年代pan class="inline_break"> ,HMM-based算法需要大约1.5倍的力量对referent算法。然而,随着HMM-based算法的执行时间尺度<我>米2,其电力需求可能通过降低的数量显著降低处理状态(例如,该算法关注窄频带的利息)。红线描述加工能耗需求的交叉算法都是平衡的。在更糟糕的情况下处理的呼吸声音喘息,这个边界约<年代pan class="inline_break"> 。HMM算法,在信号采样操作2 kHz,这将意味着缩小观测信号的带宽500 Hz。然而,这被认为是足够的分类(见[12])。

2.3.2。处理核心CS编码

这里,我们评估电力需求CS信号编码实现sub-Nyquist抽样模拟输入信号的非均匀伪随机间隔采样瞬间(30.,31日]。编码器的选择是出于这一事实提到CS编码器设计要求最小数量的数字化信号样本,从而使最高的节约有功功率(即信号采集子系统。ADC和单片机的活跃时间采集、数据处理和存储)[71年]。此外,它使简单实现的单片机固件或专用数字硬件31日]。最后,它使方便和节能之间的伪随机数生成器同步传感器和接收器/智能手机端(以最小的数据传输开销)30.]。ADC的权力已经被部分覆盖2。2,这种分析对权力的集中花在处理任务实现LFSR伪随机数发生器和采样周期调度程序块单片机软件和操作的16位定时器单片机外围设备。

抽样所需的处理任务的单一CS-encoded样本包括(1)一代的未来LFSR伪随机输出,(2)调度的下一个采样时刻,(3)设置计时器,(4)和触发ADC转换。单片机实现的成本在FreeRTOS实际验证了原型实现在MSP430大约每单150指令CS-encoded样本。单片机的定时器操作成本估计制造商数据(例如,67年])和按比例缩小的时钟频率。

CS编码的总成本是模拟为一系列CS sub-Nyquist样本率相应的压缩比2 x, 4 x, x 5.33,和8 x 2 kHz的奈奎斯特采样频率。除了MSP430,电力成本的CS编码模拟几个额外的单片机核心:ADUC7060信号采集控制器和单片机在蓝牙4 soc: nRF52832, CC2640, BGM113 nRF51422, CC2540。

平均功率和处理责任周期所需的c编码与压缩比的增加,如图所示7。结果表明,最有效的实现可能实现蓝牙4 SoC胳膊上皮层内核。nRF52832权力的CS编码从17到63<我>μW在CC2640花费22 73人<我>μw·结果表明,CS编码在nRF52832 worst-simulated花不到1%的处理时间。

2.4。蓝牙通信

蓝牙4(即。,Bluetooth Smart, Bluetooth Low Energy) radio technology was evaluated for the wireless data transfer, as it enables for interoperability with smartphones and medical certification [72年),同时保持低功耗操作。最高水平的集成蓝牙无线电提供芯片系统(SoC)模块,包装在数字广播、无线控制器实现蓝牙协议栈,一个应用程序处理器和各种标准化的嵌入式外围接口。

以下分析了先进的蓝牙4 soc: CC2640, CC2541(德州仪器),BGM113(硅实验室),和nRF52832(北欧半导体)。表4比较他们的平均功率最典型的操作状态:无线电传输(TX),广播收听(接收、RX),和睡眠。TX和RX的功率降低2到3次可以观察到当比较前面的和实际的一代又一代的蓝牙4 soc (CC2541对CC2640、nRF52832 BGM113)。处理能力的提高,使呼吸声音分类算法的实现(例如,12,13,16])在SoC的应用处理器。

4蓝牙通信协议设计与培养最低的平均功率的前提下,通过间歇,活跃时间短(TX, RX)的收音机,结合长期睡眠时间间隔之间的连接。数据包交换只在预定义的期刊<我>连接的时间间隔在所谓的<我>连接事件。在完成连接的事件,收音机是把睡到下一个73年]。连接事件持续时间最小化的高通信吞吐量(通常2 Mbit /空气)。典型波形CC2640电台的电源电流测量连接事件期间,划分为一系列常见的电源状态,如图8为标签(见描述1 - 6)。

由于许多参数影响每个功率状态的持续时间,我们集中力量分析CC2640,它提供了广泛的蓝牙力量评估指南(73年)、电力仿真工具(74年)和数据(67年]。分析假设以下参数和CC2640的局限性。功率测量的电源电压1.8 V。发射机的输出功率设置为0 dBm作为传感器和智能手机之间的通信发生在很短的范围(例如,<我><10 m)。最大有效载荷大小在单个连接事件是有限的蓝牙软件栈最大256字节。连续时间之间的连接的间隔可能范围从7.5毫秒最大4.0 s。

用给定的约束,计算平均功耗花在沟通上的三个操作场景:首先,在未压缩的数据流的情况,我们分析了抽样情况下(即。、流)8和2千赫。,8 kHz对应使用的情况下参照经验规则谱crest-tracking分类算法(12在智能手机(DFT要求的块大小<年代pan class="inline_break"> ,有75%的重叠)。另一方面,2 kHz对应分类HMM-based算法(智能手机上的21,22块),在信号<年代pan class="inline_break"> 75%的样本,重叠。

其次,CS-compressed信号流的场景,我们分析了4种不同的压缩比的2千赫奈奎斯特频率:2 x, 4 x, 5.33 x, x 8。计算载荷大小对原始信号的块大小<年代pan class="inline_break"> 和75%重叠,HMM-based分类算法(21,22]。另外,每个TX负载所需的大小是额外增加了2字节伪随机种子。

最后,第三个场景的呼吸声音分类机载传感器、二进制编码基于块分类的结果是在一个定期发送报告消息。连接时间和载荷大小取决于分类算法(采样频率、信号块大小)和负载的内容,是否原始二进制流分类结果对应于每个发送信号块或如果喘息率计算出一个预定义的时间窗口。对于所有场景,2字节承认的处方信息。

在分析、有效载荷的相对贡献大小和连接时间间隔比较对于每个操作场景,通过积累(缓冲、存储)TX传感器数据跨多个连接的间隔,直到达到最大载荷大小和然后批量传输。表5总结了测试场景,名义载荷大小和可能支持传输连接间隔,张成的空间(即考虑到载荷大小限制。CC2640 256字节)。

跨越的所需的平均功率之间的通信在每个操作场景中对时间连续蓝牙连接事件图所示9。结果表明,由于非常短的活跃时期(即。,high data rate), sleep power spent in between the connection intervals influences the average communication power much more than the change of payload size. This causes the average power to exponentially fall when increasing the connection interval. Thus, we propose to maximally prolong the (sleep) time between connection intervals by accumulating the data, filling each transmission packet up to the maximal payload size.

最好的结果为每个场景类似的方式突出显示在表中获得5。奈奎斯特速率数据流是最昂贵的,花费914<我>μW在8 kHz。急剧减少的权力的奈奎斯特速率流2 kHz源于加倍连接间隔。相同的机制是减少从168年到81年的原因<我>μW当CS压缩比的加大2 x 4 x。另一方面,在平均功率最小的区别是观察在相同连接间隔的情况下,只有在有效载荷的大小增加(例如,在CS压缩比4 x 5.33 x,和8 x)。船上的场景分类,只有8的最低平均功率<我>μW是达到最大连接时间间隔的4 s。

3所示。可穿戴传感器的总功耗

分析给出总传感器的功耗。三个操作场景部分1比较:(1)机上分类、CS信号流(2),(3)未压缩的奈奎斯特率的流媒体信号。对于每个场景,总功率计算的总结贡献声学传感器、模拟训练,A / D转换,处理,和蓝牙通信子系统,根据结果提出了部分2

启用所有三个操作场景的比较,分析假设可穿戴传感器共同子系统的构成组件。一个模拟MEMS麦克风(比如ics - 40310)结合模拟前端的部分2。1调节和16位SAR ADC(例如,AD7684)数字化。处理和通信实现的蓝牙4 SoC的手臂Cortex-M4处理核心,证明了最优上分类和CS-encoding任务(见部分2)。出于完整性的考虑,分析基于代表CC2640 SoC。船上的场景分类,处理频率州的数量对分类算法来平衡的<我>米= 64产量可比的权力。在CS流的场景中,CS压缩率的范围选择产量可比分类性能对奈奎斯特率信号采集。根据(21,30.),分类精度下降不到5%的CS压缩比率低于5.33。因此,权力分析集中在压缩比从2 x 5.33 x。

的总功耗CC2640-based传感器比较图10。不断推动和架构上相同的在所有情况下,麦克风和模拟调节电路,101年的总功率<我>μw .剩下的子系统是场景依赖的力量贡献。

船上的场景分类,总功率较低的情况下获得HMM-based算法在信号采样操作2千赫。总平均功率是320<我>μW,采取的主要份额的56%的分类算法。作为比较,使用参照crest-tracking的分类算法,要求在8 kHz信号数字化,导致传感器电源(即高出31%。,420年<我>μW)。

CS-encoded信号流的场景,总功率范围时预期的增加压缩比。在较高压缩比的4倍和5.33倍,它的收益率228年和216年<我>μ分别W。大多数这种力量花在沟通。然而,大量处理份额与CS编码发生在低压缩比(例如,76<我>μ杰出的W。比2 x)指出,低效率的CS的单片机软件实现编码。

未压缩的信号流的场景几乎排除了任何处理,最大的一部分权力是花在沟通(采样率成正比)。在最好的情况下(在2 kHz,假设使用HMM-based分类算法在智能手机),总功率是505<我>μw . 8 kHz,它翻了一番,达到1138<我>μw .因此,流媒体未压缩的信号被证明是最糟糕的解决方案。

权力分析证实,传感器执行CS编码,或等于操作压缩的速度高于4 x,收益率最低的总功率。要求更少的电力进行处理,它优于最好的车载分类的1.8倍(HMM算法和采样率在2千赫)。同时,减少沟通成本,产量低2.2倍总功率对未压缩的信号流(2千赫)。这证实了可用性的实际实现的c编码系统中卸载传感器的功耗是主要的设计准则。

4所示。智能手机的功耗

在smartphone-centric喘息量化传感器系统(即。,我n both signal streaming scenarios), the major contributors to smartphone’s power consumption are communication and signal processing. Processing includes respiratory sound classification and additionally, in the scenario of CS streaming, CS reconstruction.

处理成本评估的典型芯片系统(SoC)集成多个处理核心,收音机,和周边单位。这是三星Exynos 7420 SoC (75年)(三星Galaxy S6,星系注意5)和三星Exynos 5433 SoC (76年)(用于三星Galaxy注4,Galaxy Tab S2)。两个soc封装8核心的所谓的大。l我TTLE configuration, consisting of a cluster of 4 low-power ARM Cortex-A53 cores [77年)和4高性能ARM Cortex-A57 (78年)核。两个核心是基于ARMv8-A 32/64-bit架构和功能架构扩展支持高效的数字信号处理(即。、氖SIMD VFPv4浮点单元)。图11比较7420年和5433年三星Exynos SoC的每个核活动状态功耗。

4.1。权力CS重建在智能手机的成本

动力费用CS重建的智能手机为代表分析了正交匹配追踪算法(OMP) (30.,32,79年]。OMP算法估计<我>K-简约解决欠定的M×N系统(M < N),通过组织成的迭代过程,每次迭代的一个接一个的解决方案向量元素估计通过求解超定的系统(增长维度的每个迭代)使用线性最小二乘法。最小二乘法的计算提出了一个算法的主要瓶颈,我们分析了两种方法来解决最小二乘,一个利用QR分解,另以柯列斯基分解。两种算法的计算复杂性建模分析,实现基于表达式派生的每个迭代计算成本(35),见表6。<我>N代表原始信号的长度,<我>米是压缩信号长度,<我>K(稀疏)信号组件的数量,<我>我是迭代次数,<我>一个CS测量矩阵的计算成本。总成本是评估的迭代(终止条件)设置为完全<我>K重建的频率成分。

所有模拟都使用固定执行原来的DFT / DCT块的大小<年代pan class="inline_break"> (<我>f<年代ub>年代= 2千赫),迭代的数量<我>K参数化4-32范围和数量的子样品信号元素<我>米范围在128 - 32,产生压缩比<我>N/<我>米2 - 8。美联储模型结构参数的手臂Cortex-A53和手臂Cortex-A57处理核心特色7420年Exynos智能手机SoC。单核操作模拟。从估计的总处理时间和需要处理的间隔,入住率的处理核心(即。,处理责任周期,%)和相关的增量在核的平均功耗计算。增量执行获得的平均功耗OMP QR和柯列斯基分解比较图12智能手机的情况下手臂Cortex-A53核心1.5 GHz。一般来说,经济新闻的处理时间(即。,average power) grows proportionally with both<我>K和<我>米而且更加敏感<我>米。实现以QR分解收益率约2.5倍比柯列斯基的实现;因此,版本为QR是优化和进一步分析研究的其余部分。

横跨A57 OMP执行所需的平均力量和A53处理核心Exynos SoC对核心范围内各自的时钟频率如图(13日)。在最坏的情况下,获得最大<我>米和<我>K,电源低功耗A53核心(蓝色)在400 MHz范围从3.7 mW在1500 MHz 10.4 mW。在高性能核心A57(橙色),13.8 - -32.9 mW, 800 - 2100 MHz的频率跨度。类似地,图13 (b)描述了处理时间占空比有关。处理时间,减少反向时钟频率,横跨在最坏的情况下从2.8%到10.7% A53 A57(蓝色),从2.0%到5.3%(橙色)。

然而,在典型的用例,低<我>米利用为了实现更高的压缩比。另外,根据信号稀疏(压缩),重建光谱成分的数量<我>K可能是选择合理的低(例如,<年代pan class="inline_break"> )。因此,能耗将范围从1.2到2.4兆瓦A53核心运行最大1500 MHz。通过扩展频率400 MHz,功率下降到400 - 850<我>μW,代价更高的处理工作周期,跨越1.2至2.4%的核心处理时间。分析表明,单臂Cortex-A53处理核心需要足够的资源实时执行OMP (QR) CS重建。

4.2。电力成本的呼吸声音分类在智能手机上

资源需求呼吸声音分类进行评估的情况下提出HMM-based呼吸声音分类算法(21,22)数字化<我>f<年代ub>年代2千赫(DFT的块大小<年代pan class="inline_break"> ,75%重叠)。我们获得的最坏执行时间分析最大喘息的症状出现率(100%)和50%的速度。处理频率的状态数(即。DFT垃圾箱)<我>米频率和处理核心的频率被作为参数。处理核心的参数设置为OMP节4.1

结果显示在图(14日),最糟糕的电力成本分类的高性能ARM Cortex-A57核心1.7 mW之间跨越800 MHz,在2.1 GHz 4.0 mW。另一方面,降低手臂Cortex-A53,权力可以获得从400年<我>μW在400 MHz在1.5 GHz 1.2 mW。算法通常需要远低于1.0%的处理时间(见图14 (b))。HMM-based算法的优化操作数量减少的频率状态(例如,<我>米频率Cortex-A53 = 64),平均功率,操作的最小时钟频率400 MHz,会降至158<我>μW,占据约0.45%的处理时间。

5。系统级功耗

的总系统级功耗由传感器的权力分析部分3,在智能手机上。典型的智能手机的硬件架构的复杂性(多核处理单元,多个无线通信接口,存储设备,屏幕,周边单位,等等),硬件组件的异构性,高复杂性的操作系统软件管理硬件资源和权力的分配管理政策复杂化mW-accurate系统级建模。

总功率的智能手机型号为处理核心如分析部分4通常范围从120到550兆瓦(31日,75年]。以促进有意义的比较与传感器的权力,一个简化的智能手机功率估算模拟智能手机只有增量贡献的活动状态基线能力给出。估计智能手机上的权力(即要求处理。,cost of CS spectrum reconstruction and respiratory sound classification) are based on results from Section4。同样,假设增加智能手机的蓝牙通信的功耗与传感器(部分的力量2。4)。在这些限制,每个三个操作场景的总系统级功率估计。表7总结了研究结果。

最坏的系统级功耗测量在referent场景中未压缩的数据流、检测采样/流率的范围<我>f<年代ub>年代从2到8 kHz,和智能手机运行嗯分类算法。在2 kHz,总功率约为1.3兆瓦,跨越到3.6兆瓦8 kHz的采样率。

最低整体获得系统级功耗场景分类机载传感器。在这里,任何信号处理任务的智能手机是免费的,和最小的力量都花在同行之间的通信设备。因此,大多数的系统功率与传感器的能力,保持整个系统的功率低于428<我>μW。

在CS信号流场景中,总功率范围从775到2605<我>μW,各自CS压缩比从5.33 x 2 x。功能至少高2.4 x系统级总消费量对机载传感器的传感器系统分类但带来25%的储蓄总系统级功率流(对未压缩的信号<我>f<年代ub>年代2千赫)。Widespan总系统级的力量主要是受到其依赖CS压缩比(收益率更高的功率要求低压缩比)。根据压缩率、成本的CS编码传感器6 x 2.5倍低于所需的权力执行的HMM算法在分类的场景。智能手机,CS重建带来了最大的瓶颈,成本的2.2到5.4倍与HMM-based分类算法。其实现的动力费用(估计为158<我>μW)低12%左右,实现在可穿戴传感器(180<我>μW)。

功率表的数据7使我们能够估计的有效传感器系统运行时。例如,一种可佩带的传感器基于德州仪器CC2640 SoC,从200 mAh锂coin-cell电池供电(CR2032)和一个合适的直流/直流电压调节器以85%的效率,将持续50 - 66天运行上喘息检测,根据喘息检测算法。在相同的条件下,传感器节点实施CS采样和流运行59 - 98天(根据压缩比)和传感器节点执行纯粹的奈奎斯特采样率和流媒体,只有18-42天(取决于采样率)。

另一方面,让我们假设一个智能手机平均消耗125兆瓦,由2500 mAh锂离子蓄电池(约63小时的基本自治)。其运行时将缩短为不到1分钟,16 - 66分钟,在各自的场景或16-45分钟的特定于应用程序的处理和通信。估算结果排除了任何权力由一个专门的哮喘日记移动应用数据可视化和用户交互,而这额外的重型电力智能手机的液晶屏的负担。

6。结论

电力消耗是一个重要的参数在设计可穿戴传感器系统,这个分析的目的是提供广义知识如何不同的模拟/数字处理硬件架构和通信技术处理特定任务的可穿戴哮喘检测。分析了三个典型的操作场景不同分布对信号数字化,可穿戴传感器系统处理和通信。除了幂数据反映当前状态的技术,分析了相对不同的硬件架构和组件之间的关系的家庭,可用于指导高影响力的类似和未来设计领域的可穿戴式生理信号监测设备。

考虑到运算需求的应用,结果表明,最小的端到端系统能耗(包括传感器和智能手机)是通过实现加工机上可穿戴传感器(328年至428年<我>μW)。这种情况下减少花在沟通上,和瓶颈的消费者是传感器的信号处理子系统。拟议的呼吸声音分类算法的比较(HMM-based算法从[23)和参照提出算法(12)表明,两种算法功能类似的执行时间。然而,HMM-based算法降低信号数字化功率要求的操作在只有2 kHz信号数字化,在低信噪比条件下23]。

声学传感器的分析、模拟信号调节和ADC架构已经证实模拟MEMS麦克风特性为我们的应用程序最大的功率效率,总计约100人<我>μW包括拟议中的模拟信号调节电路。对信号数字化,16位逐次逼近(SAR) ADC架构证明最优。权力处理子系统的分析表明,32位ARM皮层M3 / M4核嵌入蓝牙4 SoC模块功能最优的性能和功耗之间的权衡。

CS的应用使系统的建设以一种可佩带的传感器消耗最低的功率(216年至357年<我>μW)。这带来了巨大的影响在可穿戴传感器的制造成本作为简单的(因此便宜)它使硬件/固件设计。此外,它降低了软件开发和维护和更新成本,通过移动的大部分软件开发从传感器到智能手机(即。域的专业单片机/ DSP-embedded固件开发,常见的安卓移动应用程序开发的Java)。最大的功绩CS相比传统的压缩技术是它减少了传感器的能力,同时保持系统的总功率低或等于未压缩的视频流的场景。CS不对称电网负荷重新分配,将它从传感器的采集、处理和通信子系统到智能手机的处理子系统。智能手机,CS重构的主要瓶颈,成本核算的OMP算法分类的2.2到5.4倍。一个低功耗ARM Cortex-A53处理核心运行在最低频率(例如,400 MHz)它能够满足实时CS重建和分类。

在下一步中,收集的知识应使用推进下一步的技术准备,这就涉及到一个集成的硬件建设适合原型试验的病人。特定的工程挑战预计这条道路可能包括一些相关的一般限制声传感模式:对机械耦合(9,40),外部干扰(如演讲、心音(4]),和噪音(传感器接触噪声、背景噪音5])。

缩写

ADC: 模拟-数字转换器
CS: 压缩传感/压缩采样
DCT: 离散余弦变换
DFT: 离散傅里叶变换
直接存储器存取: 直接内存访问
DSP: 数字信号处理器
嗯: 隐马尔可夫模型
我<年代up>2C: Interintegrated电路总线
单片机: 微控制器单元
经济新闻: 正交匹配追踪
STFT: 短时傅里叶变换
锁相环: 锁相环
处方: 收到
特别行政区: 逐次逼近
SoC: 芯片系统
SPI: 串行外围接口总线
TX: 传输。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

两Vedran Bilas和Dinko Oletic构思设计的研究和实验;Dinko Oletic进行了实验和分析数据;Dinko Oletic和Vedran Bilas写道。Dinko Oletic和Vedran Bilas贡献同样这项工作。