迭代,混合可用性方法应用于Telekit系统从丹麦TeleCare北审判

文摘

客观的。本研究的目的是评估的可用性的远程医疗系统,创造了Telekit,通过使用一个迭代,混合可用性的方法。材料和方法。十双专家参与两个启发式评估(HE1,何)和11个COPD患者参加了两个自言自语的测试。双专家确定可用性侵犯和分类成Jakob Nielsen的启发式。这些违规被翻译成可测量的值在0到4表示程度的严重性。慢性阻塞性肺病自言自语的测试中,参与者被邀请用词语表达自己的想法。结果。双专家确定86年HE1可用性侵犯和101年何违反可用性。大多数的违规被评为在0 - 2的范围内。自言自语测试的结果导致了12个主题和相关的例子关于Telekit系统的可用性。迭代的使用,混合可用性方法产生两个定量和定性的结果。结论。迭代、混合可用性方法产生一个强大的结果由于大量的测试发现的问题,因为双专家和慢性阻塞性肺病参与者关注Telekit的不同方面的可用性。这个试验是在Clinicaltrials.gov注册,NCT019848402013年11月14日。

1。介绍

近年来,信息技术发展指数影响大幅远程医疗领域。因此,远程医疗系统的试验结果表明,远程医疗可以提供经济收益,优质护理的连续性,和更多的自给自足的患者(1- - - - - -3]。丹麦cluster-randomised、控制、大规模试验,TeleCare北部,是一个例子。TeleCare北2014 - 2015年实施,招聘共有1225名患者来自北方的丹麦地区。这个试验的目的是评估的有效性和成本效益的远程医疗系统(名为Telekit)为慢性阻塞性肺病(COPD)患者与惯例。在丹麦,惯例包括保健、监测和治疗的患者,这些任务由全科医生和直辖市社区护士等医务工作者。Telekit系统的目的是允许COPD患者获得更多的了解自己的疾病和支持他们的技能和资源的管理他们的疾病,从而使它们更好地控制他们的生活,希望提高他们的生活质量。TeleCare北试验的结果包括生活质量的变化,死亡率、生理指标、和增量成本效益比率测量从基线到随访12个月4]。

自我管理措施如TeleCare北试验越来越被集成到医疗保健为自我管理计划实现减少住院率,提高生活质量,防止病人的病情恶化。尽管自我管理计划的日益普及,人们遇到的问题一般使用系统停止使用的技术或提前退出研究[5]。识别病人因素解释这种行为,现存的文献表明,许多现有系统是针对用户和更少关注相关的临床病人技术需求等因素,功能,和心理和环境壁垒,等等。即使病人因素考虑在内,他们常常优先只有当用户界面时准备,减少系统正在构思和设计6]。

发展和实施一个系统不需要关注的技术要求。过程还取决于用户参与和参与的形式,例如,用户满意度,可用性,和一个认识到在日常生活中需要的技术。用户的交互和远程医疗技术因此特别重要,因为他们的交互显示他们是否想利用远程医疗技术或更喜欢选择。许多病人使用远程医疗是老年患者患有慢性疾病,能力有限,socioeconomically弱势。这些限制在整个设计过程中需要考虑远程医疗技术(7,8]。患者安全是另一个重要方面,因为远程医疗技术涉及传输信息和与病人沟通。医疗保健专业人员需要确保数据安全传输,只有相关的医疗保健专业人士访问传输数据。提供患者的治疗效果和临床结果满意,远程医疗技术需要显示良好的可用性(9]。

可用性定义如下由国际标准化组织(ISO 9241 - 11):

产品在多大程度上可以使用指定的用户实现指定目标有效性、效率和满意度在特定上下文中使用的10]。

几种不同的可用性测试方法可用于收集用户的角度以改善远程医疗技术的可用性(11]。可用性测试测量技术定量或定性的易用性。主题的文献表明,应该使用不同的方法在测试可用性,每个方法都有优点和局限性,并提供不同的观点在可用性12- - - - - -16]。关于这个主题的文献强调迭代使用混合可用性方法的重要性。迭代是指开发活动的过程是重复或毛圈在系统开发和每个循环是如何修改的。迭代,因此,意味着要经过多个版本的系统设计进行可用性评估和修改系统基于可用性发现了(14,15]。可用性专家Jakob Nielsen认为支持迭代的可用性测试;具体地说,他建议两个迭代(一个迭代是一个重新设计的两种设计版本)或者更多,因为第一个设计会有很多剩余的问题17]。

使用一个迭代,混合可用性的方法,本文的目的是评估的可用性从丹麦TeleCare北Telekit系统试验,以提高其质量和功能。可用性的方法是两个启发式评估(HE1,何)和两个自言自语的测试(TA1 TA2)。可用性评价分为预备考试和期末测验:(1)预备考试包括可用性评估(HE1 TA1)和连续进行两个版本的Telekit系统在两个先前的研究(18,19]。HE1 Telekit的设计过程中进行早期评估潜在的可用性问题,可以实现系统的复杂化。HE1中发现的问题,引发了一些实质性的变化和更新版本的Telekit系统[17,18]。启发式评估(HE1)后,自言自语的测试执行(TA1)来确定用户的体验与修订版本的Telekit系统(20.]。(2)期末测验包括可用性评估(何TA2) TeleCare北试验完成后执行。具体来说,第二个启发式评估(何)和第二个自言自语的测试(TA2)进行最新的更新版本的Telekit系统。

各种评价方法和策略已经被开发出来,和一些研究使用不同的迭代的可用性测试方法相结合(20.,21]。本研究的目的是评估通过迭代Telekit系统的可用性,可用性测试。定量和定性研究结果生成这些比较为了评估Telekit系统的可用性。

2。材料和方法

2.1。研究人群

研究人口由两组不同的参与者。一组()参加了启发式评估(HE1,何),另一个()参加了自言自语测试(TA1 TA2)。所有的参与者收到口头或书面的信息研究过程和同意参与这项研究。

2.1.1。研究Population-Heuristic评估(HE1,何)

5个可用性专家被邀请参与每一个启发式评估。一些专家(专家编号(1)和(3)数量)参加评估。生物医学工程师和专家们都是担任博士研究员或副/助理教授与卫生部科技、Aalborg大学,丹麦。他们都有特定的专业知识在卫生领域和可用性和用户界面的评价,使其合理表示双专家。

2.1.2。研究Population-Think-Aloud测试(TA1)

六个参与者(三个男人,三个女人)与慢性阻塞性肺病出席了TA1 [20.]。他们被随机选择17个试点患者从丹麦TeleCare北试验4]。他们的平均年龄是69岁(最小65,最大73),他们代表了不同阶段的慢性阻塞性肺病(一个温和,温和,和四个严重)。参与者在严重阶段需要氧气治疗。他们的技术经验不同;有些新手,有些是知识渊博的,有些是日常用户。经验的参与者有6个月了TA1 Telekit系统之前。

2.1.3。研究Population-Think-Aloud测试(TA2)

五个参与者(一个人,四个女人)与慢性阻塞性肺病是从丹麦招募TeleCare北试验(4]。我们联系的地区护士试验随机选择的潜在用户。他们的平均年龄是65岁(最小50岁,最大72);和参与者此前曾作为保育员(),杂货商(),家庭主妇()和一个三明治填表人()。两个参与者中度慢性阻塞性肺病(肺活量在50 - 80%之间)和三个有严重的慢性阻塞性肺病(肺活量30 - 55%)。这些疾病的严重阶段轮椅使用者和必需的氧气治疗。

入选标准是概述招聘自言自语测试开始之前:(我)参与者应该最近收到Telekit系统(< 3个月),因为他们不得不保持好奇心和不应该习惯的使用Telekit开发系统。(2)参与者应该先收到了两个开始自言自语测试前培训。这很重要,因为他们需要基本知识的使用Telekit系统;否则,他们将无法在测试期间使用这个系统。(3)参与者应良好运作才能完成测试自言自语。因此,只有患者能够表达他们的经历与Telekit系统可以包括在内。

2.2。Telekit系统

Telekit系统是由Silverbullet / S (22,23),旨在支持病人诊断为慢性阻塞性肺病,糖尿病和心力衰竭的管理他们的疾病,并减少与这些疾病相关的医疗成本。Telekit作用于一个开源平台,OpenTele,丹麦也用于其他两个地区,除了丹麦北部地区。OpenTele平台是一个license-free平台,收集病人的健康数据和卫生专业人员的交互与数据和传输数据到中央数据库(22]。

慢性阻塞性肺病患者接受指令使用Telekit由社区护士在家里或在医疗中心。说明两个培训课程。Telekit系统由便携式手提箱包含平板电脑(三星Galaxy TAB 2, 10.1,三星电子,首尔,韩国)(24];血压监视器(模型ua - 767,加上BT-C Nonin医疗,明尼苏达州,美国)(25];一个指尖脉搏血氧计(A&D医疗Nonin,缟玛瑙二世9560年,东京,日本)(26];和精密健康量表(uc - 321 PBT-C A&D医疗、东京、日本)(25]。Telekit是一个异步的解决方案,从病人在家里收集健康数据通过一个应用程序。患者使用一个集成的应用程序,可以从平板电脑。登录到应用程序后,患者能够回答疾病相关的问题,如:你咳嗽比平时多吗吗?除了回答问题,患者测量血压,血氧饱和度、心率、和重量每周1 - 2次,同意他们的医生。血压监护仪,指尖脉搏血氧计,通过蓝牙和健康量表自动传输测量平板电脑上的应用程序。此后,使用的数据被发送到一个web门户医疗服务提供者与病人的互动。使用web门户,医疗服务提供者接收和分析病人的健康数据在固定的日子。卫生保健提供者检查病人的测量也高于预期,但病人的疾病相关问题的答案。根据这些信息,医疗服务提供者可以快速响应和让病人开始在适当的治疗4]。图1显示设备构成Telekit系统。

2.3。研究设计和数据收集

在这项研究中,我们评估了来自北方丹麦TeleCare Telekit系统的可用性试验使用一个迭代,混合可用性的方法。在初始阶段进行了前测的TeleCare北试验,试验完成后,进行后续测试。在预备考试,启发式评估(HE1)和一个自言自语的测试(TA1)进行连续两个版本(版本:1.5.0,版本:1.11.3)Telekit系统(20.,21]。在后续测试中,相同的可用性评估方法被用来测试的最新版本(版本1.29.0)Telekit系统,产生第二个启发式评估(何)和第二个测试(TA2)自言自语。相关的定量结果和定性研究结果和后续测试然后相比。

2.3.1。启发式评估

启发式评估是一个检验方法,其中少量的专家检查和评估系统的用户界面使用的列表(称为启发式)接受了可用性原则。每个独立专家发现系统可用性问题通过识别未满足的启发式,也就是说,启发式侵犯,以及每个违反评估的严重性。评估产生潜在的可用性问题的列表,可以作为提高系统输入下一轮迭代(14,27]。

在这项研究中,启发式评估(HE1和何)预处理和期末测验的应用在实验室设置的两位研究人员参加了一个主持人和一个观察者。主持人的作用是与专家和引导他们对交互操作Telekit系统如果出现问题或者用户界面的某些部分需要解释道。观察者的角色是要注意专家的评论和完成一个清单的启发式违反与专家合作。

在每一个启发式评估,五个专家被要求使用Telekit系统代表执行不同的任务。启发式评估的任务包括(1)登录;(2)关于Telekit系统阅读和看电影;(3)阅读和观看Telekit指令系统;(4)执行测量(血压、心率、血氧饱和度、体重等);(5)找到图片展示他们的测量;(6)写一个消息给医疗服务提供者和(7)注销。除了这些任务,他们也鼓励检查系统的其他方面。

每个专家Telekit系统识别问题,分类这些按照Jakob Nielsen的十启发式(表1),每个问题的严重程度(表2)[28]。专家们完成一个清单包括可用性侵犯和违反严重程度得分和提供可能的解决方案。严重性评级得分是基于Rolf Molich潜油电泵严重程度量表:0:改进;1:小问题;2:严重的问题;3:关键问题;4:故障(29日]。每个启发式评估的总持续时间是90分钟,包括介绍,任务和汇报。


Jakob Nielsen的十个启发式	启发式的描述

(1)系统状态的可见性	系统应该保持用户了解发生了什么,在合理的时间内通过适当的反馈。
(2)匹配系统和真实的世界	系统应该说用户的语言,单词,短语,和概念熟悉的用户,而不是面向系统的术语。遵循现实世界的约定,使信息出现在自然和逻辑顺序。
(3)用户控件和自由	用户经常错误地选择系统功能,将需要一个明确的标志“紧急出口”离开不想要的状态,而无需经过一段对话。支持撤消和重做。
(4)一致性和标准	用户不应该怀疑不同的词,情形,或行动的意思是一样的。遵守平台约定。
(5)错误预防	甚至比良好的错误消息是一个精心设计,防止问题发生在第一个地方。消除容易出错的条件或检查他们和现在的用户提供一个确认选项之前承诺的行动。
(6)的认可,而不是回忆	减少用户的内存负载通过对象,可见的行为,和选项。用户不应该记住信息从一个对话的一部分到另一个地方。指令系统的使用应该是可见的或容易获取只要合适。
(7)使用的灵活性和效率	Accelerators-unseen的新手用户可能经常加快专家用户的交互,这样系统可以满足新手和有经验的用户。允许用户调整频繁操作。
(8)审美和简约的设计	对话不应包含信息,是无关紧要的或很少需要。每单位信息所需的对话与有关单位的信息和竞争减少了他们相对的可见性。
(9)帮助用户识别、诊断和从错误中恢复	错误消息应该用平实的语言表达(没有代码),精确地指出问题,建设性地提出一个解决方案。
(10)帮助和文档	即使它是更好的,如果系统可以使用没有文档,可能需要提供帮助和文档。任何这样的信息很容易搜索,应该关注用户的任务,具体步骤进行列表,不会太大。


五点严重程度量表	严重性评级的描述

(0)改进	大大不打扰用户的经验吗
(1)小问题	用户将会有点延迟(几分钟)
(2)严重的问题	用户将大大延迟(几分钟)
(3)关键问题	用户不能执行这个任务
(4)故障问题	系统不正常工作

2.3.2。自言自语的测试

测试执行自言自语的目的是记录潜在用户对系统的经验和想法。这可以通过给用户的任务,他们必须完成通过使用系统。考试鼓励用户用词语表达自己的想法和表达他们在想什么,做什么,和感觉当他们去通过用户界面。测试可以让观察者和主持人看到和理解的认知过程,用户参与在任务完成(30.]。

达到尽可能真实的测试环境中,主持人和观察者选择执行自言自语测试(TA1 TA2)参与者的住所。此外,病人的家庭提供一个安全的地方,熟悉的环境测试。参与者被要求执行相同的七个任务的专家进行启发式评估。是向参与者解释评价的目标是评估系统,而不是测试他们执行任务的能力。通过提供这些信息,主持人和观察者希望参与者能随意评论和批评Telekit系统。研究人员目前在所有的测试。主持人的作用是与参与者互动,引导他们通过任务,并鼓励他们在测试自言自语。主持人不干预或扰乱思维过程;只有参与者主动要求帮助他们引导推进系统。观察者的角色是记录测试,收集有关用词语表达的专业笔记和nonverbalised表达式,而且做笔记的观察。 In addition, the observer framed a summary of the participants’ demographic characteristics (described in Sections2.1。2和2.1。3)。每一个自言自语的测试的持续时间大约是45分钟,包括介绍,任务和汇报。

2.4。数据分析

数据分析分为三个部分来比较和期末测验的Telekit系统:(1)预处理和期末测验比较HE1和何,(2)一个预处理和期末测验的比较TA1对TA2,和(3)何对TA2后续测试比较。

观察者的音符从每一个启发式评估和自言自语的测试也进行了计算,并转移到Microsoft Excel 2010。启发式评估的数据离开到启发式问题,地点,解决方案,和严重性评级。发现可用性问题在自言自语的测试中,参与者的评论和主持人的观察统计,分为总体可用性的主题有关的内容确定可用性的发现。这些主题是讨论和反思的基础上开发的观察者,主持人和参与者。为了比较混合的数据可用性评估方法(何和TA2),可用性话题是创建的任务,参与者和专家们被要求执行可用性评价方法。主持人和分组的观察者发现可用性问题的数量在何可用性评论的数量和可用性的数量的观察中遇到TA2从而形成这些可用性的话题。

电子表格是为这两个启发式评估,关于可用性问题的启发式分布,分布可用性侵犯的数量分为启发式/专家,和分布可用性侵犯的程度度专家之一。电子表格也为自言自语测试和用于记录的数量和内容可用性研究参与者的识别和确定观察者指出。可用性的电子表格归类成为可能的发现为主题和主题和比较预备考试和期末测验。

3所示。结果

在本节中,结果和后续测试Telekit系统将在三个部分:(1)HE1与何,(2)TA1对TA2和(3)何对TA2。

3.1。比较这两个启发式评估(HE1与何)

总的来说,专家们发现152个问题的86 (57%)HE1独有。何,专家们发现223个问题的101(45%)是独一无二的。独特的可用性问题的数量在何比HE1略高。

图2提出了独特的分布可用性问题确定为每个启发式HE1何,分别。除了启发式(9)(帮助用户识别、诊断和从错误中恢复过来),启发式方法都是用于何。最低数量的可用性问题的启发式在HE1 (10) (帮助和文档)只有两个(2%)可用性问题。

启发式(2)(匹配系统和真实的世界),27(31%)问题和启发式(8)(审美和极简设计),11(13%)相关的问题是最多的在HE1可用性问题。与何相比,启发式(1)(系统状态的可视性),23例(23%)问题和启发式(4)(一致性和标准)22(22%)相关的问题是最多的可用性问题。

表3介绍了可用性侵犯的数量分为启发式每两个启发式评估专家(HE1,何)。启发式(2)(匹配系统和真实的世界),启发式(4)(一致性和标准)和启发式数量(8)(审美和极简设计)是最被称为启发式在评估。可用性启发式违反相关的数量(2)(匹配系统与现实世界之间)减少从49 HE1 HE2 29。相比之下,启发式(4)(一致性和标准)和启发式号码(8)(审美和极简设计)从20增加可用性侵犯到43,从20到30在何,分别。


启发式	专家1		专家2		专家3		专家4		专家5		总
启发式	HE1	何	HE1	何	HE1	何	HE1	何	HE1	何	HE1	何

(1)系统状态的可见性	0	8	0	7	1	4	3	3	1	4	5	26
(2)匹配系统和真实的世界	5	4	8	7	7	4	14	11	15	3	49	29日
(3)用户控件和自由	1	0	0	3	1	4	3	5	6	2	11	14
(4)一致性和标准	7	11	3	5	2	18	6	2	2	7	20.	43
(5)错误预防	2	6	3	0	5	8	6	4	2	4	18	22
(6)的认可,而不是回忆	2	7	3	9	1	10	2	0	5	1	13	27
(7)使用的灵活性和效率	3	5	2	3	0	6	1	4	2	4	8	22
(8)审美和简约的设计	5	3	3	4	5	19	4	0	3	4	20.	30.
(9)帮助用户识别、诊断和从错误中恢复	2	0	1	0	0	0	0	0	2	0	5	0
(10)帮助和文档	1	1	0	0	0	5	1	3	1	1	3	10

通过对比启发式(1)(系统状态的可视性)在HE1和何,从5个增加可用性侵犯HE1 26可用性侵犯被确认。启发式(7)(使用的灵活性和效率)是与八个可用性侵犯在何HE1和22个可用性侵犯。此外,在何,可用性侵犯有关启发式(10)(帮助和文档)在HE1高出三倍。

表4显示了HE1专家之间的严重程度的分布度和何。严重程度评分(0,1,2是最常用于启发式评估。严重程度得分3和4中经常使用更多比HE1合,增加从4 - 23严重程度评分关键问题和增加4至25严重程度评分故障。


严重程度	专家1		专家2		专家3		专家4		专家5		总
严重程度	HE1	何	HE1	何	HE1	何	HE1	何	HE1	何	HE1	何

(1)改进	12	16	11	5	10	17	14	2	14	3	61年	43
(2)次要的问题	8	19	12	21	12	30.	19	11	15	13	66年	94年
(3)严重的问题	3	6	0	9	0	7	7	8	7	8	17	38
(4)关键问题	2	3	0	3	0	10	0	5	2	2	4	23
(5)故障	3	1	0	0	0	14	0	6	1	4	4	25

3.2。比较两个自言自语的测试(TA1对TA2)

表5分为5个列代表主题的存在(是/否)TA1 / TA2和可用性研究的例子描述参与者的评论在TA1 / TA2。自言自语测试生产12个主题:(1)习惯;(2)缺乏好奇心;(3)信息的水平;(4)的Telekit系统知道如何;(5)舒适与Telekit系统;(6)可用性问题;(7)易学性;(8)系统反馈;(9)Telekit系统的内容;(10)测量;(11)Telekit设计;和(12)Telekit系统的相关性。列“是”和“不”表中显示哪些主题是出现在TA1 TA2,分别。例如,主题信息的水平在TA2但不代表TA1,因此只有TA2列包含一个例子/可用性发现的描述。表5只显示选择的可用性问题,因此主题可以包含几个比表中已经介绍了可用性问题。


主题	TA1	TA2	从TA1例子	从TA2例子

习惯	是的	是的	用户收到Telekit系统半年之前,提供教育	用户阅读问卷非常superficially-they知道会发生什么在随后的步骤
缺乏好奇心	是的	是的	用户没有试图记住密码和用户名	用户使用消息函数编写不感兴趣或发送消息;用户的好奇心不是引起
信息的水平	没有	是的		用户没有使用消息菜单,因为他们不知道它的功能
Telekitsystem-know如何	没有	是的		用户知道不同的图标
舒适与Telekit系统	是的	是的	用户满意Telekit系统的功能。用户导航Telekit系统没有问题	用户不怕按错了键,因为他们知道,他们总是有办法;用户使用Telekit舒适
可用性问题	是的	是的	用户面临着来自触摸屏的反应,因为冷手指或指甲用户有困难记住用户名和密码无法登录	用户不知道如何暂停电影这是不容易找到注销按钮
易学性	没有	是的		用户滚动功能没有问题
系统反馈	是的	是的	当用户按下触摸屏,多次Telekit系统没有反应的命令	Telekit系统的速度太过缓慢,可能会更快
Telekit系统的内容	是的	是的	对于有经验的用户,更灵活的货币制度与莱斯的文本材料就可以做得更好	很高兴被问及COPD的症状有疑问的图标的含义
测量	是的	是的	当用户按下触摸屏多次,这导致不正确的答案和测量用户犯了错误的动作序列,以便太早或太迟,因为测量位置和命名的钥匙	用户把血压袖带错了用户开始用脚的重量
Telekit设计	是的	是的	一些用户有困难识别Telekit键盘上的键用户滚动功能没有问题	有缺乏验证当用户更改密码排版是合适的
Telekit系统的相关性	没有	是的		用户带来了Telekit系统他们的医生

通过参与者的语言和非语言的语言,很明显,这个主题习惯是他们与Telekit交互系统有关。观察者注意到,例如,在某些任务参与者避免使用未知系统的功能,参与者也表达了这个声明,“为什么我要使用这个函数如果系统没有工作吗?”主题,缺乏好奇心参与者的缺乏有关,需要建立新的习惯给现有系统的使用。这方面的一个例子是一个参与者使用消息功能不感兴趣,因为参与者不习惯写电子邮件。第三个主题,信息的水平,是相关的,因为参与者缺乏整体知识Telekit系统及其疾病慢性阻塞性肺病。第四个主题,的Telekit系统知道如何与Telekit系统,与他们的经验。一些参与者惊奇地发现某些功能,例如,变焦功能或滚动功能。

第五个主题,舒适与Telekit系统,成为有关,因为几个参与者表示他们的亲戚或医生已经明确表示他们不能与系统交互时做错什么事,他们总是可以寻求帮助如果发生问题。第六届主题,可用性问题,因为创建几个参与者的可用性问题被确定在TA1 TA2。如前所述在材料和方法,在目前的研究中,参与者收到包含指令使用Telekit系统训练。第七主题,易学性是相关的,因为大多数的参与者报告说他们学到了更多关于如何使用这个系统,已经开始在日常生活中使用的一些功能,例如,功能允许他们来测量他们的血压。

第八主题,系统反馈,是基于技术反馈,在测试参与者变得熟悉。第九个主题,Telekit内容体系,包括配方、问题、描述和功能系统中可见。的一个主要任务,参与者需要执行Telekit系统与不同的设备来衡量他们的生命体征。他们的能力这样做导致了第十个主题,测量。第十一个主题,Telekit设计,是由灵感来自尼尔森的启发式数量(8)命名审美和极简设计。所包含的主题和视觉设计方面的建议来改善系统。最后一个主题,Telekit系统的相关性,是因为参与者不经意间用词语表达自己的倒影说Telekit系统突然成为他们日常生活中很重要的一部分,它帮助他们管理自己的慢性阻塞性肺病。

3.3。比较的启发式评估和自言自语的测试(何对TA2)

在本节中,我们比较了可用性研究结果确定后续测试中Telekit系统。我们发现的可用性问题的数量相比HE2的可用性评价和观察被参与者在TA2和研究员。表6下面每专家提出了许多问题(E1-E5)分类如下:(1)混杂。;(2)阅读和看电影;(3)阅读和看说明;(4)登录;(5)执行测量;(6)写一个消息;(7)查看图片,(8)注销。主题的基础上创建的专家和参与者被要求执行的任务在混合可用性评估。表6也说明了参与者(P1-P5)数量的可用性的评论主题,研究者在TA2观察。何,专家发现比其他地方更可用性侵犯(5)的话题,执行测量,违反数量第二多的是观察话题1,混杂。()。在TA2,参与者和研究者也有更多的评论主题5,执行测量,比其他任何主题,总共25评论和12的观察记录。


在Telekit系统可用性的话题	在TA2⁢研究员观察						⁢参与者在TA2评论						在何⁢Expert-reported可用性
在Telekit系统可用性的话题	P1	P2	P3	P4	P5	总	P1	P2	P3	P4	P5	总	E1	E2	E3	E4	E5	总

混杂。	4	1	2	0	1	8	3	6	0	2	2	13	9	7	15	4	7	42
阅读和看电影	4	0	0	0	0	4	3	2	0	2	2	9	5	4	11	4	5	29日
阅读和看说明	1	0	0	0	0	1	2	1	2	0	1	6	7	3	7	3	2	22
登录	1	1	0	1	0	3	2	1	1	0	0	4	4	3	7	1	1	16
执行测量	6	3	1	0	2	12	5	5	7	6	2	25	15	16	26	15	5	77年
写一个消息	4	0	1	0	0	5	1	4	4	3	2	14	4	2	7	3	4	20.
查看图片	3	0	1	1	1	6	2	0	0	0	1	3	1	3	5	2	6	17
注销	1	0	0	0	0	1	0	0	1	1	0	2	0	0	0	0	0	0

总	24	5	5	2	4	40	18	19	15	14	10	76年	45	38	78年	32	30.	223年

一般来说,何中发现问题的数量是高于TA2识别问题的数量。总的来说,有更多的专家鉴定问题(比参与者的评论())和研究者的观察()。何相反,在TA2,参与者和研究者发现最多的问题关于可用性话题,注销。这些问题并不在何(表6)。

4所示。讨论

近年来在远程医疗技术的发展繁荣,希望他们会为社会节约成本,为病人提供好处。评估可用性是一个重要的步骤在远程医疗技术的发展,它是成功的先决条件实现31日- - - - - -33]。多个可用性评价方法可用于可用性测试和评估,从检验方法如启发式评估用户测试,如测试自言自语。

在文献中,进行迭代式的工作,在开发和评估系统的重要性往往是强调[19]。此外,经验和执行测试的文档描述,使用不同的方法和技术来评估系统的可用性照明和非常重要的观点不同于用户和专家的观点。各种可用性方法相互补充,但有些方法优于他人,根据系统在开发过程中多远。因此,它是值得推荐的组合方法和使用迭代设计过程中,系统通过循环反复测试流程(14]。

一些研究已经在迭代循环结合不同的可用性评估方法和工作设计和评估系统(34- - - - - -36]。然而,没有可能找到研究或其他远程医疗技术,本研究使用相同的设置。然而,我们的确发现的例子,类似的其他技术系统研究[37]。例如,一项研究比较两个数字紧急医疗服务的原型系统通过启发式评估,随后研究了启发式评估的有效性的人种学研究[38]。迭代使用可用性的方法是很重要的,因为它允许我们调整系统的设计。然而,当使用可用性,它应该记住永远有可能进一步改善系统和“完美”系统将因此难以实现。

本研究旨在评估的可用性Telekit系统从丹麦TeleCare北试验和提高其质量和功能。Telekit被使用一个迭代,计算混合可用性的方法。具体来说,评估包括预处理和期末测验Telekit系统知识发现流行,严重程度和内容的可用性问题。数据比较叙述地如下:(1)比较HE1与何;TA1对TA2比较(2),(3)比较何对TA2。

4.1。比较HE1而合

HE1之后,Silverbullet收到证据确凿的建议来改善Telekit列表的接口以使其更具用户友好性。Silverbullet如何管理建议研究人员手中。确定该公司是否遵循字母列表,这是反映在通过后续测试确定的可用性问题,何(),进行预测()。公司的可用性问题的优先级导致的需要进一步轮启发式评估由于专家的类似问题补充了新问题的识别。

另一种解释可能是,专家们变得更加意识到评估过程中的任何问题后执行评估Telekit在预备考试阶段。第三个解释可能是,三个新的专家执行何评估而不是五个来自HE1专家。从比较有效性的观点来看,这将是比使用相同的专家进行预测和期末测验。然而,新的专家选择基于相同的标准进行预测专家为了达到最佳匹配。这些标准包含的专家,应该双专家和有相同的教育相同的健康领域的知识,和相同的专业知识领域的可用性。然而,专家的使用与不同层次的熟悉评估系统既有优点和缺点。专家事先熟悉系统可能受到他们过去的经验与系统。例如,他们可能已经发现了很多错误在预备考试,他们已经形成了一个负面的,最初的意见可能很难忽略Telekit系统的第二次评估。行为的专家数量(3)表明一个已经消极态度系统,与消极态度的专家可能会增加识别可用性问题的技能。同样,它可能是有利于使用新的专家,因为他们会看到和评估Telekit系统用新的眼光。

4.2。比较TA1对TA2

自言自语测试生产12个主题和可用性的例子,发现在这些主题。主题的特征是正面和负面结果和结果。大部分的主题出现在后续测试,这可以解释为改进在Telekit系统TA1和TA2之间的时间。相互矛盾的解释可能是,改变Telekit系统后TA1 Telekit的可用性降低而不是提高,从而导致更多的主题在期末测验。

自言自语的测试适合的洞察COPD参与者的想法和发现可用性问题在他们遇到与Telekit交互系统。自言自语测试的优势之一是它允许数据的收集用户的认知过程以及他们如何与系统进行交互。测试确定了积极和消极两方面Telekit系统经验的参与者。研究人员旨在包括相同的参与者在两个测试但最终决定反对这样做,因为参与者需要保持他们的好奇心和可能产生习惯有关系统的使用在第一次测试。它也认为包括时间自言自语测试的结果。然而,它证明了复杂的使用时间作为测量元素,因为谈话闲聊的某些部分用于建立一种氛围,使得参与者觉得他们被允许自由地表达他们的意见。闲聊还帮助创建一个参与者和研究者之间的信任关系。这些会谈被认为有必要,因为我们的评估Telekit系统依赖于一个良好的关系。

4.3。何对TA2。比较

在后续测试,我们选择在两个不同的评价方法进行比较。Telekit系统经历了很多改进(21),因此我们比较结果从第二个启发式评估(何)与第二自言自语测试的结果(TA2)。是理想的比较结果从HE1收集从TA1和TA2和何结果,但是我们决定不这样做上面说的原因。此外,数据从TA1和TA2没有足够相似,允许一个详细的分析这些结果HE1与合之间,因为参与者的数量不同预处理和期末测验(5和6,职责)。

当比较结果从何和TA2,我们发现更多的可用性问题被确定通过启发式评估比自言自语测试。这可能反映了不同的范围和潜在的两个可用性评价方法。相比使用启发式评估发现的许多问题,系统没有明确的积极方面专家,而是慢性阻塞性肺病参与者通过自言自语测试。慢性阻塞性肺病参与者同意系统可用性的某些方面,但很明显,他们对可用性有不同的观点。专家集中在系统的功能和接口,如系统反馈,导航和错误预防。相比之下,参与者更关注集成系统在日常生活中,因此自言自语的主题测试技术和更关注系统是否有意义和相关作为人类。

4.4。方法论的注意事项

我们的结果分析了叙述地,这是一个优势在这种类型的研究,因为这种方法概述的内容和范围的问题。进行描述性分析的另一个原因是,大量的材料可以使用描述性分析,使它更直观地理解。描述性分析的一个缺点是,语句与可用性问题的分类没有完全利用这种描述性的分析。然而,可以最小化这个问题,包括两种不同类型的测试各种可用性方面代表不同的观点和意见。

十个启发式开发的可用性专家雅各布·尼尔森和评定量表由5级严重性Rolf Molich被用于这两个启发式评估会议(29日,39]。使用相同的工具在两个会话提高可靠性的概率增加的两个执行会话。许多启发式可以使用,但通过评估Telekit系统相同的十个启发式两个启发式评估会议,HE1何,我们获得了比较的可能性进行预测的结果和后续测试。

本研究有很多的局限性。首先,它会比使用相同的专家对启发式评估这将使得它可以单独比较专家的结果。

另一个限制是,预备考试包括两个不恒等的版本的Telekit系统,而后续测试的版本是相同的。这发生,因为启发式评估的结果(HE1)导致的变化Telekit系统自言自语之前测试(TA1)已建立。启发式评估的结果(何)没有集成到Telekit系统前自言自语(TA2)进行了测试。在预备考试阶段采用这种方法的优点是,HE1清洗系统的接口为潜在的可用性问题,否则可能会导致缺乏兴趣的用户。一个缺点是系统开发花了长时间,因为修正由Silverbullet [23之前)的新版本Telekit系统更新。

基于目前的研究,我们建议使用混合可用性方法迭代地在医疗卫生保健系统和远程医疗技术的发展。作为一个迭代,混合可用性方法只是在一个系统中实现,来自北方丹麦TeleCare Telekit系统试验,我们不能概括和定性定量结果发现在本研究收集其他远程医疗技术的结果可能取决于系统的类型,等等。

我们采取了一种整体的观点来评估Telekit系统的可用性和跟随系统的生命周期,使我们能够分析和引起参与者的需求和识别所需的功能。这种方法包括建立一个完全理解的慢性阻塞性肺病参与者”和专家的观点。开发和评估新的远程医疗系统是一个持续的过程。预测这一过程的持续时间是不精确的科学,当过程结束取决于用户评价系统和设置系统的实现。

在未来,这将是有趣的比较启发式评估和自言自语测试不同类型的可用性评价方法,如眼球追踪。眼球追踪提供了客观的结果的热图和主观发现评论和语句的形式对热图(40]。客观结果和主观热地图似乎是一个非常相关的补充本研究由于额外的可用性可能表面,结果不确定的其他方法。

5。结论

混合Telekit系统上的可用性的方法进行迭代。定量结果和定性研究结果表明,为了实现一个有效的和彻底的可用性评估,需要结合各种方法和应用这些反复。基于研究结果,Telekit系统似乎有希望作为一种工具支持COPD病人的管理他们的疾病。预备考试引发了大量的启发式评估Telekit系统的变化,和几个新版本的系统已经实现。之后,建立了一个自言自语的测试与系统参与者口头上表达了他们的经验。大约一年后系统全面实施和操作,进行后续测试。比较的预处理和后续测试的问题,我们假设测验后的识别更少的问题。这种假设落空,这说明进行迭代式的工作的重要性。此外,它也适合使用的可用性评估方法不同可用性方法将照射角度的可用性。Telekit系统仍然需要功能和改进设计。 However, the system is fully implemented and the COPD patients from the Danish TeleCare North trial have already reported that they experience increased freedom, control, and security and greater awareness of their COPD symptoms when using the system [41]。因此,我们得出这样的结论:Telekit系统可用性需要进一步评价和推荐混合方法被应用在这个过程。这个研究是有价值的提高和自定义Telekit系统根据用户的需求进行扩展的评估和用户测试。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

作者感谢医护人员(区域主管护士和护士)是隶属于TeleCare北审判的合作,帮助寻找潜在参与者作为研究对象。在这种情况下,他们也感谢参与者邀请他们到家中,同意参与自言自语测试。此外,他们扩展他们的感激之情的可用性专家卫生部科技、Aalborg大学,为自己的建设性参与启发式评估。最后,他们要感谢Morten Pilegaard副教授和Cand.ling.merc。,认证翻译彼得Steffensen校对的手稿。这项研究是由丹麦北部地区;11市北丹麦地区;阿贝尔家族基金会;丹麦机构数字化政策和战略,欧洲社会基金。

引用

m·卡特赖特s . p . Hirani l . Rixon et al .,“远程健康对生活质量的影响和心理的结果超过12个月(整个系统演示远程医疗问卷研究):嵌套研究病人报告结果的务实、集群随机对照试验,”BMJ,卷346,不。7897年,文章f653, 2013。视图:出版商的网站|谷歌学术搜索
r·伍”,二十多年的慢性疾病管理与远程医疗证据合成,“远程医疗和Telecare杂志》上,18卷,不。4、211 - 220年,2012页。视图:出版商的网站|谷歌学术搜索
美国麦克莱恩,Nurmatov, j·l·刘,c . Pagliari j .汽车和a·谢赫“Telehealthcare慢性阻塞性肺病。”Cochrane系统评价的数据库,没有。7篇文章ID CD007718 2011。视图:谷歌学术搜索
f·w·Udsen p h . Lilholt o . Hejlesen和l·h·埃勒斯医生”的有效性和成本效益的telehealthcare慢性阻塞性肺疾病:集群随机对照试验研究方案,“试用,15卷,不。1,第178条,2014。视图:出版商的网站|谷歌学术搜索
j·克鲁兹、d·布鲁克斯和品牌,“家里遥控在慢性阻塞性肺病:系统回顾的方法和患者的依从性,”国际医学信息学杂志》上,卷83,不。4、249 - 263年,2014页。视图:出版商的网站|谷歌学术搜索
公元前j·辛格,c . Lutteroth和希望,“分类家庭远程医疗系统的可用性需求”第11届国际研讨会论文集的新西兰章ACM特殊利益集团对人机交互(CHINZ 10)2010年7月,页29-32,。视图:出版商的网站|谷歌学术搜索
k·霍顿,“使用telecare慢性阻塞性肺疾病患者:对管理”护理管理杂志》,16卷,不。2、173 - 180年,2008页。视图:出版商的网站|谷歌学术搜索
y . j .春p·e·帕特森,“可用性老年人和年轻人之间的差距在一个基于互联网的远程医疗系统的界面设计,“工作第41卷。。1,第352 - 349页,2012。视图:出版商的网站|谷歌学术搜索
t . Botsis和g . Hartvigsen”现状和未来的角度在telecare老年人患有慢性疾病,”远程医疗和Telecare杂志》上,14卷,不。4、195 - 203年,2008页。视图:出版商的网站|谷歌学术搜索
HCI n·贝文。”国际标准,”人机交互的百科全书,2006年1 - 15页。视图:谷歌学术搜索
m·马奎尔,”方法来支持以人为本的设计,”国际人类计算机研究杂志》上,55卷,不。4、587 - 634年,2001页。视图:出版商的网站|谷歌学术搜索
a . Kushniruk”评价卫生信息系统的设计:应用程序的可用性工程方法,”计算机在生物学和医学,32卷,不。3、141 - 149年,2002页。视图:出版商的网站|谷歌学术搜索
j . Horsky k . McColgan j·e·庞et al .,“互补系统的可用性评估方法:调查和观察在软件设计和开发周期,”生物医学信息学杂志,43卷,不。5,782 - 790年,2010页。视图:出版商的网站|谷歌学术搜索
m . w . m .雅斯贝尔斯“可用性测试方法的比较互动卫生技术:方法论和实证的证据,”国际医学信息学杂志》上,卷78,不。5,340 - 353年,2009页。视图:出版商的网站|谷歌学术搜索
r·r·霍尔“原型可用性的新技术,国际人类计算机研究杂志》上,55卷,不。4、485 - 501年,2001页。视图:出版商的网站|谷歌学术搜索
d·卡斯提拉a . Garcia-Palacios j . Breton-Lopez et al .,”过程的设计和可用性评估telepsychology网络和虚拟现实系统为老年人:巴特勒,”国际人类计算机研究杂志》上,卷71,不。3、350 - 362年,2013页。视图:出版商的网站|谷歌学术搜索
j·尼尔森,“平行与迭代设计+竞争测试=高可用性,”2011年,https://www.nngroup.com/articles/parallel-and-iterative-design/。视图:谷歌学术搜索
j·尼尔森,“迭代设计的用户界面,”1993年,http://www.nngroup.com/articles/iterative-design/。视图:谷歌学术搜索
h . r .律师事务所、t·s·安德烈和r . c .实证分析“标准评估可用性评估方法,”国际期刊的人机交互,13卷,不。4、373 - 410年,2001页。视图:出版商的网站|谷歌学术搜索
p h . Lilholt s Heiden, o . k . Hejlesen“用户满意度和经验与远程医疗系统的丹麦telecare北试验:自言自语的一项研究中,“研究卫生技术和信息卷,205年,第904 - 900页,2014年。视图:出版商的网站|谷歌学术搜索
p h . Lilholt m·h·詹森和o . k . Hejlesen“远程医疗系统的启发式评估从丹麦TeleCare北审判,”国际医学信息学杂志》上,卷84,不。5,319 - 326年,2016页。视图:出版商的网站|谷歌学术搜索
Silverbullet,OpenTele∣架构,Opentele.Silverbullet。dk, 2013,http://opentele.silverbullet.dk/architecture/。
Silverbullet, 2016,http://opentele.silverbullet.dk。
2016年三星,http://samsung.com。
答:医疗、“Andonline”, 2016年,http://andonline.com。视图:谷歌学术搜索
Nonin。Nonin, 2016,http://nonin.com。
j·尼尔森,”如何进行启发式评估,”10卷,2001年,http://www.nngroup.com/articles/how-to-conduct-a-heuristic-evaluation/。视图:谷歌学术搜索
j·尼尔森用户界面设计10启发式2013卷,1995年,http://www.nngroup.com/articles/ten-usability-heuristics/。
r . Molich有用的网页设计2007年,纽约时报Teknisk,哥本哈根,丹麦。
m . Van Someren y . f .巴纳德和j·a·c·桑德伯格自言自语的分手方法实际造型认知过程的指南、学术出版社,阿姆斯特丹,荷兰,1994年。
j . Polisena k . Tran k .西门et al .,“家庭远程医疗对慢性阻塞性肺疾病:系统性回顾和荟萃分析,“远程医疗和Telecare杂志》上,16卷,不。3、120 - 127年,2010页。视图:出版商的网站|谷歌学术搜索
美国Kitsiou、g .削减和m . Jaana”的系统回顾和荟萃分析远程控制慢性疾病患者的干预:一个关键的评估他们的方法学质量,”医学网络研究杂志》上,15卷,不。7篇文章e150 2013。视图:出版商的网站|谷歌学术搜索
美国麦克莱恩,Nurmatov, j·l . y . Liu c . Pagliari j .汽车和a·谢赫“Telehealthcare慢性阻塞性肺疾病:cochrane回顾和荟萃分析,“英国杂志的惯例,卷62,不。604年,pp. e739-e749, 2012年。视图:出版商的网站|谷歌学术搜索
r . l . Yussof t . n .巴黎h·诺谟图h·b·扎曼,“混合可用性评估开发周期中“MEL-SindD”,“Procedia-Social和行为科学卷,105年,第170 - 162页,2013年。视图:出版商的网站|谷歌学术搜索
m·r·博兰a . Rusanov y . et al .,“从expert-derived用户需要用户感受到的易用性和实用性:一个两阶段混合方法评价框架,“生物医学信息学杂志52卷,第150 - 141页,2014年。视图:出版商的网站|谷歌学术搜索
h . c . Ossebaard e . r . Seydel, l . van Gemert-Pijnen”网络可用性和患者长期条件:混合方法的方法,”国际医学信息学杂志》上,卷81,不。6,374 - 387年,2012页。视图:出版商的网站|谷歌学术搜索
s . g . s .沙和罗宾逊,“用户参与医疗技术开发和评价:结构化的文献综述,”国际卫生保健杂志质量保证将领导卫生服务,19卷,不。6 - 7,500 - 515年,2006页。视图:出版商的网站|谷歌学术搜索
z, t·r·约翰逊,r·d·Tindall和j·张,“启发式评估应用到提高远程医疗系统的可用性”远程医疗期刊和e-Health,12卷,不。1,24到34,2006页。视图:出版商的网站|谷歌学术搜索
j·尼尔森用户界面设计10启发式,1995,http://www.nngroup.com/articles/ten-usability-heuristics/。
c . Schaarup g . Hartvigsen l·b·拉森Z.-H。棕褐色、大肠Arsand和o . k . Hejlesen”评估的潜在使用眼球追踪三角测量来评估在线糖尿病运动系统的可用性,”研究卫生技术和信息卷,216年,第88 - 84页,2015年。视图:出版商的网站|谷歌学术搜索
p h . Lilholt l . k . Hæsum, o . k . Hejlesen”探索远程医疗系统的用户体验丹麦TeleCare北审判”研究卫生技术和信息卷,210年,第305 - 301页,2015年。视图:谷歌学术搜索

国际期刊的远程医疗和应用程序

文摘