文摘

背景。从Zika病毒埃博拉病毒的最新COVID-19大流行,高度传染性疾病暴发继续揭示社会和卫生不公平现象的严重后果。人们从低社会经济和教育背景,以及低健康素质往往会受到不确定性的影响,复杂性、波动性和先进性的公共卫生危机和突发事件。关键教训,政府已经从正在进行的冠状病毒大流行发展的重要性和传播高度访问的,可行的,包容的,连贯的公共卫生建议,这代表一个重要的工具来帮助人们不同的文化,教育背景和不同的能力来有效地实现基层卫生政策。客观的。我们旨在翻译可访问的最佳实践,包括公共卫生建议(故意设计对于较低的社会经济和教育背景的人来说,健康知识水平,英语水平有限,和认知功能障碍)在COVID-19英语多元文化国家的卫生当局(美国、澳大利亚和英国)自适应评估工具的可访问性公共卫生建议在其他语言。方法。我们开发了一个优化贝叶斯分类器产生的概率预测的可访问性官方健康弱势人群中建议包括移民和外国人生活在中国。我们开发了一个自适应统计公式的可访问性的快速评估健康建议在中国脆弱的人。结果。我们的研究提供了研究工具需要填写一个持久缺口在访问中国公共卫生研究,包括传播传染病的预防和管理。概率预测,使用贝叶斯优化机器学习分类器(GNB),最大的阳性似然比(LR) + 16.685(95%置信区间:4.35—64.04)确定当概率阈值被设定为0.2(灵敏度:0.98;特异性:0.94)。结论。健康风险的有效的沟通,包容,可操作的公共意见代表了一个强大的工具来减少卫生不公平现象在健康危机和突发事件。我们的研究翻译的最佳实践的公共卫生建议在大流行期间发展成直观的机器学习分类器对卫生部门制定循证指南的健康建议。此外,我们开发了自适应统计工具前线卫生专业人员评估可访问性的公共卫生建议来自非英语背景的人。

1。介绍

来自Zika病毒埃博拉,新型冠状病毒大流行,高度传染性疾病暴发继续揭示社会和卫生不公平现象的严重后果(发展中国家和发达国家1,2]。弱势群体的影响更多的不确定性,复杂性,波动性,共产党员先进性的公共卫生危机和突发事件3,4]。关键教训,政府已经从正在进行的冠状病毒大流行发展传播高度访问的重要性,包容、可操作的、连贯的公共卫生建议(5- - - - - -8],它代表了一个重要的工具来帮助人们不同的文化,教育背景和不同的能力来有效地实现基层卫生政策。高可变性在人们的社会经济背景、教育和健康素养水平,不同的知识,认知能力,英语流利,和宗教信仰会导致访问障碍和实施公共卫生建议卫生突发事件和危机9- - - - - -11]。增加包容性和可访问性的健康建议建议不同弱势群体已成为一个重要的主题在公共卫生教育和国内和国际政策制定作为一种极具成本效益的措施来减少卫生不公平现象(12- - - - - -15]。

目前,缺乏国家或国际准则的发展可访问的和包容的公共卫生建议,特别是卫生突发事件和危机。然而,最近爆发的冠状病毒促使国家卫生当局发展高度访问COVID-19卫生资源。目前大多数为卫生资源在传染病属于常规卫生资源(RHR)需要更高水平的教育,英语水平,卫生知识和素养16- - - - - -19]。典型的科技是世界卫生组织发布的资源(仅供一般和专业的读者20.- - - - - -22]。然而,实际的可访问性卫生资源在公众仍然未知,国际卫生组织最近展开调查,建立公共卫生资源可访问性的证据(20.]。

脆弱的以人为本(VPO)卫生资源著称显著提高语言的可理解性,信息相关性(最小分散无关细节的读者),社会包容(适用性不同人群),和信息可控诉的情形(23- - - - - -25]。他们是由医疗/卫生专业人员拥有丰富的工作经验与多样化的弱势群体首先确保VPO的实际可用性。在说英语的多元文化社会,语内的卫生和简化或accessibility-enhanced英语翻译资源提供主要的公共卫生建议和信息来源多样化的弱势群体(8,26- - - - - -28),虽然以证据为基础的指导方针告知这些材料的发展和相关质量控制措施尚未建立和验证。

英语越来越多的VPO卫生资源,被称为易读的或易读卫生材料、评估工具的发展提供有价值的第一手材料和技术支持在诊所的最佳实践,以及全球卫生政策制定访问健康建议设计和社会传播。language-adaptive评估工具的发展可以促进循证卫生决策的国际卫生当局。卫生政策制定者,我们开发了监督机器学习贝叶斯分类器,和一线卫生专业人员我们开发方便,language-adaptable统计分析工具来评估公共卫生建议的可访问性传染病,包括COVID-19。

应该注意的是,机器学习分类器和统计工具,我们使用中国卫生资源可开发方便、可靠地适应其他语言使用低成本、相对容易获得自然语言注释工具。在这一过程中,我们的研究为临床提供实用和有用的工具和卫生专业人员的工作直接与脆弱的人。直观的贝叶斯概率评估工具,我们开发了将帮助推进研究型全球访问健康建议设计与国际基准继续传播的流感大流行在许多发展中国家和任何未来的公共卫生危机,需要快速、有效的、高效的回应政府和卫生部门解决实际需要来自不同弱势群体,帮助减少环境和健康的影响。

2。方法

2.1。收集和翻译的常规和脆弱的以人为本的医疗资源

我们收集了两套风格独特的公共卫生建议传染性疾病的预防和自我管理。常规卫生资源(RHR)(202)选择网站的世界卫生组织(世卫组织)。脆弱的以人为本(VPO)材料(91),特别是公共卫生建议COVID-19,收集从卫生部门的网站,包括疾病控制和预防中心(CDC),澳大利亚卫生和公共卫生。这些资源很容易被识别由于标签清晰易读的公共卫生建议和COVID-19的说明。作为一个国际卫生机构,提供验证的专业翻译英文原版资源。因为我们的研究是开发评估工具评估可访问性在中国的公共卫生建议,中国翻译的常规健康建议收集传染病。VPO资源来自CDC的来源,澳大利亚卫生和公共卫生,英格兰,翻译成中文使用前后翻译[谁推荐的29日- - - - - -31日]。

2.2。Morphological-Lexical-Structural (MLS)特性

中国科技翻译和VPO注释使用中国可读性指数Explorer(啼哭)[32,33]。啼哭注释提供26 morphological-lexical-structural (MLS)特性和46名词性(POS)特性(72)注释中文文本为我们的机器学习分类器的发展。MLS包括每段平均句子数量、类型标记率(竞技场队伍),low-stroke字符(1 - 10中风),middle-stroke字符(11日至20日中风),high-stroke字符(21岁或以上),平均每字符笔画,2-character话说,3-character的话,平均单词/句子,名词短语,比正常频率的名词短语,平均每句成语,实词(动词、名词、副词和形容词),否定副词的句子具有复杂的语义类别(一词多义的),密度的内容的话,平均对数频率的内容的话,代词、人称代词、连词,积极的连词,-连接词,难词比例。这些MLS特性在中国可读性研究被广泛的研究。

2.3。词类(POS)特性

词类系统由中央研究院开发的最全面的中国应用的自动分析器。POS特性收集包括nonpredicate形容词(A)、并列连词(Caa)、连词(出租车),连词(Cba),相关连接词(Cbb)、副词(D)、名义/状语/补充标记(DE)、状语noun-modifiers (Da),程度副词动词(Dfa)之前,程度副词动词(足协)后,紧张的标记(Di),句子的副词(Dk),感叹词(我),普通名词(Na)、专有名词(Nb),地理名称(Nc),位置名称(非传染性疾病),时间副词(Nd),定语代课(Nep),修饰符的量化措施(Nes)、数量(Neu),测量(Nf), post-positions (Ng),代词(Nh)、介词(P)、动词(SHI),辅助词(T)不及物动词谓语(VA)、使役动词动词(休假),及物动词后放置对象(VB),及物动词(VC),动词前放置位置(VCL)谓词用于直接和间接对象(VD),动作动词作为句子对象(VE),动作动词作为谓语对象(VF)、分类(VG)动词,动词和名词的修饰符(VH),使役动词修饰符(VHC),形容词或过去的粒子后放置对象(VI),及物动词来描述状态(VJ),精神状态和过程(VK)诱发谓词(重要),动词(V_2)。

2.4。统计分析

1表明,在72年自然语言特性(26毫升,46 POS),统计上显著差异( 常规卫生资源之间的非参数Mann-Whitney U测试)(RHR)和脆弱的以人为本(VPO)卫生资源在整个特性集的88.9%:96.15%(25/26)的morphological-lexical-structural (MLS)特性和84.78%(39/46)的词性(POS)特性。除了双向的p值,我们计算对冲 (34]纠正科恩的d(1、36和37)和95%置信区间效应大小的估计。我们还提供了共同的语言的影响大小(cl),也称为概率优势的35- - - - - -37]。在我们的研究中,cl允许直观的解释的可能性意味着某种自然语言特性的随机选择从VPO高于均值的特性在RHR传染病。我们计算对冲的 一般和cl与报道p值两个目的:首先,这是为了帮助我们解释的结果自动特征选择使用贝叶斯机器学习分类器(高斯朴素贝叶斯选择由于存在连续变量正态分布的特性);第二,这促进了样本大小的确定,为后续研究或影响的比较研究。

下面的公式显示了纠正效果或对冲的 :

下面的公式显示了共同语言效果(cl):

当计算尺度效应(对冲 )和相关的概率优势(cl),我们使用r作为参考类。因此,正值表示特性在统计学上更高更困难常规卫生资源;和消极的价值观在高度可访问,表明功能普遍脆弱的以人为本的公共卫生建议。MLS特性的大型(绝对值大于1),纠正效果大小,对冲的 ,和cl包括以下几点:平均每段句子(VPO: M = 0.601, SD = 0.345;RHR: M = 3.316, SD = 1.163, ,对冲的 = 2.588,95% CI[2.301, 2.874],和cl = 0.966);令牌类型比例(竞技场队伍)(VPO: M = 0.461, SD = 0.119;RHR: M = 0.623, SD = 0.079, ,对冲的 = 1.828,95% CI[1.568, 2.088],和cl = 0.902);难词的频率(VPO: M = 141.813, SD = 96.381;RHR: M = 70.872, SD = 35.986, ,对冲的 =−1.311,95% CI(−1.558−1.065)和cl = 0.823);单个的句子(VPO: M = 0.883, SD = 0.114;RHR: M = 0.460, SD = 0.191, ,对冲的 =−2.376,95% CI(−2.655−2.098)和cl = 0.954);代词(VPO: M = 41.692, SD = 35.043;RHR: M = 1.469, SD = 1.652, ,对冲的 =−2.530,95% CI(−2.814−2.245)和cl = 0.963);人称代词(VPO: M = 37.868, SD = 31.838;RHR: M = 0.705, SD = 1.139, ,对冲的 =−2.577,95% CI(−2.864−2.291)和cl = 0.966);low-stroke字符(VPO: M = 641.593, SD = 444.264;RHR: M = 284.707, SD = 140.930, ,对冲的 =−1.507,95% CI -1.758−1.256,和cl = 0.857);2-character单词(VPO: M = 256.637, SD = 176.783;RHR: M = 114.341, SD = 56.262, ,对冲的 =−1.509,95% CI(−1.76−1.258)和cl = 0.857);和平均对数频率实词(VPO: M = 1.738, SD = 0.169;RHR: M = 1.337, SD = 0.183, ,对冲的 =−2.225,95% CI(−2.498−1.952)和cl = 0.942)。

词性(POS)特性的大型(绝对值大于1),纠正效果大小,对冲的 ,和cl包括以下几点:Nh(代词)(VPO: M = 41.692, SD = 35.043;RHR: M = 1.469, SD = 1.652, ,对冲的 =−2.530,95% CI(−2.814−2.245)和cl = 0.963);VF(动作动词作为谓语对象)(VPO: M = 4.198, SD = 3.964;RHR: M = 0.222, SD = 0.629, ,对冲的 =−2.119,95% CI(−2.388−1.849)和cl = 0.933);VA(不及物谓词)(VPO: M = 11.659, SD = 10.140;RHR: M = 2.088, SD = 2.214, ,对冲的 =−1.919,95% CI(−2.181−1.656)和cl = 0.913);VK (精神状态和过程)(VPO: M = 9.736, SD = 7.688;RHR: M = 2.293, SD = 2.086, ,对冲的 =−1.889,95% CI(−2.151−1.627)和cl = 0.909);D(副词)(VPO: M = 44.110, SD = 31.491;RHR: M = 14.489, SD = 8.247, ,对冲的 =−1.849,95% CI(−2.11−1.589)和cl = 0.905);VC(及物动词)(VPO: M = 48.791, SD = 35.985;RHR: M = 14.759, SD = 10.551, ,对冲的 =−1.812,95% CI(−2.071−1.552)和cl = 0.900);非传染性疾病(位置名称)(VPO: M = 6.747, SD = 5.960;RHR: M = 1.869, SD = 1.933, ,对冲的 =−1.526,95% CI(−1.777−1.274)和cl = 0.860);P(介词)(VPO: M = 22.571, SD = 16.570;RHR: M = 9.330, SD = 6.188, ,对冲的 =−1.424,95% CI(−1.672−1.175)和cl = 0.843);和V_2(有)(VPO: M = 4.560, SD = 5.879;RHR: M = 1.128, SD = 1.214, ,对冲的 =−1.197,95% CI(−1.44−0.953)和cl = 0.801)。

2.5。高斯朴素贝叶斯

高斯朴素贝叶斯(GNB)是一个变体监督机器学习的朴素贝叶斯分类算法基于贝叶斯定理(38- - - - - -42]。各种GNB优势是它方便,计算速度(是否适合进行实时预测),可伸缩性、generalisability小数据像大多数机器学习贝叶斯分类器,与连续和离散的功能和灵活性。在我们的研究中,培训(205)的大小和测试数据(88)相对较小。像GNB贝叶斯机器学习分类器,相关向量机(RVM),和multinominal朴素贝叶斯(MNB)更合适,因为他们不太可能overfit小数据集。此外,公共卫生资源的两套,我们收集,定期和脆弱的以人为本集,包含连续的特性及其在中国翻译的常规卫生资源分布高斯正态分布(表2,图1)。因此,GNB被选为最合适的机器学习分类器在我们的研究中,以确保generalisability和分类器的可靠性。

2.6。培训和测试机器学习分类器

机器学习分类器训练易访问性评估的自动信息,使用的RHR总数是202和VPO的总数是91。接下来,73.3%(148)的RHR和62.6% (57)VPO作为训练数据,其余的文本(54 RHR和34 VPO)作为测试数据。我们应用5倍交叉验证与训练数据的平均值和标准偏差产生曲线的面积(AUC) GNB分类器。评估模型的性能测试数据是在剩下的30%的AUC,准确性,敏感性,特异性和宏观F1(表3)。

2.7。分类器优化

高维特性可以减少机器学习分类器的性能由于被迫纳入模型中参数无关。应对问题的分类器表现不佳的存在造成的冗余特性,我们采用不同的分类器优化技术来减少收集到的原始特性。首先,我们通过选择优化应用积分优化组合的特性集MLS和POS特性(72)。这将导致组合优化特性集6特性(约8%的原始总特性):每段平均句子(ASPP) ( ,对冲的 = 2.588,95% CI[2.301, 2.874],和cl = 0.966),人称代词( ,对冲的 =−2.577,95% CI(−2.864−2.291)和cl = 0.966), Di(时态标记)( ,对冲的 =−1.003,95% CI(−1.243−0.763)和cl = 0.761), Nd(时间副词)( ,对冲的 =−0.418,95% CI(−0.65−0.186)和cl = 0.616), VF(动作动词作为谓语对象)( ,对冲的 =−2.119,95% CI(−2.388−1.849)和cl = 0.933), V_2(动词) ,对冲的 =−1.197,95% CI(−1.44−0.953)和cl = 0.801)。

这些优化特性也被那些(最显著的统计学差异p价值观,纠正效果对冲的 ,共同语言的影响大小cl)定期和脆弱的以人为本的医疗资源(表之间的关系1)。接下来,我们应用功能优化的两套MLS(26)分别和POS(46)特性。这导致了一个优化MLS特性集2的特性(MLS总数的7.7%功能):ASPP和ALFCW ( ,对冲的 =−2.225,95% CI(−2.498−1.952)和cl = 0.942)。8特性的优化POS特性集(POS特性总数的17.4%):一个(nonpredicate形容词)( ,对冲的 =−0.023,95% CI(−0.254, 0.207),和cl = 0.507), Cbb(相关连接词)( ,对冲的 =−1.022,95% CI(−1.263−0.782)和cl = 0.765), Dfa(程度副词动词之前)( ,对冲的 =−0.797,95% CI(−1.033−0.561)和cl = 0.713), Nd(时间副词)(见上图),Ng(后置)( ,对冲的 =−1.090,95% CI(−1.331−0.848)和cl = 0.780), Nh(代词)( ,对冲的 =−2.530,95% CI(−2.814−2.245)和cl = 0.963), VCL(动词之前放置的位置)( ,对冲的 =−1.656,95% CI(−1.911−1.401)和cl = 0.879), VHC(使役动词修饰符)( ,对冲的 = 0.649,95% CI [0.415, 0.884], cl = 0.677)。积分和并行分类器优化,我们使用backforward特性消除称为递归特性消除(RFE)以支持向量机为基础估计量。最大精度验证/最小分类错误被用作特性优化标准(表4和图2)。

3所示。结果

3显示了使用不同的特性集GNB分类器的性能。总的来说,贝叶斯分类器使用优化特性优于那些使用原始的、更大的特性集。例如,测试数据,整体优化GNB 2毫升和6 POS特性实现更高的AUC(0.993),(0.963)的敏感性,特异性(0.9118),和准确性(0.940)比分类器使用完整的特性集AUC(0.940),(0.944)的敏感性,特异性,(0.8824)和准确性(0.921)。分别优化POS特性集(8 POS特性)达到一个更高的AUC(0.968),(1.0)的敏感性,特异性,(0.8824)和准确性(0.955)比原来的POS特性集(46 POS功能)(AUC = 0.852, = 0.889敏感性,特异性= 0.7941,和准确性= 0.852)。后比较3优化特性集:美国/ POS共同优化(6),MLS优化(2),和POS优化(8),我们增加了2套单独的优化特性2毫升特性(ASPP ALFCW)和8 POS特性(Nd A、Cbb Dfa, Ng, Nh, VCL,和VHC)在一起,进一步细化功能设置2只特性:ALFCW和Nh(代词)使用相同的落后淘汰RFE_SVM过程。这导致一个高度简化的模型(模型8)主要实现类似的性能表现最佳的模型,一个集成2分别优化功能(7)模型。优化模型8实现特异性(1.0)高于模型7(0.8824),这表明公共卫生资源的更好的检测和建议适合用在卫生突发事件和危机最大社会可访问性。

3.1。贝叶斯概率输出

贝叶斯机器学习分类器的输出是一个概率的形式属于常规的公共卫生建议训练数据。在我们的研究中,表现最好的分类器(模型8:精制MLS和POS分别优化:2特点:ALFCW和Nh),平均平均输出(概率)0.9557 (SD = 0.152;范围:0.02,1;95%置信区间:0.915,0.996),常规公共卫生资源和0.022 (SD = 0.069;范围:0,0.28;95%置信区间:−0.00118,0.04518)脆弱的以人为本的公共卫生建议。之间的差异对传染病公共卫生建议(中文翻译)的公共可访问性(高:脆弱的以人为本的资源;低:常规资源)是统计学意义( ,对冲的 = 7.367,95% CI: 6.197, 8.536,和cl = 1)。图3是一个直方图显示常规的数量(受限制的可访问性)和脆弱的以人为本(高易访问性)健康建议的碎片散落到每个10%概率本基于GNB输出。百分之一百的脆弱的以人为本的健康建议被分配一个高度健康的资源访问的概率等于或小于50%(特异性= 1);和98.15%的常规公共资源被分配一个概率的公共的建议限制/低可访问性大于50%(敏感性= 98.15%)。大约2%的常规公共卫生资源并被错误地归类为高度访问的信息和建议。

3.2。阈值和积极/消极的似然比(LR +)

虽然它是直观地使用概率阈值(图0.53),这是在现实生活中不是这样的场景,因为有意义的截止的标准取决于所需的一双敏感性和特异性或研究仪器的诊断效用。在我们的研究中,较高的分类器灵敏度高表明精度与常规的公共卫生建议的预测(从参考资料),限制公共可访问性;和较高的分类器特征意味着增加精度与检测脆弱的以人为本的健康建议(来自3个国家卫生当局)是由经验丰富的卫生专业人员设计最大限度地提高语言、认知的可访问性,信息可控诉的情形,和交际的有效性这些紧急的建议在不同的弱势群体有限的教育、健康文学、社会经济能力,和不同的知识/认知功能。

5显示各种概率的碎屑和它们相关的敏感性和特异性对使用我们开发的表现最好的GNB分类器只使用2特性(ALFCW:实词的平均对数频率;尼克-海德菲尔德:代词)。这表明设置否决低于0.1时,灵敏度最高(0.9815)和特异性为0.9118。这意味着,如果这个机器学习系统被用来协助设计和传播公共卫生建议,不到2%的公共卫生建议限制可访问性并被错误地归类为可访问信息,只有不到10%的高度访问的材料将作为无效的公共卫生建议,分类错误是可能增加预算负担雇佣专家来审查卫生资源或扩展向公众发布信息的时间。当阈值从0.1到0.2,增加灵敏度保持不变,和特异性增加。从0.2到0.5,特异性相关(成本)保持不变,但灵敏度已故从0.98到0.96,这表明2%的卫生公共有限的可访问性弱势群体将并被错误地归类为合适的健康咨询和信息。在高风险的情况下,如高度传染性疾病暴发中一些最贫困的社区,这种误判健康建议规划可以是非常昂贵的,脆弱的人将获得更少的有效,访问,和保护健康的建议和信息。

灵敏度继续减少,当阈值高于0.5,尽管特异性达到1。阳性似然比(LR +)(敏感性和虚假的积极性之间的比率)是另一个测量的诊断工具。LR +大于10表明一个非常大的影响后续测试的可能性疾病或在我们的研究缺乏可访问性的公共卫生建议我们的一些最脆弱的社区和人民谁需要访问,最可行的公共卫生建议。表现最好在我们的研究中,使用贝叶斯分类器,最高的LR + 16.685(95%置信区间CI: 4.35、64.04)时达到设定阈值的概率为0.2(敏感性= 0.982,95% CI: 0.95, 1;特异性= 0.941,95% CI: 0.86, 1)。这是最安全的(最高灵敏度)和最具成本效益的(最低预算投资专家聘用)机器learning-assisted预测模型设计的公共卫生建议和信息弱势群体和群体。我们希望这个有前途的结果使用低成本的基于机器学习的发展,相对容易获得自然语言工具将提供更多的支持,以证据为基础,面向用户的决策在包容、访问公共卫生建议在正常和紧急情况下设计和沟通。

4所示。讨论

4.1。回顾性评估可访问性的公共卫生建议在其他语言

我们研究的另一个主要的力量是我们翻译可以健康的最佳实践建议传染病由英语卫生当局在大流行期间为自适应分析仪器(低成本、快速搭建机器学习算法),可用于回顾性评估现有的健康建议在其他语言。这是通过翻译英文材料,我们收集使用向前和向后的中文翻译方法建议世卫组织和全面注释翻译使用中文自然语言处理工具,允许自动工程特征和机器学习分类器的发展。表5和图4说明概率输出如何协助决策者决策和健康/医疗专家在设计为弱势群体和社区公共卫生建议说中文或移民,外国人在中国生活或大中华地区。接下来,我们采用机器学习分类器方便统计工具,可以有效地应用于临床健康/医疗专家和教育工作者来评估是否某些传染病的健康忠告是访问弱势群体(包括中国和移民)有限的教育和健康素养虽然生活在中国或中国地区。我们安装一个二进制逻辑回归模型(LR)与70%的训练数据收集。模型包含两个独立的变量是借用了表现最好的分类器:ALFCW(平均对数频率内容的话)Nh(代词)。拟合模型的回归系数如下所示。

以下是二元回归公式:

然后,我们使用了乙状结肠功能量表评分LR[0,1]的地区:

下面的公式显示了中国卫生建议易访问性评估工具(CHAAAT):

我们检查了CHAAAT公式对剩余的30%的性能测试数据含有34个高度访问COVID-19预防资源翻译从3国家卫生当局在美国,澳大利亚,英国和54常规卫生资源传染病由世卫组织。平均意味着输出(改变评分使用乙状结肠函数)为5.8958 (e-32 SD = 18.128,范围:1.51908,73.5,95%置信区间CI:−0.194, 12)对高访问,脆弱的以人为本的公共卫生建议和资源和88.363 (SD = 2.34,范围:12.119,99.466,95% CI: 83.665, 93.062)的常规公共卫生资源有限的可访问性较低的弱势群体中教育、健康素质有限,有限的汉语水平如外国人移民或认知障碍的患者。

两组之间的差异非常显著的统计学测试数据以CHAAAT公式: ,对冲的 = 7.248,95% CI: 6.094, 8.401, cl = 1。这些效应的大小与那些( ,对冲的 = 7.367,95% CI: 6.197, 8.536,和cl = 1)的概率输出表现最好的一对GNB分类器使用相同的特点:AFLCW和北半球。图5显示常规的数量(受限制的可访问性)和脆弱的以人为本(高易访问性)健康的建议,落入每一个10分本基于转换后的分数计算使用CHAAAT回归公式。百分之九十四的脆弱的以人为本的健康建议被分配一个转变分数高访问卫生资源小于50(特异性= 94.12%)和96.3%的常规公共资源被分配一个指示性的公众的建议限制/低可访问性等于或大于50(敏感性= 96.3%)。

4%左右定期(要求更高的素养)和中国的资源并被错误地归类为高度可访问信息和建议为弱势群体和人民生活在中国地区。自4%仍然可以导致代价高昂的错误高估的可访问性或可用性的公共卫生建议在弱势群体需要高度可访问(简单、可操作的和可实现的)公共卫生信息和建议,与机器学习分类器,我们可以调整CHAAAT公式获得的阈值所需的敏感性和特异性对根据实际需要在诊所。表6表明,表现最好的GNB阈值分类器,设置阈值转换后的分数(公式(5))29.906将允许回归计算器实现相同的敏感性和特异性GNB分类器。根据实际需要可访问的公共卫生建议在不同的情况下,进一步降低阈值将导致评估工具的敏感度增加,这可能需要很复杂,沟通时的健康风险和脆弱性的目标人群高。

population-oriented公共卫生建议的设计和评估高风险活动,需要高度精确,可靠的研究工具来支持通知,以证据为基础的公共卫生政策规划和交付。我们的研究表明,宝贵的经验在设计的公共意见引发的冠状病毒大流行可以转换成有用的,急需的研究工具和工具来支持公共卫生建议的设计对于任何未来卫生事件或危机。此外,我们开发评估工具适应国际基准测试和支持其他语言促进全球公共卫生政策规划在访问健康风险沟通和公众参与。我们研究的限制是,我们中国作为一个说明的例子是一个截然不同的语言从英语。然而,潜在的技术和方法,我们讨论和演示了可以方便地修改为其他语言或书写系统,特别是underresourced语言如非洲语言和少数民族语言,当我们开发高性能机器学习贝叶斯分类器基于小数据集。文盲人口,我们的评估方法需要进一步适应口腔公共意见和信息。

数据可用性

的数据支持本研究的发现可以要求从相应的作者。

的利益冲突

作者宣称没有利益冲突。