3所示。吉布斯采样器与PWM作为一个关键组件
在PWM技术来描述一组确定主题,吉布斯采样器(
61年),命名的数学物理学家j·w·吉布斯<我talic>
新创我talic>主题的发现。例如,给定一组酵母的内含子序列,网站和分歧点在哪里什么?所有信息我们已经是每个基因内区应该有一个分歧点的网站,但它有什么顺序签名,它位于内含子序列在哪里?这个场景(图
1)就是吉布斯采样器会发光。
类似的场景涉及监管严重性的发现图案coexpressed基因(即给定一组。同步,增加或减少基因的转录水平随着时间的推移)微阵列(
62年,
63年],圣人[
64年,
65年),或深度排序
66年- - - - - -
68年)实验。如果也coregulated coexpressed基因,那么他们可能有着某些未知的转录因子结合位点控制的相同或相似的转录因子。考虑到结合位点通常是位于上游的翻译起始密码子,你可能会从这些coexpressed上游序列中提取基因,让吉布斯采样器找到候选人管理主题。最近的一项研究表明,共享主题也可能出现在翻译起始的信使rna 5′UTR调节(
69年]。
吉布斯采样器是一种依赖重复随机抽样的蒙特卡罗算法来估计所需的参数。蒙特卡罗方法是由著名的数学家Stanislaw乌兰,设想成功组装后在1945年第一台电子计算机ENIAC,和进一步开发的物理学家和数学家致力于核武器项目洛斯阿拉莫斯国家实验室在1940年代中期
70年]。“蒙特卡罗方法”一词是由尼古拉斯大都市指定这类计算算法。虽然方法的通用应用程序毫无疑问是ENIAC的操作在1945年,物理学家恩里科·费米是已知独立开发和应用方法与机械计算器(近15年前
70年]。
吉布斯采样器简化了计算参数估计时获得解析解非常困难或者不可能的。在生物学上,它已经被用于识别蛋白质的功能主题(
31日,
71年,
72年)、生物图像处理(
73年,两两序列比对
74年),和多序列比对(
75年,
76年]。然而,最常见的生物应用吉布斯采样器仍在监管的基因序列的识别
30.,
77年- - - - - -
84年]。
有两种稍微不同的吉布斯采样器在主题预测中的应用。第一个假设每个序列包含一个主题(
30.)和相关的算法称为现场取样器。第二个是更加灵活,允许每个序列没有或多个主题(
71年),该算法称为主题取样器。我们将说明现场取样器取样器,然后简要讨论的主题。
我数值说明主题发现吉布斯采样器算法。吉布斯采样器的主要输出通常三部分组成。第一个是共享的主题在一个对齐的格式(底部面板图
1)。第二个主题是PWM总结发现,第三个包含相关意义测试将在后面一节中了。派生的PWM,就像任何其他PWM,可以用来扫描序列不输入数据中发现的存在主题呈现。
3.1。吉布斯采样器的计算细节
我们将使用红色的核苷酸序列(
85年),图中列出
2,说明了吉布斯采样器算法。我们的主要目标是推断未知的图案的位置和序列之间共享序列,这样我们可以使图案,底部面板的图所示
1。一致的主题将使我们能够生成一个PWM,特征位点核苷酸频率分布的主题。PWM可以用来扫描确定主题的存在,在其他序列。
我们需要首先计算核苷酸,数字指定为<我nline-formula>
F米米l:mi>
一个米米l:mtext>
,<我nline-formula>
F米米l:mi>
C米米l:mtext>
,<我nline-formula>
F米米l:mi>
G米米l:mtext>
,<我nline-formula>
F米米l:mi>
T米米l:mtext>
分别在序列。的总数核苷酸序列(图29
2)是1209年<我nline-formula>
F米米l:mi>
一个米米l:mtext>
,<我nline-formula>
F米米l:mi>
C米米l:mtext>
,<我nline-formula>
F米米l:mi>
G米米l:mtext>
,<我nline-formula>
F米米l:mi>
T米米l:mtext>
等于325,316、267和301年,分别。这些值需要指定pseudocounts(我们在前一节中遇到PWM)。
让<我nline-formula>
N米米l:mi>
被指定为输入序列的数量<我nline-formula>
年代米米l:mi>
1米米l:mn>
,米米l:mo>
年代米米l:mi>
2米米l:mn>
,米米l:mo>
…米米l:mo>
,米米l:mo>
年代米米l:mi>
我米米l:mi>
,米米l:mo>
…米米l:mo>
,米米l:mo>
年代米米l:mi>
N米米l:mi>
。让<我nline-formula>
l米米l:mi>
我米米l:mi>
的长度<我nline-formula>
年代米米l:mi>
我米米l:mi>
,<我nline-formula>
米米米l:mi>
主题的长度,长度通常是4 - 8。对于我们的例子,我们将使用<我nline-formula>
米米米l:mi>
=米米l:mo>
6米米l:mn>
。一个通常会跑几次吉布斯采样器不同<我nline-formula>
米米米l:mi>
如果一个值对图案的长度都所知甚少。PWM的维度<我nline-formula>
4米米l:mn>
×米米l:mo>
米米米l:mi>
核苷酸序列,<我nline-formula>
20.米米l:mn>
×米米l:mo>
米米米l:mi>
对氨基酸序列。让<我nline-formula>
一个米米l:mtext>
我米米l:mi>
是未知的主题的起始位置<我nline-formula>
年代米米l:mi>
我米米l:mi>
。
吉布斯采样器的主要算法的两个步骤。第一个是随机初始化一组随机的<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值被分配和网站核苷酸频率计算。第二步是预测更新,直到当地的解决方案<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,结合位点核苷酸频率可以制成一个PWM。这是重复多次,以前存储的局部最优方案取而代之的是更好的。收敛通常宣称当两个或更多当地的解决方案都是相同的。数值在以下几节描述这些步骤。
3.2。初始化
随机分配一个值的起始步骤<我nline-formula>
一个米米l:mtext>
我米米l:mi>
的约束<我nline-formula>
1米米l:mn>
≤米米l:mo>
一个米米l:mtext>
我米米l:mi>
≤米米l:mo>
l米米l:mi>
我米米l:mi>
- - - - - -米米l:mo>
米米米l:mi>
+米米l:mo>
1米米l:mn>
。所以我们的第一套<我nline-formula>
N米米l:mi>
“主题”本质上是一组随机的序列长度m和预计不会有任何模式。为读者好奇,第一组29随机<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值恰好是:29日31日,23日,28日,10日,2,18岁,32岁,20日,15日,11日,25日,24日,30日,18日,15日,10日,23日,14日,15日,26日,36岁,8日,6日,30日,19日,27日,26日和14。从29个核苷酸随机图案的特定站点分布如表所示
2。几乎没有任何特定模式,因为人会预期。
第二列在表
2将被称为C0向量<我nline-formula>
C米米l:mtext>
0米米l:mn>
一个米米l:mtext>
,<我nline-formula>
C米米l:mtext>
0米米l:mn>
C米米l:mtext>
,<我nline-formula>
C米米l:mtext>
0米米l:mn>
G米米l:mtext>
,<我nline-formula>
C米米l:mtext>
0米米l:mn>
T米米l:mtext>
等于278,279、230和248年,分别。的<我nline-formula>
4米米l:mn>
×米米l:mo>
6米米l:mn>
矩阵,占领过去六列在表
2将被称为<我nline-formula>
C米米l:mtext>
矩阵。的<我nline-formula>
C米米l:mtext>
从29日随机矩阵表主题而C0向量与核苷酸以外的主题列表。因此,第一,第二,第三,第四排表
2应该等于<我nline-formula>
F米米l:mi>
一个米米l:mtext>
,<我nline-formula>
F米米l:mi>
C米米l:mtext>
,<我nline-formula>
F米米l:mi>
G米米l:mtext>
,<我nline-formula>
F米米l:mi>
T米米l:mtext>
,分别。还要注意,每个六列的<我nline-formula>
C米米l:mtext>
矩阵应该29。
3.3。预测更新
预测更新包括获得<我nline-formula>
N米米l:mi>
(= 29日在我们的示例中)随机数字从1到<我nline-formula>
N米米l:mi>
和使用这些数字索引选择序列顺序更新站点特定的核苷酸(分布<我nline-formula>
C米米l:mtext>
相关矩阵)和频率(C0向量)。例如,<我nline-formula>
N米米l:mi>
随机数在我首次运行的吉布斯采样器是11日,18日,26日,22日,2,28日,12日,9日,7日,3日,17日,16日,1,4,21日,15日,14日,24日,19日,27日,29日,6,10,20,13日,23日,25日,分别和5。这意味着<我nline-formula>
年代米米l:mi>
11米米l:mn>
首先将使用,<我nline-formula>
年代米米l:mi>
5米米l:mn>
最后,第一个周期的预测更新。重要的是使用一系列随机的数字,而不是选择序列根据输入的顺序。后者提高了捕获吉布斯采样器在一个局部最优的可能性。
我们的第一个随机选择的序列<我nline-formula>
年代米米l:mi>
11米米l:mn>
和随机选择的主题从网站11日开始,<我nline-formula>
一个米米l:mtext>
11米米l:mn>
=米米l:mo>
11米米l:mn>
,主题是AGTGTG。这个最初的主题将会离开<我nline-formula>
C米米l:mtext>
矩阵和投入C0向量。这个主题有一个0 C, 3 G的,两个U。通过将这些值添加到C0矢量表
2,我们获得了C0矢量表
3。我们还需要把这个主题的<我nline-formula>
C米米l:mtext>
矩阵减去第一个从第一列中的第一个值<我nline-formula>
C米米l:mtext>
矩阵表
2(即。、新<我nline-formula>
C米米l:mtext>
一个米米l:mtext>
,米米l:mo>
1米米l:mn>
=老<我nline-formula>
C米米l:mtext>
一个米米l:mtext>
,米米l:mo>
1米米l:mn>
- - - - - -米米l:mo>
1米米l:mn>
),第二个G从第三第二列的值<我nline-formula>
C米米l:mtext>
矩阵表
2(即。、新<我nline-formula>
C米米l:mtext>
G米米l:mtext>
,米米l:mo>
2米米l:mn>
=老<我nline-formula>
C米米l:mtext>
G米米l:mtext>
,米米l:mo>
2米米l:mn>
- - - - - -米米l:mo>
1米米l:mn>
),等等。这个转换<我nline-formula>
C米米l:mtext>
矩阵表
2C矩阵表
3。
在这一点上,<我nline-formula>
C米米l:mtext>
矩阵是由28个随机选择的主题,分别来自序列(不包括<我nline-formula>
年代米米l:mi>
11米米l:mn>
)。你会发现每六列的<我nline-formula>
C米米l:mtext>
矩阵有一笔28。在最初的主题的原因<我nline-formula>
年代米米l:mi>
11米米l:mn>
出了<我nline-formula>
C米米l:mtext>
矩阵和把它回C0向量,我们会找到一个更好的主题<我nline-formula>
年代米米l:mi>
11米米l:mn>
,把它放到<我nline-formula>
C米米l:mtext>
矩阵,<我nline-formula>
C米米l:mtext>
矩阵将再次基于29图案。我们如何得到更好的主题?回想一下,一个位置权重矩阵(PWM)可以用来扫描序列的滑动窗口长度m得分位置权重矩阵(PWMSs)为每个窗口。我们将做一个PWM C0的矢量和<我nline-formula>
C米米l:mtext>
矩阵和使用产生PWM扫描<我nline-formula>
年代米米l:mi>
11米米l:mn>
并得到一个新的主题,pwm最高。
你可能想知道为什么这种做法会让我们考虑到任何地方<我nline-formula>
C米米l:mtext>
矩阵是最初的随机图案。由此产生的PWM不会展览模式,因此结果PWMSs将不提供信息的。这里的关键概念是,当一个人需要一个随机游走在地形与多个山峰,迟早会遇到一个峰值,攀登高峰至少会给我们当地最大。在达到的峰值和记录的高度,我们将在另一个随机选择的位置和当地的山峰开始爬山了。这一过程持续进行直到我们到达最高峰或固定数量的计算机迭代后没有发现任何更高的峰值。
通常,使用C0 PWM生成向量作为背景的频率(<我nline-formula>
p米米l:mi>
我米米l:mi>
)和<我nline-formula>
C米米l:mtext>
矩阵特有的频率<我nline-formula>
p米米l:mi>
我米米l:mi>
j米米l:mi>
。然而,尽管大多数算法的吉布斯采样器计算<我nline-formula>
p米米l:mi>
我米米l:mi>
这种方式(例如,
32,页133 - 147)),<我nline-formula>
p米米l:mi>
我米米l:mi>
计算从C0向量有严重的问题,当输入序列是一样短的主题。例如,如果真正的主题有许多核苷酸和几个核苷酸U,然后C0向量也将有很多,现在很少有美国主题和一些核苷酸U将被视为偏差很大的背景,会有很高的pwm,导致偏差估计的真正的主题。因此,当输入序列短,每个人都应该指定背景频率而不是使用C0来计算<我nline-formula>
p米米l:mi>
我米米l:mi>
。可以参考前面的部分频率PWM有关背景的更多信息。
对于pseudocounts,我们可能使用<我nline-formula>
α米米l:mi>
=米米l:mo>
0.0001米米l:mn>
。由此产生的PWM用于扫描<我nline-formula>
年代米米l:mi>
11米米l:mn>
长40基地,35吗<我nline-formula>
(米米l:mo>
=米米l:mo>
40米米l:mn>
- - - - - -米米l:mo>
米米米l:mi>
+米米l:mo>
1米米l:mn>
)米米l:mo>
可能的起始点(即主题。,可能<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值的序列)。35这些pwm值35可能的主题<我nline-formula>
年代米米l:mi>
11米米l:mn>
(表
4)规范化有一笔1 (<我nline-formula>
P米米l:mi>
规范米米l:mtext>
在表
4)。我们现在继续更新初始<我nline-formula>
一个米米l:mtext>
11米米l:mn>
(<我nline-formula>
=米米l:mo>
11米米l:mn>
),一个新的<我nline-formula>
一个米米l:mtext>
11米米l:mn>
基于结果的表的价值
4。我们应该如何选择新的<我nline-formula>
一个米米l:mtext>
11米米l:mn>
价值吗?
有两种策略选择<我nline-formula>
一个米米l:mtext>
11米米l:mn>
价值。第一个是随机挑选一个<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值的大小<我nline-formula>
P米米l:mi>
规范米米l:mtext>
(表
4)。你可能想象的圆靶与35片各自领域成正比<我nline-formula>
P米米l:mi>
规范米米l:mtext>
值。当你扔飞镖的圆靶,大型片将有一个更好的机会比小片。如果dart土地7片,然后初始<我nline-formula>
一个米米l:mtext>
11米米l:mn>
=米米l:mo>
11米米l:mn>
将会更新<我nline-formula>
一个米米l:mtext>
11米米l:mn>
=米米l:mo>
7米米l:mn>
与原来的主题,AGTGTG被新的主题CTCAAG所取代。
第二种策略是使用最大<我nline-formula>
P米米l:mi>
规范米米l:mtext>
更新初始值<我nline-formula>
一个米米l:mtext>
11米米l:mn>
到新<我nline-formula>
一个米米l:mtext>
11米米l:mn>
价值。网站的主题从25个最大的<我nline-formula>
P米米l:mi>
规范米米l:mtext>
,我们将设置新的<我nline-formula>
一个米米l:mtext>
11米米l:mn>
等于25和替换最初的主题(= AGTGTG)的新主题(= TCACAG)。通过这种方法,我们不需要<我nline-formula>
P米米l:mi>
规范我们可以选择<我nline-formula>
一个米米l:mtext>
11米米l:mn>
基于最大的优势比表
4。这种策略比第一次快,但似乎并没有失去任何敏感主题的发现基于有限的模拟研究。然而,如果一个是担心失踪的图案的可能性,第一应该使用策略。
不管如何<我nline-formula>
一个米米l:mtext>
11米米l:mn>
选择,更新是相同的。假设我们有了第二个策略并设置新的<我nline-formula>
一个米米l:mtext>
11米米l:mn>
等于25。的<我nline-formula>
C米米l:mtext>
矩阵表
2然后修改替换原有的<我nline-formula>
一个米米l:mtext>
11米米l:mn>
主题(= AGTGTG)的新主题(= TCACAG)。这导致一个C0向量和更新<我nline-formula>
C米米l:mtext>
矩阵(表
5)。
我们重复这个过程的序列来更新的<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值。最后一个序列已经更新后,我们得到一套新的<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,一套新的29图案,加上PWM基于相关的C0向量矩阵和C。在这一点上我们计算加权比对的得分(即。加权pwm)如下:
(8)米米l:mtext>
F米米l:mi>
=米米l:mo>
∑米米l:mo>
我米米l:mi>
=米米l:mo>
1米米l:mn>
N米米l:mi>
代码米米l:mtext>
∑米米l:mo>
j米米l:mi>
=米米l:mo>
1米米l:mn>
米米米l:mi>
C米米l:mi>
我米米l:mi>
,米米l:mo>
j米米l:mi>
PW米米l:mtext>
米米米l:mtext>
我米米l:mi>
j米米l:mi>
,米米l:mo>
在哪里<我nline-formula>
米米米l:mi>
是主题宽度,<我nline-formula>
N米米l:mi>
代码米米l:mtext>
不同的符号序列的数量(4核苷酸和氨基酸序列的20)。<我nline-formula>
F米米l:mi>
是衡量质量的排列的图案。越大<我nline-formula>
F米米l:mi>
价值,越好。
的<我nline-formula>
F米米l:mi>
中定义的值,如(
8),有许多不同的名字。它被称为Kullback-Leibler信息或Kullback-Leibler分歧在信息理论
86年- - - - - -
88年),或较大的速度函数在统计估计
89年]。在生物信息学,尤其是主题描述和预测涉及PWM,它通常被称为信息内容(
6]。事实上,Kullback-Leibler信息是所谓的一个特例<我nline-formula>
f米米l:mi>
散度测量两个概率分布之间的差异<我nline-formula>
P米米l:mi>
和<我nline-formula>
问米米l:mi>
导致自然的信<我nline-formula>
F米米l:mi>
在(
8)。
预测更新一次又一次地重复。每一次当我们得到一套新的<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,一套新的主题和基于C0向量和PWM<我nline-formula>
C米米l:mtext>
矩阵,我们计算一个新的<我nline-formula>
F米米l:mi>
价值。如果新<我nline-formula>
F米米l:mi>
值大于先前存储的<我nline-formula>
F米米l:mi>
值,那么新<我nline-formula>
F米米l:mi>
价值,新的设置<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,新的主题将取代先前存储的。这个过程一直持续到我们到达当地最大的<我nline-formula>
F米米l:mi>
或者当当地循环的预设最大数量。由此产生的<我nline-formula>
F米米l:mi>
价值,的集合<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,新的主题和相关的PWM被存储为局部最优的输出。在爬山的类比,<我nline-formula>
F米米l:mi>
代表当地的峰值的高度。
现在是重复整个过程从一开始,也就是说,我们再次执行初始化,选择另一个随机的一组<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,经过当地迭代获得另一个局部最优输出。如果新的局部最优输出比以前存储的(即好。,新<我nline-formula>
F米米l:mi>
值大于先前存储的一个),新的输出将取代先前存储的输出。这个过程被重复多次,直到达到收敛,当新的<我nline-formula>
F米米l:mi>
值始终与以前相同存储,或者直到固定数量的计算迭代一直没有找到一个<我nline-formula>
F米米l:mi>
价值比已经记录下来。最后的位点核苷酸分布(表
6)显示一个更强大的比初始分布(表模式
2)来自29个随机选择的主题。
最后一致的图案(图7 - 2 (
32])分享(C / T)的一般共识TATC (a / T)。它的反补(A / T)叫(A / G)是已知GATA-binding转录因子的结合位点
90年- - - - - -
95年]。这一发现的图案表明这组序列可能确实是coregulated GATA-binding相同类型的转录因子。这些发现是至关重要的转录组和蛋白质组学研究旨在了解基因调控网络。吉布斯采样器等算法帮助我们理解基因和基因产物之间的交互。
这里可能是相关总结的基本生物学和GATA-binding转录因子GATA框。活细胞是一个系统与许多基因开关,可以打开或关闭细胞内和细胞外环境。这些开关是区分正常的活细胞和癌细胞或死细胞。叫图案(或叫盒)是一个这样的开关和它是由特定的转录因子的开启或关闭(蛋白质绑定到主题,打开或关闭基因的转录包含这样的主题)。更好的知道GATA-binding转录因子是GATA-1结合GATA主题发现在绝大多数erythroid-expressed cis-elements基因所有脊椎动物的检查(
96年,
97年]。的核心启动子大鼠血小板因子4 (PF4)基因包含这样一个叫主题和绑定GATA-binding GATA图案的蛋白质如GATA-1抑制PF4基因的转录
91年]。现在知道叫监管图案和GATA-binding转录因子存在于各种生物体从细胞黏菌脊椎动物,包括植物、真菌、线虫、昆虫,和棘皮动物
98年),这表明基因开关的功能是远远超出红细胞生成。在人类,叫GATA-binding主题和蛋白质是涉及到几种疾病(
99年]。叫图案及其结合蛋白的序列差异应该阐明组件的共同进化的基因开关。
可能会注意到一些序列有强烈(C / T) TATC (a / T)的主题,而另一些(例如,第二,第四和第五序列)只有微弱的和高度可疑信号。计算机程序实现吉布斯采样器通常将输出信号的强度的定量测量,和pwm是最常用的指数为此(表
7)。pwm是log-odds召回,但一个可以直接使用优势比作为衡量相对主题的力量。还记得,一个优势比的比例是两个概率相关的两个假设。定义<我nline-formula>
θ米米l:mi>
是的米米l:mtext>
个六的假说是一个主题的特定场地的限制,和<我nline-formula>
θ米米l:mi>
没有米米l:mtext>
假设个六的不是一个主题,有其指定的概率只有四个整体核苷酸频率。的优势比的比值的概率<我nline-formula>
θ米米l:mi>
是的米米l:mtext>
是真实的概率<我nline-formula>
θ米米l:mi>
没有米米l:mtext>
是真的。一个一般应该截止值为20,也就是说,<我nline-formula>
θ米米l:mi>
是的米米l:mtext>
是20倍吗<我nline-formula>
θ米米l:mi>
没有米米l:mtext>
。
每个人都应该注意,吉布斯采样器,从一组随机的<我nline-formula>
一个米米l:mtext>
我米米l:mi>
值,不一定收敛于相同的主题。这是该算法的优势和劣势。算法的优点是重复运行将使我们能够确定其他类型的隐藏的图案(即。,除了叫反补的主题)序列。缺点是用户不熟悉算法常常感到困惑时相同的输入产生完全不同的结果。例如,另一组假定的图案,RGVAGR的形式(R是一个“T”或G和V),被发现在共享序列(
32,p . 146]。
可能的输入序列可能包含两个或两个以上的不同生物重要的主题。如果一个主题是更强的优等生中输入序列)(比其他的图案,如果吉布斯采样器的搜索算法之前详尽的概述,然后我们将总是得到最强大的主题和所有其他小姐生物有趣的图案。然而,一个可以运行吉布斯采样器的具体排除最强的主题已经确定,这样较弱的主题可以被识别。
3.4。主题式取样器
吉布斯采样器有两个版本。我们刚刚叫现场取样器。它假设每个序列只包含一个主题(
30.]。另一个版本更灵活,允许每个序列没有或多个主题(
71年),该算法称为主题取样器。GATA-binding转录因子组成蛋白质家族成员包含一个或两个高度保守的锌指dna结合域(
98年),因此可能是一个序列可能包含不止一个叫盒子。例如,红色的Kruppel-like因子(EKLF,所需的锌指转录因子<我nline-formula>
β米米l:mi>
球蛋白基因表达)的5′地区两个叫图案在E箱侧面图案特点是CANNTG [
One hundred.]。这需要一个算法,能够识别多个主题在一个序列。
这个网站可以扩展到主题取样器取样器后处理。PWM生成的站点取样器可用于re-scan图案的序列,计算相关的脉宽调制或每个序列中所有6-mers比值比。所有我们需要的是有一个截止分数保持这些图案与pwm或优势比大于截止得分。