SCIENTIFICA Scientifica 2090 - 908 x Hindawi出版公司 917540年 10.6064 / 2012/917540 917540年 评论文章 位置权重矩阵、吉布斯采样器和相关的测试主题意义表征和预测 Xuhua Bottomley 斯蒂芬。 卡斯特罗 何塞。 1 生物学系 渥太华大学,30居里夫人,渥太华 加拿大 K1N 6它们 uottawa.ca 2012年 20. 11 2012年 2012年 22 08年 2012年 11 10 2012年 2012年 版权©2012 Xuhua夏。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

位置权重矩阵(PWM)不仅是一个最广泛使用的生物信息学方法,但也更先进的计算算法的一个关键组件(例如,吉布斯采样器)的描述和发现图案核苷酸或氨基酸序列。然而,一些普遍适用的统计测试可用于评估网站的意义模式,脉宽调制、脉宽调制(PWM)得分假定的图案。PWM输出的统计显著性测试,即定位频率PWM本身,和PWM,不同来源的,从未被收集在一个纸,结果,许多PWM的实现不包括任何显著性检验。我回顾PWM-based方法用于主题描述和预测(包括吉布斯采样器的详细说明<我talic> 新创主题发现),目前的统计和概率统计学意义背后的基本原理测试相关的脉宽调制,并举例说明其应用与实际数据。多重比较的问题与特定站点的测试频率最好是由错误发现率的方法。PWM的考验,由于pseudocounts的使用,最好是通过重采样方法。个别pwm每个序列段的测试应该基于极值分布。 1。介绍</gydF4y2Batitle> <p>大多数基因开关序列图案的形式相互作用蛋白(<xgydF4y2Baref ref-type="bibr" rid="B1"> 1</xgydF4y2Baref>]。位置权重矩阵或脉宽调制(<xgydF4y2Baref ref-type="bibr" rid="B2"> 2</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B6"> 6</xgydF4y2Baref>)是一个关键的生物信息学工具广泛用于描述和预测主题核苷酸和氨基酸序列。PWM的普及进一步增加实现作为一个组件在PSI-BLAST以来<xgydF4y2Baref ref-type="bibr" rid="B7"> 7</xgydF4y2Baref>],它经常被用于生成PWM主题表征和预测(<xgydF4y2Baref ref-type="bibr" rid="B8"> 8</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B11"> 11</xgydF4y2Baref>]。</pgydF4y2Ba> <p>PWM已经广泛应用在基因组中的基因工程的研究元素如翻译起始位点(<xgydF4y2Baref ref-type="bibr" rid="B12"> 12</xgydF4y2Baref>],转录起始站点[<xgydF4y2Baref ref-type="bibr" rid="B13"> 13</xgydF4y2Baref>),转录因子结合位点(<xgydF4y2Baref ref-type="bibr" rid="B14"> 14</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B22"> 22</xgydF4y2Baref>),酵母基因内区拼接网站(<xgydF4y2Baref ref-type="bibr" rid="B23"> 23</xgydF4y2Baref>),全基因组转录单位的识别(<xgydF4y2Baref ref-type="bibr" rid="B24"> 24</xgydF4y2Baref>],全基因组筛查的转录调控元件(<xgydF4y2Baref ref-type="bibr" rid="B25"> 25</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B26"> 26</xgydF4y2Baref>]。PWM分数(PWMSs)对个人图案被发现是有用的作为一个衡量的图案的力量,例如,PWM个人拼接网站被用作代理拼接效率在真核生物<xgydF4y2Baref ref-type="bibr" rid="B27"> 27</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B28"> 28</xgydF4y2Baref>]。</pgydF4y2Ba> <p>PWM已经不仅是一个独立的工具用于总结和预测序列,而且作为一个关键的组件在更高级的生物信息学算法如variable-order贝叶斯网络(<xgydF4y2Baref ref-type="bibr" rid="B29"> 29日</xgydF4y2Baref>),吉布斯采样器(<xgydF4y2Baref ref-type="bibr" rid="B30"> 30.</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B32"> 32</xgydF4y2Baref>,页113 - 147)和相关算法基于蒙特卡罗方法(<xgydF4y2Baref ref-type="bibr" rid="B33"> 33</xgydF4y2Baref>],MEME [<xgydF4y2Baref ref-type="bibr" rid="B34"> 34</xgydF4y2Baref>),和支持向量机(<xgydF4y2Baref ref-type="bibr" rid="B35"> 35</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B39"> 39</xgydF4y2Baref>]。尽管PWM主要是用来描述和预测主题在核苷酸序列,最近的研究已经证明了其潜在的描述和预测功能的蛋白质主题(<xgydF4y2Baref ref-type="bibr" rid="B40"> 40</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B42"> 42</xgydF4y2Baref>),信号肽(<xgydF4y2Baref ref-type="bibr" rid="B43"> 43</xgydF4y2Baref>),和protein-protein-binding网站(<xgydF4y2Baref ref-type="bibr" rid="B44"> 44</xgydF4y2Baref>]。特别是,该方法成功地预测了酪氨酸硫酸盐化作用网站(<xgydF4y2Baref ref-type="bibr" rid="B45"> 45</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B48"> 48</xgydF4y2Baref>]。</pgydF4y2Ba> <p>PWM-based序列分析包括三种类型的输出:站点特定的频率分布,PWM本身,和PWM输入序列(和可选扫描新序列训练产生的PWM脉宽调制)。这里我简要回顾PWM方法的上下文中主题发现,紧随其后的是一个详细的说明PWM的吉布斯采样器是一个关键的组件,然后提出统计显著性测试适合每个三种类型的PWM输出。</pgydF4y2Ba> </sec> <sec id="sec2"> <title>2。PWM的上下文中主题发现方法</gydF4y2Batitle> <p>最简单的输入PWM-based方法由一组一致的序列和背景的规范(前)的频率。的主要输出PWM,除了PWM本身,包括定位信息内容和主题信息内容(<xgydF4y2Baref ref-type="bibr" rid="B6"> 6</xgydF4y2Baref>)为个人图案以及pwm,连同相关的统计测试。</pgydF4y2Ba> <p>我们首先说明了PWM方法运用到246捐赠者拼接网站的酵母基因内区由5核苷酸网站外显子一边和12核苷酸基因内区一侧(表的网站<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>)。左边的四列的表<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>由A、C、G和U的核苷酸位点数量,C、G,和美国当所有特定站点数量大于零,PWM,每个元素指定<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M1"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M2"> <mml:mi> 我</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 1</米米l:mn> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> <mml:mn> 2</米米l:mn> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> <mml:mn> 3</米米l:mn> </mml:math> </inline-formula>和4对应A、C、G和U,分别<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M3"> <mml:mrow> <mml:mi> j</米米l:mi> </mml:mrow> </mml:math> </inline-formula>网站索引),计算<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M4"> <mml:mtable> <mml:mlabeledtr id="EEq1"> <mml:mtd> <mml:mtext> (1)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mtext> 罗</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> g</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M5"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>核苷酸的背景频率吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M6"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M7"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>核苷酸位点核苷酸频率吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M8"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>在网站<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M9"> <mml:mrow> <mml:mi> j</米米l:mi> </mml:mrow> </mml:math> </inline-formula>(例如,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M10"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 83年</米米l:mn> <mml:mo> /</米米l:mo> <mml:mn> 246年</米米l:mn> </mml:math> </inline-formula>在表<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>)。策划这些特定站点<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M11"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值图形在网站收益率序列标识(<xgydF4y2Baref ref-type="bibr" rid="B49"> 49</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B50"> 50</xgydF4y2Baref>]。的脉宽调制(PWM)得分计算一个特定的主题<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M12"> <mml:mtable> <mml:mlabeledtr id="EEq2"> <mml:mtd> <mml:mtext> (2)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mtext> 脉宽调制</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mrow> <mml:munderover> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> j</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> </mml:munderover> <mml:mrow> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> ,</米米l:mo> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M13"> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> </mml:math> </inline-formula>是主题的长度等于17对于我们的示例见表<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>。</pgydF4y2Ba> <table-wrap id="tab1"> <label>表1</gydF4y2Balabel> <p>特定频率和位置权重矩阵(PWM) 246年捐赠拼接网站(每个由5网站外显子一边和12基因内区一侧)。的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M14"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> χ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>测试执行每个站点在预期的背景下频率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M15"> <mml:mtext> 一个</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn> 0.3279</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M16"> <mml:mtext> C</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn> 0.1915</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M17"> <mml:mtext> G</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 0.2043</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M18"> <mml:mtext> U</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 0.2763</米米l:mn> </mml:math> </inline-formula>。网站已经被证实是重要的是粗体。</pgydF4y2Ba> <table> <thead> <tr> <th align="left">网站</thgydF4y2Ba> <th align="center">一个</thgydF4y2Ba> <th align="center">C</thgydF4y2Ba> <th align="center">G</thgydF4y2Ba> <th align="center">U</thgydF4y2Ba> <th align="center"> <italic> χ</我talic><sup>2</gydF4y2Basup></th> <th align="center">P</thgydF4y2Ba> <th align="center">一个</thgydF4y2Ba> <th align="center">C</thgydF4y2Ba> <th align="center">G</thgydF4y2Ba> <th align="center">U</thgydF4y2Ba> </tr> </thead> <tbody> <tr> <td align="left">1</gydF4y2Batd> <td align="center">83年</gydF4y2Batd> <td align="center">30.</gydF4y2Batd> <td align="center">49</gydF4y2Batd> <td align="center">84年</gydF4y2Batd> <td align="center">10.10</gydF4y2Batd> <td align="center">0.0177</gydF4y2Batd> <td align="center">0.0525</gydF4y2Batd> <td align="center">−0.6332</gydF4y2Batd> <td align="center">−0.0260</gydF4y2Batd> <td align="center">0.3143</gydF4y2Batd> </tr> <tr> <td align="left">2</gydF4y2Batd> <td align="center">103年</gydF4y2Batd> <td align="center">44</gydF4y2Batd> <td align="center">46</gydF4y2Batd> <td align="center">53</gydF4y2Batd> <td align="center">10.04</gydF4y2Batd> <td align="center">0.0182</gydF4y2Batd> <td align="center">0.3613</gydF4y2Batd> <td align="center">−0.0878</gydF4y2Batd> <td align="center">−0.1162</gydF4y2Batd> <td align="center">−0.3434</gydF4y2Batd> </tr> <tr> <td align="left">3</gydF4y2Batd> <td align="center">121年</gydF4y2Batd> <td align="center">36</gydF4y2Batd> <td align="center">38</gydF4y2Batd> <td align="center">51</gydF4y2Batd> <td align="center">30.01</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">0.5920</gydF4y2Batd> <td align="center">−0.3739</gydF4y2Batd> <td align="center">−0.3886</gydF4y2Batd> <td align="center">−0.3981</gydF4y2Batd> </tr> <tr> <td align="left">4</gydF4y2Batd> <td align="center">122年</gydF4y2Batd> <td align="center">38</gydF4y2Batd> <td align="center">33</gydF4y2Batd> <td align="center">53</gydF4y2Batd> <td align="center">32.16</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">0.6038</gydF4y2Batd> <td align="center">−0.2969</gydF4y2Batd> <td align="center">−0.5893</gydF4y2Batd> <td align="center">−0.3434</gydF4y2Batd> </tr> <tr> <td align="left">5</gydF4y2Batd> <td align="center">81年</gydF4y2Batd> <td align="center">40</gydF4y2Batd> <td align="center">81年</gydF4y2Batd> <td align="center">44</gydF4y2Batd> <td align="center">28.33</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">0.0177</gydF4y2Batd> <td align="center">−0.2238</gydF4y2Batd> <td align="center">0.6933</gydF4y2Batd> <td align="center">−0.6081</gydF4y2Batd> </tr> <tr> <td align="left">6</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">245年</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">948.34</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">−6.6464</gydF4y2Batd> <td align="center">−5.0056</gydF4y2Batd> <td align="center"> <bold> 2.2841</gydF4y2Babold></td> <td align="center">−6.6469</gydF4y2Batd> </tr> <tr> <td align="left">7</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">237年</gydF4y2Batd> <td align="center">582.23</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">−6.6464</gydF4y2Batd> <td align="center">−2.3190</gydF4y2Batd> <td align="center">−6.6480</gydF4y2Batd> <td align="center"> <bold> 1.8032</gydF4y2Babold></td> </tr> <tr> <td align="left">8</gydF4y2Batd> <td align="center">239年</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">462.46</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center"> <bold> 1.5693</gydF4y2Babold></td> <td align="center">−5.0056</gydF4y2Batd> <td align="center">−4.3320</gydF4y2Batd> <td align="center">−3.8633</gydF4y2Batd> </tr> <tr> <td align="left">9</gydF4y2Batd> <td align="center">16</gydF4y2Batd> <td align="center">24</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">205年</gydF4y2Batd> <td align="center">387.81</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">−2.2655</gydF4y2Batd> <td align="center">−0.9496</gydF4y2Batd> <td align="center">−5.0680</gydF4y2Batd> <td align="center"> <bold> 1.5946</gydF4y2Babold></td> </tr> <tr> <td align="left">10</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">243年</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">928.96</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">−4.8476</gydF4y2Batd> <td align="center">−6.6483</gydF4y2Batd> <td align="center"> <bold> 2.2723</gydF4y2Babold></td> <td align="center">−5.3416</gydF4y2Batd> </tr> <tr> <td align="left">11</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">228年</gydF4y2Batd> <td align="center">521.06</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">−3.0427</gydF4y2Batd> <td align="center">−2.6612</gydF4y2Batd> <td align="center">−4.3320</gydF4y2Batd> <td align="center"> <bold> 1.7475</gydF4y2Babold></td> </tr> <tr> <td align="left">12</gydF4y2Batd> <td align="center">87年</gydF4y2Batd> <td align="center">15</gydF4y2Batd> <td align="center">34</gydF4y2Batd> <td align="center">110年</gydF4y2Batd> <td align="center">53.66</gydF4y2Batd> <td align="center">0.0000</gydF4y2Batd> <td align="center">0.1198</gydF4y2Batd> <td align="center">−1.6111</gydF4y2Batd> <td align="center">−0.5468</gydF4y2Batd> <td align="center">0.7006</gydF4y2Batd> </tr> <tr> <td align="left">13</gydF4y2Batd> <td align="center">84年</gydF4y2Batd> <td align="center">49</gydF4y2Batd> <td align="center">30.</gydF4y2Batd> <td align="center">83年</gydF4y2Batd> <td align="center">11.71</gydF4y2Batd> <td align="center">0.0085</gydF4y2Batd> <td align="center">0.0696</gydF4y2Batd> <td align="center">0.0659</gydF4y2Batd> <td align="center">−0.7246</gydF4y2Batd> <td align="center">0.2971</gydF4y2Batd> </tr> <tr> <td align="left">14</gydF4y2Batd> <td align="center">111年</gydF4y2Batd> <td align="center">39</gydF4y2Batd> <td align="center">33</gydF4y2Batd> <td align="center">63年</gydF4y2Batd> <td align="center">19.09</gydF4y2Batd> <td align="center">0.0003</gydF4y2Batd> <td align="center">0.4684</gydF4y2Batd> <td align="center">−0.2599</gydF4y2Batd> <td align="center">−0.5893</gydF4y2Batd> <td align="center">−0.0969</gydF4y2Batd> </tr> <tr> <td align="left">15</gydF4y2Batd> <td align="center">106年</gydF4y2Batd> <td align="center">38</gydF4y2Batd> <td align="center">31日</gydF4y2Batd> <td align="center">71年</gydF4y2Batd> <td align="center">17.24</gydF4y2Batd> <td align="center">0.0006</gydF4y2Batd> <td align="center">0.4024</gydF4y2Batd> <td align="center">−0.2969</gydF4y2Batd> <td align="center">−0.6781</gydF4y2Batd> <td align="center">0.0738</gydF4y2Batd> </tr> <tr> <td align="left">16</gydF4y2Batd> <td align="center">92年</gydF4y2Batd> <td align="center">30.</gydF4y2Batd> <td align="center">40</gydF4y2Batd> <td align="center">84年</gydF4y2Batd> <td align="center">13.69</gydF4y2Batd> <td align="center">0.0034</gydF4y2Batd> <td align="center">0.1997</gydF4y2Batd> <td align="center">−0.6332</gydF4y2Batd> <td align="center">−0.3155</gydF4y2Batd> <td align="center">0.3143</gydF4y2Batd> </tr> <tr> <td align="left">17</gydF4y2Batd> <td align="center">80年</gydF4y2Batd> <td align="center">38</gydF4y2Batd> <td align="center">36</gydF4y2Batd> <td align="center">92年</gydF4y2Batd> <td align="center">14.32</gydF4y2Batd> <td align="center">0.0025</gydF4y2Batd> <td align="center">−0.0001</gydF4y2Batd> <td align="center">−0.2969</gydF4y2Batd> <td align="center">−0.4655</gydF4y2Batd> <td align="center">0.4445</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p></p> <p>请注意,pwm的对数似然比,或log-odds。给定一个17 mer,说,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M19"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>= ACGGTACCACGTAAGTT,我们有两个假设。第一个假设是,17 mer属于一个主题,限制在特定的网站(有特定的核苷酸<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M20"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>),第二个是,每个站点17 mer取样于核苷酸池中没有特定场地的约束(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M21"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)。观察序列的可能<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M22"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,考虑到两种不同的假说,指定,分别<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M23"> <mml:mtable> <mml:mlabeledtr id="EEq3"> <mml:mtd rowspan="2"> <mml:mtext> (3)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> 年代</米米l:mi> <mml:mrow> <mml:mo> ∣</米米l:mo> </mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mn mathvariant="normal"> 3</米米l:mn> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mn mathvariant="normal"> 4</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ⋯</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> <mml:mn mathvariant="normal"> 17</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> <mml:mtr> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> 年代</米米l:mi> <mml:mrow> <mml:mo> ∣</米米l:mo> </mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:msubsup> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 5</米米l:mn> </mml:mrow> </mml:msubsup> <mml:msubsup> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 4</米米l:mn> </mml:mrow> </mml:msubsup> <mml:msubsup> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 4</米米l:mn> </mml:mrow> </mml:msubsup> <mml:msubsup> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 4</米米l:mn> </mml:mrow> </mml:msubsup> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mtr> </mml:mtable> </mml:math> </disp-formula></p> <p>这将导致以下相同(<xgydF4y2Baref ref-type="disp-formula" rid="EEq2"> 2</xgydF4y2Baref>):<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M24"> <mml:mtable> <mml:mlabeledtr id="EEq4"> <mml:mtd> <mml:mtext> (4)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:maligngroup></mml:maligngroup> <mml:mtext> 脉宽调制</米米l:mtext> <mml:mo id="ERAACAAABAA0BD0AA"> =</米米l:mo> <mml:malignmark></mml:malignmark> <mml:mtext> 罗</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> g</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:mtext> 罗</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> g</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> +</米米l:mo> <mml:mtext> 罗</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> g</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> +</米米l:mo> <mml:mo> ⋯</米米l:mo> <mml:mo linebreak="newline" indentalign="id" indenttarget="ERAACAAABAA0BD0AA"></mml:mo> <mml:mo> +</米米l:mo> <mml:mtext> 罗</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> g</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> <mml:mn mathvariant="normal"> 17</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> =</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> +</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo linebreak="newline" indentalign="id" indenttarget="ERAACAAABAA0BD0AA"></mml:mo> <mml:mo> +</米米l:mo> <mml:mo> ⋯</米米l:mo> <mml:mo> +</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> <mml:mn mathvariant="normal"> 17</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <sec id="sec2.1"> <title>2.1。规范的背景频率</gydF4y2Batitle> <p>背景频率(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M25"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)中指定的三种不同的方式在以前的出版物。首先就是要承担平等的背景频率(<xgydF4y2Baref ref-type="bibr" rid="B51"> 51</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B52"> 52</xgydF4y2Baref>在描述与PWM接头地点。这相当于网站的经典序列标识图形显示方法模式(<xgydF4y2Baref ref-type="bibr" rid="B49"> 49</xgydF4y2Baref>不考虑背景频率。与偏见的核苷酸序列频率,平等<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M26"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值时将生成一个错误的网站模式实际上是没有模式。例如,酵母的基因组有偏的背景暗示<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M27"> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M28"> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>将大于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M29"> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M30"> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>即使平均序列不包含特定站点的信息。同样,经典的序列图标将显示和T明显高于C和G即使感兴趣的序列不包含特定站点的信息。</pgydF4y2Ba> <p>第二种方法来指定<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M31"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是计算从输入序列。因此,在我们的例子中,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M32"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>可以计算从为首的四列,C、G,和U左边的表吗<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>。这种方法也有问题。假设一个特定的主题是poly-U序列,所有输入序列是“UUUUUUUU”。这将生成背景核苷酸频率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M33"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> U</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M34"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 0</米米l:mn> </mml:math> </inline-formula>。注意,站点特定的频率,考虑到输入序列都是“UUUUUUUU”,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M35"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> U</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M36"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mi></mml:mi> <mml:mo> =</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mi></mml:mi> <mml:mo> =</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 0</米米l:mn> </mml:math> </inline-formula>。所以产生的PWM将表明,主题不是有益的,这是与我们的直觉相反,也就是说,一段UUUUUUUU守恒跨一组序列可能是生理上的信息保持一致。</pgydF4y2Ba> <p>第三种方法是指定<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M37"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>根据一个希望解决的具体问题。例如,当描述拼接的内含子在一个特定的物种,一个可以使用的核苷酸频率记录(包括所有外显子和内含子)基因组中注释为背景的频率(<xgydF4y2Baref ref-type="bibr" rid="B28"> 28</xgydF4y2Baref>]。同样,网站的分歧点在内含子序列模式的研究<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M38"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值计算的内含子序列。我建议只有这第三种方法被用来避免PWM的印象可以无限的零假设(每个不同的规范<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M39"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)。</pgydF4y2Ba> <p>电脑程序DAMBE [<xgydF4y2Baref ref-type="bibr" rid="B53"> 53</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B54"> 54</xgydF4y2Baref>)为指定提供了不同的选择<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M40"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>在计算PWM。同样,新的序列标识方法允许更适当的规范的背景(前)频率<xgydF4y2Baref ref-type="bibr" rid="B50"> 50</xgydF4y2Baref>]。246年捐赠拼接产生的PWM的酵母基因内区,与背景频率计算内含子,如表所示<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>。</pgydF4y2Ba> </sec> <sec id="sec2.2"> <title>2.2。规范的Pseudocounts</gydF4y2Batitle> <p>当一些<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M41"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值是零,在我们的示例中,一样(<xgydF4y2Baref ref-type="disp-formula" rid="EEq1"> 1</xgydF4y2Baref>)是不适用的,因为零的对数是未定义的。可以采用三种方法来避免这个问题(<xgydF4y2Baref ref-type="bibr" rid="B55"> 55</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B56"> 56</xgydF4y2Baref>]。首先是计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M42"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>通过<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M43"> <mml:mtable> <mml:mlabeledtr id="EEq5"> <mml:mtd> <mml:mtext> (5)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> +</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mo> +</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:mfrac> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>这方法<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M44"> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> /</米米l:mo> <mml:mi> N</米米l:mi> </mml:math> </inline-formula>随着<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M45"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M46"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>核苷酸或氨基酸特定站点数吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M47"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>在网站<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M48"> <mml:mrow> <mml:mi> j</米米l:mi> </mml:mrow> </mml:math> </inline-formula>)。<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M49"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值可以计算(<xgydF4y2Baref ref-type="disp-formula" rid="EEq1"> 1</xgydF4y2Baref>)。这种方法是可怜的时候<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M50"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>很小。</pgydF4y2Ba> <p>第二种方法是使用显式pseudocounts通过定义<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M51"> <mml:mtable> <mml:mlabeledtr id="EEq6"> <mml:mtd rowspan="2"> <mml:mtext> (6)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> ·</米米l:mo> <mml:mtext> 伪</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mi> α</米米l:mi> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> <mml:mtr> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 伪</米米l:mtext> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mrow> <mml:munderover> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:mi> 米</米米l:mi> </mml:mrow> </mml:munderover> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> ·</米米l:mo> <mml:mtext> 伪</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M52"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>核苷酸的频率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M53"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M54"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>然后<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M55"> <mml:mtable> <mml:mlabeledtr id="EEq7"> <mml:mtd> <mml:mtext> (7)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> +</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> ·</米米l:mo> <mml:mtext> 伪</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mo> +</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 伪</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:mfrac> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>是很重要的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M56"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>小(如0.0001),因为预期<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M57"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>从随机序列是0 (<xgydF4y2Baref ref-type="disp-formula" rid="EEq1"> 1</xgydF4y2Baref>)。一个大的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M58"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>将大大增加<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M59"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>以上0与随机序列。</pgydF4y2Ba> <p>上面的两种方法都有一个主要缺点。假设我们有10排列图案的氨基酸。位置3是被K(赖氨酸)和R氨基酸(精氨酸)和位置5 E氨基酸(谷氨酸)。上面的两种方法将指定pseudocounts职位3和5一样,这是不合理的原因后。如果位置3需要带正电氨基酸,和位置5带负电荷的氨基酸,氨基酸K, R,和H(组氨酸)应该更有可能发现比其他氨基酸在位置3,和氨基酸D(天冬氨酸)应该更有可能发现比其他氨基酸在位置5。通过使用其他蛋白质序列数据对齐的大致相同的差异我们可以推导出频率分布位置,需要积极充电或带负电荷的氨基酸和使用这些频率分布产生pseudocounts [<xgydF4y2Baref ref-type="bibr" rid="B56"> 56</xgydF4y2Baref>]。在我们的例子中,pseudocounts在位置3和5将分配完全不同,因为一个职位要求的频率分布带正电氨基酸通常是相当不同的位置需要带负电荷的氨基酸。</pgydF4y2Ba> <p>PWM和PWM可以用来测量密码子使用的偏见。例如,给定的核苷酸的频率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M60"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>作为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M61"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>密码子的背景频率,说AGC,可以指定<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M62"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:math> </inline-formula>相比,AGC的观测频率。这种方法可以消除一个主要弱点等常用的密码子偏好指数CAI (<xgydF4y2Baref ref-type="bibr" rid="B57"> 57</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B58"> 58</xgydF4y2Baref>和数控<xgydF4y2Baref ref-type="bibr" rid="B59"> 59</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B60"> 60</xgydF4y2Baref>]。</pgydF4y2Ba> </sec> </sec> <sec id="sec3"> <title>3所示。吉布斯采样器与PWM作为一个关键组件</gydF4y2Batitle> <p>在PWM技术来描述一组确定主题,吉布斯采样器(<xgydF4y2Baref ref-type="bibr" rid="B61"> 61年</xgydF4y2Baref>),命名的数学物理学家j·w·吉布斯<我talic> 新创</我talic>主题的发现。例如,给定一组酵母的内含子序列,网站和分歧点在哪里什么?所有信息我们已经是每个基因内区应该有一个分歧点的网站,但它有什么顺序签名,它位于内含子序列在哪里?这个场景(图<xgydF4y2Baref ref-type="fig" rid="fig1"> 1</xgydF4y2Baref>)就是吉布斯采样器会发光。</pgydF4y2Ba> <fig id="fig1"> <label>图1</gydF4y2Balabel> <p>吉布斯采样器做什么。内含子序列的前面板代表吉布斯采样器的输入信息。底部面板代表的一部分显示所确定的主题(即输出。TAATAAC,红色)之间共享的序列。输出DAMBE [<xgydF4y2Baref ref-type="bibr" rid="B53"> 53</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B54"> 54</xgydF4y2Baref>]。输入的内含子序列文件(YeastAllIntron.fas)在DAMBE FASTA格式的安装目录。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/scientifica/2012/917540.fig.001"></graphic> </fig> <p>类似的场景涉及监管严重性的发现图案coexpressed基因(即给定一组。同步,增加或减少基因的转录水平随着时间的推移)微阵列(<xgydF4y2Baref ref-type="bibr" rid="B62"> 62年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B63"> 63年</xgydF4y2Baref>],圣人[<xgydF4y2Baref ref-type="bibr" rid="B64"> 64年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B65"> 65年</xgydF4y2Baref>),或深度排序<xgydF4y2Baref ref-type="bibr" rid="B66"> 66年</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B68"> 68年</xgydF4y2Baref>)实验。如果也coregulated coexpressed基因,那么他们可能有着某些未知的转录因子结合位点控制的相同或相似的转录因子。考虑到结合位点通常是位于上游的翻译起始密码子,你可能会从这些coexpressed上游序列中提取基因,让吉布斯采样器找到候选人管理主题。最近的一项研究表明,共享主题也可能出现在翻译起始的信使rna 5′UTR调节(<xgydF4y2Baref ref-type="bibr" rid="B69"> 69年</xgydF4y2Baref>]。</pgydF4y2Ba> <p>吉布斯采样器是一种依赖重复随机抽样的蒙特卡罗算法来估计所需的参数。蒙特卡罗方法是由著名的数学家Stanislaw乌兰,设想成功组装后在1945年第一台电子计算机ENIAC,和进一步开发的物理学家和数学家致力于核武器项目洛斯阿拉莫斯国家实验室在1940年代中期<xgydF4y2Baref ref-type="bibr" rid="B70"> 70年</xgydF4y2Baref>]。“蒙特卡罗方法”一词是由尼古拉斯大都市指定这类计算算法。虽然方法的通用应用程序毫无疑问是ENIAC的操作在1945年,物理学家恩里科·费米是已知独立开发和应用方法与机械计算器(近15年前<xgydF4y2Baref ref-type="bibr" rid="B70"> 70年</xgydF4y2Baref>]。</pgydF4y2Ba> <p>吉布斯采样器简化了计算参数估计时获得解析解非常困难或者不可能的。在生物学上,它已经被用于识别蛋白质的功能主题(<xgydF4y2Baref ref-type="bibr" rid="B31"> 31日</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B71"> 71年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B72"> 72年</xgydF4y2Baref>)、生物图像处理(<xgydF4y2Baref ref-type="bibr" rid="B73"> 73年</xgydF4y2Baref>,两两序列比对<xgydF4y2Baref ref-type="bibr" rid="B74"> 74年</xgydF4y2Baref>),和多序列比对(<xgydF4y2Baref ref-type="bibr" rid="B75"> 75年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B76"> 76年</xgydF4y2Baref>]。然而,最常见的生物应用吉布斯采样器仍在监管的基因序列的识别<xgydF4y2Baref ref-type="bibr" rid="B30"> 30.</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B77"> 77年</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B84"> 84年</xgydF4y2Baref>]。</pgydF4y2Ba> <p>有两种稍微不同的吉布斯采样器在主题预测中的应用。第一个假设每个序列包含一个主题(<xgydF4y2Baref ref-type="bibr" rid="B30"> 30.</xgydF4y2Baref>)和相关的算法称为现场取样器。第二个是更加灵活,允许每个序列没有或多个主题(<xgydF4y2Baref ref-type="bibr" rid="B71"> 71年</xgydF4y2Baref>),该算法称为主题取样器。我们将说明现场取样器取样器,然后简要讨论的主题。</pgydF4y2Ba> <p>我数值说明主题发现吉布斯采样器算法。吉布斯采样器的主要输出通常三部分组成。第一个是共享的主题在一个对齐的格式(底部面板图<xgydF4y2Baref ref-type="fig" rid="fig1"> 1</xgydF4y2Baref>)。第二个主题是PWM总结发现,第三个包含相关意义测试将在后面一节中了。派生的PWM,就像任何其他PWM,可以用来扫描序列不输入数据中发现的存在主题呈现。</pgydF4y2Ba> <sec id="sec3.1"> <title>3.1。吉布斯采样器的计算细节</gydF4y2Batitle> <p>我们将使用红色的核苷酸序列(<xgydF4y2Baref ref-type="bibr" rid="B85"> 85年</xgydF4y2Baref>),图中列出<xgydF4y2Baref ref-type="fig" rid="fig2"> 2</xgydF4y2Baref>,说明了吉布斯采样器算法。我们的主要目标是推断未知的图案的位置和序列之间共享序列,这样我们可以使图案,底部面板的图所示<xgydF4y2Baref ref-type="fig" rid="fig1"> 1</xgydF4y2Baref>。一致的主题将使我们能够生成一个PWM,特征位点核苷酸频率分布的主题。PWM可以用来扫描确定主题的存在,在其他序列。</pgydF4y2Ba> <fig id="fig2"> <label>图2</gydF4y2Balabel> <p>红色的序列(<xgydF4y2Baref ref-type="bibr" rid="B85"> 85年</xgydF4y2Baref>]说明吉布斯采样器算法,3′端修剪的最大长度50基地以适应页面。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/scientifica/2012/917540.fig.002"></graphic> </fig> <p>我们需要首先计算核苷酸,数字指定为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M63"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M64"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M65"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M66"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>分别在序列。的总数核苷酸序列(图29<xgydF4y2Baref ref-type="fig" rid="fig2"> 2</xgydF4y2Baref>)是1209年<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M67"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M68"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M69"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M70"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>等于325,316、267和301年,分别。这些值需要指定pseudocounts(我们在前一节中遇到PWM)。</pgydF4y2Ba> <p>让<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M71"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>被指定为输入序列的数量<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M72"> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mo> …</米米l:mo> <mml:mo> ,</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mo> …</米米l:mo> <mml:mo> ,</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>。让<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M73"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>的长度<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M74"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M75"> <mml:mrow> <mml:mi> 米</米米l:mi> </mml:mrow> </mml:math> </inline-formula>主题的长度,长度通常是4 - 8。对于我们的例子,我们将使用<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M76"> <mml:mi> 米</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 6</米米l:mn> </mml:math> </inline-formula>。一个通常会跑几次吉布斯采样器不同<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M77"> <mml:mrow> <mml:mi> 米</米米l:mi> </mml:mrow> </mml:math> </inline-formula>如果一个值对图案的长度都所知甚少。PWM的维度<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M78"> <mml:mn> 4</米米l:mn> <mml:mo> ×</米米l:mo> <mml:mi> 米</米米l:mi> </mml:math> </inline-formula>核苷酸序列,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M79"> <mml:mn> 20.</米米l:mn> <mml:mo> ×</米米l:mo> <mml:mi> 米</米米l:mi> </mml:math> </inline-formula>对氨基酸序列。让<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M80"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是未知的主题的起始位置<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M81"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。</pgydF4y2Ba> <p></p> <p></p> <p>吉布斯采样器的主要算法的两个步骤。第一个是随机初始化一组随机的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M82"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值被分配和网站核苷酸频率计算。第二步是预测更新,直到当地的解决方案<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M83"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,结合位点核苷酸频率可以制成一个PWM。这是重复多次,以前存储的局部最优方案取而代之的是更好的。收敛通常宣称当两个或更多当地的解决方案都是相同的。数值在以下几节描述这些步骤。</pgydF4y2Ba> </sec> <sec id="sec3.2"> <title>3.2。初始化</gydF4y2Batitle> <p>随机分配一个值的起始步骤<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M84"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>的约束<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M85"> <mml:mn> 1</米米l:mn> <mml:mo> ≤</米米l:mo> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> ≤</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> l</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> </mml:mo> <mml:mo> - - - - - -</米米l:mo> <mml:mo> </mml:mo> <mml:mi> 米</米米l:mi> <mml:mi></mml:mi> <mml:mo> +</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>。所以我们的第一套<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M86"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>“主题”本质上是一组随机的序列长度m和预计不会有任何模式。为读者好奇,第一组29随机<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M87"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值恰好是:29日31日,23日,28日,10日,2,18岁,32岁,20日,15日,11日,25日,24日,30日,18日,15日,10日,23日,14日,15日,26日,36岁,8日,6日,30日,19日,27日,26日和14。从29个核苷酸随机图案的特定站点分布如表所示<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>。几乎没有任何特定模式,因为人会预期。</pgydF4y2Ba> <table-wrap id="tab2"> <label>表2</gydF4y2Balabel> <p>29日随机图案的特定站点分布的核苷酸长度6。第二列列出了核苷酸在29日的分布随机图案。</pgydF4y2Ba> <table> <tbody> <tr> <td align="left"></td> <td align="center"></td> <td align="center" colspan="6">网站</gydF4y2Batd> </tr> <tr> <td align="left">Nuc</gydF4y2Batd> <td align="center">C0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> <tr> <td align="left" colspan="8"> <hr></td> </tr> <tr> <td align="left">一个</gydF4y2Batd> <td align="center">278年</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">7</gydF4y2Batd> </tr> <tr> <td align="left">C</gydF4y2Batd> <td align="center">279年</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">5</gydF4y2Batd> </tr> <tr> <td align="left">G</gydF4y2Batd> <td align="center">230年</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">11</gydF4y2Batd> </tr> <tr> <td align="left">T</gydF4y2Batd> <td align="center">248年</gydF4y2Batd> <td align="center">11</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>第二列在表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>将被称为C0向量<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M88"> <mml:mtext> C</米米l:mtext> <mml:msub> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M89"> <mml:mtext> C</米米l:mtext> <mml:msub> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M90"> <mml:mtext> C</米米l:mtext> <mml:msub> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M91"> <mml:mtext> C</米米l:mtext> <mml:msub> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:math> </inline-formula>等于278,279、230和248年,分别。的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M92"> <mml:mn> 4</米米l:mn> <mml:mo> ×</米米l:mo> <mml:mn> 6</米米l:mn> </mml:math> </inline-formula>矩阵,占领过去六列在表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>将被称为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M93"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵。的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M94"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>从29日随机矩阵表主题而C0向量与核苷酸以外的主题列表。因此,第一,第二,第三,第四排表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>应该等于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M95"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M96"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M97"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M98"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,分别。还要注意,每个六列的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M99"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵应该29。</pgydF4y2Ba> </sec> <sec id="sec3.3"> <title>3.3。预测更新</gydF4y2Batitle> <p>预测更新包括获得<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M100"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>(= 29日在我们的示例中)随机数字从1到<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M101"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>和使用这些数字索引选择序列顺序更新站点特定的核苷酸(分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M102"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>相关矩阵)和频率(C0向量)。例如,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M103"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>随机数在我首次运行的吉布斯采样器是11日,18日,26日,22日,2,28日,12日,9日,7日,3日,17日,16日,1,4,21日,15日,14日,24日,19日,27日,29日,6,10,20,13日,23日,25日,分别和5。这意味着<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M104"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>首先将使用,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M105"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 5</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>最后,第一个周期的预测更新。重要的是使用一系列随机的数字,而不是选择序列根据输入的顺序。后者提高了捕获吉布斯采样器在一个局部最优的可能性。</pgydF4y2Ba> <p></p> <p>我们的第一个随机选择的序列<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M106"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>和随机选择的主题从网站11日开始,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M107"> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 11</米米l:mn> </mml:math> </inline-formula>,主题是AGTGTG。这个最初的主题将会离开<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M108"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵和投入C0向量。这个主题有一个0 C, 3 G的,两个U。通过将这些值添加到C0矢量表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>,我们获得了C0矢量表<xgydF4y2Baref ref-type="table" rid="tab3"> 3</xgydF4y2Baref>。我们还需要把这个主题的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M109"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵减去第一个从第一列中的第一个值<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M110"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>(即。、新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M111"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mo> ,</米米l:mo> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>=老<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M112"> <mml:msub> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mo> ,</米米l:mo> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> - - - - - -</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>),第二个G从第三第二列的值<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M113"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>(即。、新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M114"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mo> ,</米米l:mo> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>=老<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M115"> <mml:msub> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> <mml:mo> ,</米米l:mo> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> - - - - - -</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>),等等。这个转换<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M116"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>C矩阵表<xgydF4y2Baref ref-type="table" rid="tab3"> 3</xgydF4y2Baref>。</pgydF4y2Ba> <table-wrap id="tab3"> <label>表3</gydF4y2Balabel> <p>特定站点的分布28随机图案的核苷酸长度6,删除后最初的主题<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M117"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。第二列列表之外的核苷酸分布28随机图案。</pgydF4y2Ba> <table> <tbody> <tr> <td align="left"></td> <td align="center"></td> <td align="center" colspan="6">网站</gydF4y2Batd> </tr> <tr> <td align="left">Nuc</gydF4y2Batd> <td align="center">C0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> <tr> <td align="left" colspan="8"> <hr></td> </tr> <tr> <td align="left">一个</gydF4y2Batd> <td align="center">279年</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">7</gydF4y2Batd> </tr> <tr> <td align="left">C</gydF4y2Batd> <td align="center">279年</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">5</gydF4y2Batd> </tr> <tr> <td align="left">G</gydF4y2Batd> <td align="center">233年</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">10</gydF4y2Batd> </tr> <tr> <td align="left">T</gydF4y2Batd> <td align="center">250年</gydF4y2Batd> <td align="center">11</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>在这一点上,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M118"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵是由28个随机选择的主题,分别来自序列(不包括<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M119"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)。你会发现每六列的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M120"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵有一笔28。在最初的主题的原因<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M121"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>出了<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M122"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵和把它回C0向量,我们会找到一个更好的主题<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M123"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,把它放到<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M124"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M125"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵将再次基于29图案。我们如何得到更好的主题?回想一下,一个位置权重矩阵(PWM)可以用来扫描序列的滑动窗口长度m得分位置权重矩阵(PWMSs)为每个窗口。我们将做一个PWM C0的矢量和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M126"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵和使用产生PWM扫描<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M127"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>并得到一个新的主题,pwm最高。</pgydF4y2Ba> <p></p> <p>你可能想知道为什么这种做法会让我们考虑到任何地方<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M128"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵是最初的随机图案。由此产生的PWM不会展览模式,因此结果PWMSs将不提供信息的。这里的关键概念是,当一个人需要一个随机游走在地形与多个山峰,迟早会遇到一个峰值,攀登高峰至少会给我们当地最大。在达到的峰值和记录的高度,我们将在另一个随机选择的位置和当地的山峰开始爬山了。这一过程持续进行直到我们到达最高峰或固定数量的计算机迭代后没有发现任何更高的峰值。</pgydF4y2Ba> <p>通常,使用C0 PWM生成向量作为背景的频率(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M129"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M130"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵特有的频率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M131"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。然而,尽管大多数算法的吉布斯采样器计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M132"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>这种方式(例如,<xgydF4y2Baref ref-type="bibr" rid="B32"> 32</xgydF4y2Baref>,页133 - 147)),<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M133"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>计算从C0向量有严重的问题,当输入序列是一样短的主题。例如,如果真正的主题有许多核苷酸和几个核苷酸U,然后C0向量也将有很多,现在很少有美国主题和一些核苷酸U将被视为偏差很大的背景,会有很高的pwm,导致偏差估计的真正的主题。因此,当输入序列短,每个人都应该指定背景频率而不是使用C0来计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M134"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。可以参考前面的部分频率PWM有关背景的更多信息。</pgydF4y2Ba> <p>对于pseudocounts,我们可能使用<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M135"> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.0001</米米l:mn> </mml:math> </inline-formula>。由此产生的PWM用于扫描<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M136"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>长40基地,35吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M137"> <mml:mo stretchy="false"> (</米米l:mo> <mml:mo> =</米米l:mo> <mml:mn> 40</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:mi> 米</米米l:mi> <mml:mo> +</米米l:mo> <mml:mn> 1</米米l:mn> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>可能的起始点(即主题。,可能<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M138"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值的序列)。35这些pwm值35可能的主题<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M139"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(表<xgydF4y2Baref ref-type="table" rid="tab4"> 4</xgydF4y2Baref>)规范化有一笔1 (<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M140"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>在表<xgydF4y2Baref ref-type="table" rid="tab4"> 4</xgydF4y2Baref>)。我们现在继续更新初始<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M141"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M142"> <mml:mo> =</米米l:mo> <mml:mn> 11</米米l:mn> </mml:math> </inline-formula>),一个新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M143"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>基于结果的表的价值<xgydF4y2Baref ref-type="table" rid="tab4"> 4</xgydF4y2Baref>。我们应该如何选择新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M144"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>价值吗?</pgydF4y2Ba> <table-wrap id="tab4"> <label>表4</gydF4y2Balabel> <p>个六主题的可能位置<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M145"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,连同相应的主题和他们的位置权重矩阵表示为优势比。最后一列列出优势比规范化的和1。</pgydF4y2Ba> <table> <thead> <tr> <th align="left">网站</thgydF4y2Ba> <th align="center">个六</thgydF4y2Ba> <th align="center">优势比</thgydF4y2Ba> <th align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M146"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi mathvariant="normal"> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula></th> </tr> </thead> <tbody> <tr> <td align="left">1</gydF4y2Batd> <td align="center">CATGCC</gydF4y2Batd> <td align="center">0.153</gydF4y2Batd> <td align="center">0.004</gydF4y2Batd> </tr> <tr> <td align="left">2</gydF4y2Batd> <td align="center">ATGCCC</gydF4y2Batd> <td align="center">0.850</gydF4y2Batd> <td align="center">0.021</gydF4y2Batd> </tr> <tr> <td align="left">3</gydF4y2Batd> <td align="center">TGCCCT</gydF4y2Batd> <td align="center">0.664</gydF4y2Batd> <td align="center">0.016</gydF4y2Batd> </tr> <tr> <td align="left">4</gydF4y2Batd> <td align="center">GCCCTC</gydF4y2Batd> <td align="center">0.944</gydF4y2Batd> <td align="center">0.023</gydF4y2Batd> </tr> <tr> <td align="left">5</gydF4y2Batd> <td align="center">CCCTCA</gydF4y2Batd> <td align="center">0.254</gydF4y2Batd> <td align="center">0.006</gydF4y2Batd> </tr> <tr> <td align="left">6</gydF4y2Batd> <td align="center">CCTCAA</gydF4y2Batd> <td align="center">0.843</gydF4y2Batd> <td align="center">0.021</gydF4y2Batd> </tr> <tr> <td align="left">7</gydF4y2Batd> <td align="center">CTCAAG</gydF4y2Batd> <td align="center">0.609</gydF4y2Batd> <td align="center">0.015</gydF4y2Batd> </tr> <tr> <td align="left">8</gydF4y2Batd> <td align="center">TCAAGT</gydF4y2Batd> <td align="center">0.717</gydF4y2Batd> <td align="center">0.018</gydF4y2Batd> </tr> <tr> <td align="left">9</gydF4y2Batd> <td align="center">CAAGTG</gydF4y2Batd> <td align="center">0.613</gydF4y2Batd> <td align="center">0.015</gydF4y2Batd> </tr> <tr> <td align="left">10</gydF4y2Batd> <td align="center">AAGTGT</gydF4y2Batd> <td align="center">0.426</gydF4y2Batd> <td align="center">0.011</gydF4y2Batd> </tr> <tr> <td align="left">11</gydF4y2Batd> <td align="center">AGTGTG</gydF4y2Batd> <td align="center">0.967</gydF4y2Batd> <td align="center">0.024</gydF4y2Batd> </tr> <tr> <td align="left">12</gydF4y2Batd> <td align="center">GTGTGC</gydF4y2Batd> <td align="center">0.546</gydF4y2Batd> <td align="center">0.014</gydF4y2Batd> </tr> <tr> <td align="left">13</gydF4y2Batd> <td align="center">TGTGCA</gydF4y2Batd> <td align="center">0.594</gydF4y2Batd> <td align="center">0.015</gydF4y2Batd> </tr> <tr> <td align="left">14</gydF4y2Batd> <td align="center">GTGCAG</gydF4y2Batd> <td align="center">4.034</gydF4y2Batd> <td align="center">0.100</gydF4y2Batd> </tr> <tr> <td align="left">15</gydF4y2Batd> <td align="center">TGCAGA</gydF4y2Batd> <td align="center">0.251</gydF4y2Batd> <td align="center">0.006</gydF4y2Batd> </tr> <tr> <td align="left">16</gydF4y2Batd> <td align="center">GCAGAT</gydF4y2Batd> <td align="center">1.084</gydF4y2Batd> <td align="center">0.027</gydF4y2Batd> </tr> <tr> <td align="left">17</gydF4y2Batd> <td align="center">CAGATT</gydF4y2Batd> <td align="center">0.343</gydF4y2Batd> <td align="center">0.009</gydF4y2Batd> </tr> <tr> <td align="left">18</gydF4y2Batd> <td align="center">AGATTG</gydF4y2Batd> <td align="center">1.812</gydF4y2Batd> <td align="center">0.045</gydF4y2Batd> </tr> <tr> <td align="left">19</gydF4y2Batd> <td align="center">GATTGG</gydF4y2Batd> <td align="center">1.128</gydF4y2Batd> <td align="center">0.028</gydF4y2Batd> </tr> <tr> <td align="left">20.</gydF4y2Batd> <td align="center">ATTGGT</gydF4y2Batd> <td align="center">0.408</gydF4y2Batd> <td align="center">0.010</gydF4y2Batd> </tr> <tr> <td align="left">21</gydF4y2Batd> <td align="center">TTGGTC</gydF4y2Batd> <td align="center">1.194</gydF4y2Batd> <td align="center">0.030</gydF4y2Batd> </tr> <tr> <td align="left">22</gydF4y2Batd> <td align="center">TGGTCA</gydF4y2Batd> <td align="center">0.888</gydF4y2Batd> <td align="center">0.022</gydF4y2Batd> </tr> <tr> <td align="left">23</gydF4y2Batd> <td align="center">GGTCAC</gydF4y2Batd> <td align="center">1.005</gydF4y2Batd> <td align="center">0.025</gydF4y2Batd> </tr> <tr> <td align="left">24</gydF4y2Batd> <td align="center">GTCACA</gydF4y2Batd> <td align="center">0.596</gydF4y2Batd> <td align="center">0.015</gydF4y2Batd> </tr> <tr> <td align="left">25</gydF4y2Batd> <td align="center">TCACAG</gydF4y2Batd> <td align="center">5.888</gydF4y2Batd> <td align="center">0.146</gydF4y2Batd> </tr> <tr> <td align="left">26</gydF4y2Batd> <td align="center">CACAGC</gydF4y2Batd> <td align="center">0.064</gydF4y2Batd> <td align="center">0.002</gydF4y2Batd> </tr> <tr> <td align="left">27</gydF4y2Batd> <td align="center">ACAGCA</gydF4y2Batd> <td align="center">0.569</gydF4y2Batd> <td align="center">0.014</gydF4y2Batd> </tr> <tr> <td align="left">28</gydF4y2Batd> <td align="center">CAGCAT</gydF4y2Batd> <td align="center">0.569</gydF4y2Batd> <td align="center">0.014</gydF4y2Batd> </tr> <tr> <td align="left">29日</gydF4y2Batd> <td align="center">AGCATT</gydF4y2Batd> <td align="center">0.381</gydF4y2Batd> <td align="center">0.009</gydF4y2Batd> </tr> <tr> <td align="left">30.</gydF4y2Batd> <td align="center">GCATTT</gydF4y2Batd> <td align="center">2.024</gydF4y2Batd> <td align="center">0.050</gydF4y2Batd> </tr> <tr> <td align="left">31日</gydF4y2Batd> <td align="center">CATTTC</gydF4y2Batd> <td align="center">0.474</gydF4y2Batd> <td align="center">0.012</gydF4y2Batd> </tr> <tr> <td align="left">32</gydF4y2Batd> <td align="center">ATTTCA</gydF4y2Batd> <td align="center">1.317</gydF4y2Batd> <td align="center">0.033</gydF4y2Batd> </tr> <tr> <td align="left">33</gydF4y2Batd> <td align="center">TTTCAA</gydF4y2Batd> <td align="center">4.293</gydF4y2Batd> <td align="center">0.107</gydF4y2Batd> </tr> <tr> <td align="left">34</gydF4y2Batd> <td align="center">TTCAAG</gydF4y2Batd> <td align="center">2.475</gydF4y2Batd> <td align="center">0.061</gydF4y2Batd> </tr> <tr> <td align="left">35</gydF4y2Batd> <td align="center">TCAAGG</gydF4y2Batd> <td align="center">1.279</gydF4y2Batd> <td align="center">0.032</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>有两种策略选择<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M147"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>价值。第一个是随机挑选一个<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M148"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值的大小<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M149"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(表<xgydF4y2Baref ref-type="table" rid="tab4"> 4</xgydF4y2Baref>)。你可能想象的圆靶与35片各自领域成正比<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M150"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值。当你扔飞镖的圆靶,大型片将有一个更好的机会比小片。如果dart土地7片,然后初始<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M151"> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 11</米米l:mn> </mml:math> </inline-formula>将会更新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M152"> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 7</米米l:mn> </mml:math> </inline-formula>与原来的主题,AGTGTG被新的主题CTCAAG所取代。</pgydF4y2Ba> <p></p> <p>第二种策略是使用最大<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M153"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>更新初始值<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M154"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>到新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M155"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>价值。网站的主题从25个最大的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M156"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 规范</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,我们将设置新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M157"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>等于25和替换最初的主题(= AGTGTG)的新主题(= TCACAG)。通过这种方法,我们不需要<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M158"> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> </mml:math> </inline-formula><sub>规范</gydF4y2Basub>我们可以选择<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M159"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>基于最大的优势比表<xgydF4y2Baref ref-type="table" rid="tab4"> 4</xgydF4y2Baref>。这种策略比第一次快,但似乎并没有失去任何敏感主题的发现基于有限的模拟研究。然而,如果一个是担心失踪的图案的可能性,第一应该使用策略。</pgydF4y2Ba> <p></p> <p>不管如何<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M160"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>选择,更新是相同的。假设我们有了第二个策略并设置新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M161"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>等于25。的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M162"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵表<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>然后修改替换原有的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M163"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 11</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>主题(= AGTGTG)的新主题(= TCACAG)。这导致一个C0向量和更新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M164"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵(表<xgydF4y2Baref ref-type="table" rid="tab5"> 5</xgydF4y2Baref>)。</pgydF4y2Ba> <table-wrap id="tab5"> <label>表5</gydF4y2Balabel> <p>特定站点分布的核苷酸29初始长度6日主题替换后最初的一个<gydF4y2Basub>11</gydF4y2Basub>主题(= AGTGTG)的新主题(= TCACAG)。</pgydF4y2Ba> <table> <tbody> <tr> <td align="left"></td> <td align="center"></td> <td align="center" colspan="6">网站</gydF4y2Batd> </tr> <tr> <td align="left">Nuc</gydF4y2Batd> <td align="center">C0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> <tr> <td align="left" colspan="8"> <hr></td> </tr> <tr> <td align="left">一个</gydF4y2Batd> <td align="center">277年</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">11</gydF4y2Batd> <td align="center">7</gydF4y2Batd> </tr> <tr> <td align="left">C</gydF4y2Batd> <td align="center">277年</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">11</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">5</gydF4y2Batd> </tr> <tr> <td align="left">G</gydF4y2Batd> <td align="center">232年</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">6</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">11</gydF4y2Batd> </tr> <tr> <td align="left">T</gydF4y2Batd> <td align="center">249年</gydF4y2Batd> <td align="center">12</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">8</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>我们重复这个过程的序列来更新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M165"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值。最后一个序列已经更新后,我们得到一套新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M166"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,一套新的29图案,加上PWM基于相关的C0向量矩阵和C。在这一点上我们计算加权比对的得分(即。加权pwm)如下:<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M167"> <mml:mtable> <mml:mlabeledtr id="EEq8"> <mml:mtd> <mml:mtext> (8)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> F</米米l:mi> <mml:mo> =</米米l:mo> <mml:mrow> <mml:munderover> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 代码</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:munderover> <mml:mrow> <mml:mrow> <mml:munderover> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> j</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:mi> 米</米米l:mi> </mml:mrow> </mml:munderover> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> C</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> ,</米米l:mo> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mi> j</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M168"> <mml:mrow> <mml:mi> 米</米米l:mi> </mml:mrow> </mml:math> </inline-formula>是主题宽度,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M169"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 代码</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>不同的符号序列的数量(4核苷酸和氨基酸序列的20)。<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M170"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>是衡量质量的排列的图案。越大<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M171"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值,越好。</pgydF4y2Ba> <p>的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M172"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>中定义的值,如(<xgydF4y2Baref ref-type="disp-formula" rid="EEq8"> 8</xgydF4y2Baref>),有许多不同的名字。它被称为Kullback-Leibler信息或Kullback-Leibler分歧在信息理论<xgydF4y2Baref ref-type="bibr" rid="B86"> 86年</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B88"> 88年</xgydF4y2Baref>),或较大的速度函数在统计估计<xgydF4y2Baref ref-type="bibr" rid="B89"> 89年</xgydF4y2Baref>]。在生物信息学,尤其是主题描述和预测涉及PWM,它通常被称为信息内容(<xgydF4y2Baref ref-type="bibr" rid="B6"> 6</xgydF4y2Baref>]。事实上,Kullback-Leibler信息是所谓的一个特例<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M173"> <mml:mrow> <mml:mi> f</米米l:mi> </mml:mrow> </mml:math> </inline-formula>散度测量两个概率分布之间的差异<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M174"> <mml:mrow> <mml:mi> P</米米l:mi> </mml:mrow> </mml:math> </inline-formula>和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M175"> <mml:mrow> <mml:mi> 问</米米l:mi> </mml:mrow> </mml:math> </inline-formula>导致自然的信<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M176"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>在(<xgydF4y2Baref ref-type="disp-formula" rid="EEq8"> 8</xgydF4y2Baref>)。</pgydF4y2Ba> <p>预测更新一次又一次地重复。每一次当我们得到一套新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M177"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,一套新的主题和基于C0向量和PWM<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M178"> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:math> </inline-formula>矩阵,我们计算一个新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M179"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值。如果新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M180"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值大于先前存储的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M181"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值,那么新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M182"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值,新的设置<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M183"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,新的主题将取代先前存储的。这个过程一直持续到我们到达当地最大的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M184"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>或者当当地循环的预设最大数量。由此产生的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M185"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值,的集合<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M186"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,新的主题和相关的PWM被存储为局部最优的输出。在爬山的类比,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M187"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>代表当地的峰值的高度。</pgydF4y2Ba> <p>现在是重复整个过程从一开始,也就是说,我们再次执行初始化,选择另一个随机的一组<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M188"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,经过当地迭代获得另一个局部最优输出。如果新的局部最优输出比以前存储的(即好。,新<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M189"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值大于先前存储的一个),新的输出将取代先前存储的输出。这个过程被重复多次,直到达到收敛,当新的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M190"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值始终与以前相同存储,或者直到固定数量的计算迭代一直没有找到一个<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M191"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值比已经记录下来。最后的位点核苷酸分布(表<xgydF4y2Baref ref-type="table" rid="tab6"> 6</xgydF4y2Baref>)显示一个更强大的比初始分布(表模式<xgydF4y2Baref ref-type="table" rid="tab2"> 2</xgydF4y2Baref>)来自29个随机选择的主题。</pgydF4y2Ba> <table-wrap id="tab6"> <label>表6</gydF4y2Balabel> <p>最后的核苷酸位点分布29日确认图案。输出DAMBE [<xgydF4y2Baref ref-type="bibr" rid="B53"> 53</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B54"> 54</xgydF4y2Baref>]。</pgydF4y2Ba> <table> <tbody> <tr> <td align="left"></td> <td align="center"></td> <td align="center" colspan="6">网站</gydF4y2Batd> </tr> <tr> <td align="left">Nuc</gydF4y2Batd> <td align="center">C0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">5</gydF4y2Batd> <td align="center">6</gydF4y2Batd> </tr> <tr> <td align="left" colspan="8"> <hr></td> </tr> <tr> <td align="left">一个</gydF4y2Batd> <td align="center">275年</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">22</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">9</gydF4y2Batd> <td align="center">16</gydF4y2Batd> </tr> <tr> <td align="left">C</gydF4y2Batd> <td align="center">285年</gydF4y2Batd> <td align="center">11</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">19</gydF4y2Batd> <td align="center">1</gydF4y2Batd> </tr> <tr> <td align="left">G</gydF4y2Batd> <td align="center">252年</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">7</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">1</gydF4y2Batd> </tr> <tr> <td align="left">T</gydF4y2Batd> <td align="center">223年</gydF4y2Batd> <td align="center">15</gydF4y2Batd> <td align="center">22</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">29日</gydF4y2Batd> <td align="center">1</gydF4y2Batd> <td align="center">11</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>最后一致的图案(图7 - 2 (<xgydF4y2Baref ref-type="bibr" rid="B32"> 32</xgydF4y2Baref>])分享(C / T)的一般共识TATC (a / T)。它的反补(A / T)叫(A / G)是已知GATA-binding转录因子的结合位点<xgydF4y2Baref ref-type="bibr" rid="B90"> 90年</xgydF4y2Baref>- - - - - -<xgydF4y2Baref ref-type="bibr" rid="B95"> 95年</xgydF4y2Baref>]。这一发现的图案表明这组序列可能确实是coregulated GATA-binding相同类型的转录因子。这些发现是至关重要的转录组和蛋白质组学研究旨在了解基因调控网络。吉布斯采样器等算法帮助我们理解基因和基因产物之间的交互。</pgydF4y2Ba> <p>这里可能是相关总结的基本生物学和GATA-binding转录因子GATA框。活细胞是一个系统与许多基因开关,可以打开或关闭细胞内和细胞外环境。这些开关是区分正常的活细胞和癌细胞或死细胞。叫图案(或叫盒)是一个这样的开关和它是由特定的转录因子的开启或关闭(蛋白质绑定到主题,打开或关闭基因的转录包含这样的主题)。更好的知道GATA-binding转录因子是GATA-1结合GATA主题发现在绝大多数erythroid-expressed cis-elements基因所有脊椎动物的检查(<xgydF4y2Baref ref-type="bibr" rid="B96"> 96年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B97"> 97年</xgydF4y2Baref>]。的核心启动子大鼠血小板因子4 (PF4)基因包含这样一个叫主题和绑定GATA-binding GATA图案的蛋白质如GATA-1抑制PF4基因的转录<xgydF4y2Baref ref-type="bibr" rid="B91"> 91年</xgydF4y2Baref>]。现在知道叫监管图案和GATA-binding转录因子存在于各种生物体从细胞黏菌脊椎动物,包括植物、真菌、线虫、昆虫,和棘皮动物<xgydF4y2Baref ref-type="bibr" rid="B98"> 98年</xgydF4y2Baref>),这表明基因开关的功能是远远超出红细胞生成。在人类,叫GATA-binding主题和蛋白质是涉及到几种疾病(<xgydF4y2Baref ref-type="bibr" rid="B99"> 99年</xgydF4y2Baref>]。叫图案及其结合蛋白的序列差异应该阐明组件的共同进化的基因开关。</pgydF4y2Ba> <p>可能会注意到一些序列有强烈(C / T) TATC (a / T)的主题,而另一些(例如,第二,第四和第五序列)只有微弱的和高度可疑信号。计算机程序实现吉布斯采样器通常将输出信号的强度的定量测量,和pwm是最常用的指数为此(表<xgydF4y2Baref ref-type="table" rid="tab7"> 7</xgydF4y2Baref>)。pwm是log-odds召回,但一个可以直接使用优势比作为衡量相对主题的力量。还记得,一个优势比的比例是两个概率相关的两个假设。定义<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M192"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>个六的假说是一个主题的特定场地的限制,和<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M193"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>假设个六的不是一个主题,有其指定的概率只有四个整体核苷酸频率。的优势比的比值的概率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M194"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是真实的概率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M195"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是真的。一个一般应该截止值为20,也就是说,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M196"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 是的</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是20倍吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M197"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> θ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 没有</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。</pgydF4y2Ba> <table-wrap id="tab7"> <label>表7</gydF4y2Balabel> <p>输出的pwm的定量测量的强度确定主题。输出DAMBE [<xgydF4y2Baref ref-type="bibr" rid="B53"> 53</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B54"> 54</xgydF4y2Baref>]。</pgydF4y2Ba> <table> <thead> <tr> <th align="left">SeqName</thgydF4y2Ba> <th align="center">主题</thgydF4y2Ba> <th align="center">开始</thgydF4y2Ba> <th align="center">优势比</thgydF4y2Ba> </tr> </thead> <tbody> <tr> <td align="left">Seq1</gydF4y2Batd> <td align="center">TTATCA</gydF4y2Batd> <td align="center">18</gydF4y2Batd> <td align="center">163.6602</gydF4y2Batd> </tr> <tr> <td align="left">Seq2</gydF4y2Batd> <td align="center">CGGTCA</gydF4y2Batd> <td align="center">22</gydF4y2Batd> <td align="center">14.5511</gydF4y2Batd> </tr> <tr> <td align="left">Seq3</gydF4y2Batd> <td align="center">CTATCA</gydF4y2Batd> <td align="center">14</gydF4y2Batd> <td align="center">101.8203</gydF4y2Batd> </tr> <tr> <td align="left">Seq4</gydF4y2Batd> <td align="center">AGATAA</gydF4y2Batd> <td align="center">17</gydF4y2Batd> <td align="center">9.1127</gydF4y2Batd> </tr> <tr> <td align="left">Seq5</gydF4y2Batd> <td align="center">TGATTA</gydF4y2Batd> <td align="center">16</gydF4y2Batd> <td align="center">12.9266</gydF4y2Batd> </tr> <tr> <td align="left">Seq6</gydF4y2Batd> <td align="center">CTATCT</gydF4y2Batd> <td align="center">18</gydF4y2Batd> <td align="center">90.7790</gydF4y2Batd> </tr> <tr> <td align="left">Seq7</gydF4y2Batd> <td align="center">TTATCA</gydF4y2Batd> <td align="center">20.</gydF4y2Batd> <td align="center">163.6602</gydF4y2Batd> </tr> <tr> <td align="left">Seq8</gydF4y2Batd> <td align="center">TTATCA</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">163.6602</gydF4y2Batd> </tr> <tr> <td align="left">Seq9</gydF4y2Batd> <td align="center">CTATAA</gydF4y2Batd> <td align="center">17</gydF4y2Batd> <td align="center">58.1420</gydF4y2Batd> </tr> <tr> <td align="left">Seq10</gydF4y2Batd> <td align="center">CTATCT</gydF4y2Batd> <td align="center">14</gydF4y2Batd> <td align="center">90.7790</gydF4y2Batd> </tr> <tr> <td align="left">Seq11</gydF4y2Batd> <td align="center">TGGTCA</gydF4y2Batd> <td align="center">21</gydF4y2Batd> <td align="center">23.3886</gydF4y2Batd> </tr> <tr> <td align="left">Seq12</gydF4y2Batd> <td align="center">TTGTAA</gydF4y2Batd> <td align="center">33</gydF4y2Batd> <td align="center">38.9024</gydF4y2Batd> </tr> <tr> <td align="left">Seq13</gydF4y2Batd> <td align="center">TTATCT</gydF4y2Batd> <td align="center">20.</gydF4y2Batd> <td align="center">145.9129</gydF4y2Batd> </tr> <tr> <td align="left">Seq14</gydF4y2Batd> <td align="center">TTATCT</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">145.9129</gydF4y2Batd> </tr> <tr> <td align="left">Seq15</gydF4y2Batd> <td align="center">TTATCA</gydF4y2Batd> <td align="center">10</gydF4y2Batd> <td align="center">163.6602</gydF4y2Batd> </tr> <tr> <td align="left">Seq16</gydF4y2Batd> <td align="center">CTATAA</gydF4y2Batd> <td align="center">3</gydF4y2Batd> <td align="center">58.1420</gydF4y2Batd> </tr> <tr> <td align="left">Seq17</gydF4y2Batd> <td align="center">TTATCC</gydF4y2Batd> <td align="center">13</gydF4y2Batd> <td align="center">34.3258</gydF4y2Batd> </tr> <tr> <td align="left">Seq18</gydF4y2Batd> <td align="center">AGATAT</gydF4y2Batd> <td align="center">20.</gydF4y2Batd> <td align="center">8.1245</gydF4y2Batd> </tr> <tr> <td align="left">Seq19</gydF4y2Batd> <td align="center">TGATAA</gydF4y2Batd> <td align="center">16</gydF4y2Batd> <td align="center">32.0835</gydF4y2Batd> </tr> <tr> <td align="left">Seq20</gydF4y2Batd> <td align="center">AGATAA</gydF4y2Batd> <td align="center">24</gydF4y2Batd> <td align="center">9.1127</gydF4y2Batd> </tr> <tr> <td align="left">Seq21</gydF4y2Batd> <td align="center">CTGTAT</gydF4y2Batd> <td align="center">12</gydF4y2Batd> <td align="center">21.5783</gydF4y2Batd> </tr> <tr> <td align="left">Seq22</gydF4y2Batd> <td align="center">CTGTAT</gydF4y2Batd> <td align="center">0</gydF4y2Batd> <td align="center">21.5783</gydF4y2Batd> </tr> <tr> <td align="left">Seq23</gydF4y2Batd> <td align="center">CTATCT</gydF4y2Batd> <td align="center">23</gydF4y2Batd> <td align="center">90.7790</gydF4y2Batd> </tr> <tr> <td align="left">Seq24</gydF4y2Batd> <td align="center">TTGTCT</gydF4y2Batd> <td align="center">4</gydF4y2Batd> <td align="center">60.7395</gydF4y2Batd> </tr> <tr> <td align="left">Seq25</gydF4y2Batd> <td align="center">TTATCT</gydF4y2Batd> <td align="center">17</gydF4y2Batd> <td align="center">145.9129</gydF4y2Batd> </tr> <tr> <td align="left">Seq26</gydF4y2Batd> <td align="center">CTATCG</gydF4y2Batd> <td align="center">15</gydF4y2Batd> <td align="center">21.2368</gydF4y2Batd> </tr> <tr> <td align="left">Seq27</gydF4y2Batd> <td align="center">TTATCA</gydF4y2Batd> <td align="center">19</gydF4y2Batd> <td align="center">163.6602</gydF4y2Batd> </tr> <tr> <td align="left">Seq28</gydF4y2Batd> <td align="center">CTATCT</gydF4y2Batd> <td align="center">15</gydF4y2Batd> <td align="center">90.7790</gydF4y2Batd> </tr> <tr> <td align="left">Seq29</gydF4y2Batd> <td align="center">TTGTCA</gydF4y2Batd> <td align="center">2</gydF4y2Batd> <td align="center">68.1272</gydF4y2Batd> </tr> <tr> <td align="left" colspan="4"> <hr></td> </tr> <tr> <td align="left">的意思是</gydF4y2Batd> <td align="center"></td> <td align="center"></td> <td align="center">76.3120</gydF4y2Batd> </tr> <tr> <td align="left">方差</gydF4y2Batd> <td align="center"></td> <td align="center"></td> <td align="center">57.8163</gydF4y2Batd> </tr> </tbody> </table> </table-wrap> <p>每个人都应该注意,吉布斯采样器,从一组随机的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M198"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值,不一定收敛于相同的主题。这是该算法的优势和劣势。算法的优点是重复运行将使我们能够确定其他类型的隐藏的图案(即。,除了叫反补的主题)序列。缺点是用户不熟悉算法常常感到困惑时相同的输入产生完全不同的结果。例如,另一组假定的图案,RGVAGR的形式(R是一个“T”或G和V),被发现在共享序列(<xgydF4y2Baref ref-type="bibr" rid="B32"> 32</xgydF4y2Baref>,p . 146]。</pgydF4y2Ba> <p>可能的输入序列可能包含两个或两个以上的不同生物重要的主题。如果一个主题是更强的优等生中输入序列)(比其他的图案,如果吉布斯采样器的搜索算法之前详尽的概述,然后我们将总是得到最强大的主题和所有其他小姐生物有趣的图案。然而,一个可以运行吉布斯采样器的具体排除最强的主题已经确定,这样较弱的主题可以被识别。</pgydF4y2Ba> </sec> <sec id="sec3.4"> <title>3.4。主题式取样器</gydF4y2Batitle> <p>吉布斯采样器有两个版本。我们刚刚叫现场取样器。它假设每个序列只包含一个主题(<xgydF4y2Baref ref-type="bibr" rid="B30"> 30.</xgydF4y2Baref>]。另一个版本更灵活,允许每个序列没有或多个主题(<xgydF4y2Baref ref-type="bibr" rid="B71"> 71年</xgydF4y2Baref>),该算法称为主题取样器。GATA-binding转录因子组成蛋白质家族成员包含一个或两个高度保守的锌指dna结合域(<xgydF4y2Baref ref-type="bibr" rid="B98"> 98年</xgydF4y2Baref>),因此可能是一个序列可能包含不止一个叫盒子。例如,红色的Kruppel-like因子(EKLF,所需的锌指转录因子<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M199"> <mml:mrow> <mml:mi> β</米米l:mi> </mml:mrow> </mml:math> </inline-formula>球蛋白基因表达)的5′地区两个叫图案在E箱侧面图案特点是CANNTG [<xgydF4y2Baref ref-type="bibr" rid="B100"> One hundred.</xgydF4y2Baref>]。这需要一个算法,能够识别多个主题在一个序列。</pgydF4y2Ba> <p>这个网站可以扩展到主题取样器取样器后处理。PWM生成的站点取样器可用于re-scan图案的序列,计算相关的脉宽调制或每个序列中所有6-mers比值比。所有我们需要的是有一个截止分数保持这些图案与pwm或优势比大于截止得分。</pgydF4y2Ba> </sec> </sec> <sec id="sec4"> <title>4所示。统计显著性测试</gydF4y2Batitle> <p>麻省理工,从调整已知的主题或从吉布斯采样器运行,需要评估统计学意义。一个连续PWM的问题是缺乏普遍适用的测试和准确的意义,对个人网站的主题,在PWM或PWM。有两个原因准确意义测试是可取的。首先,与PWM描述一个主题后,自然想知道PWM特征是否重要,哪些网站的意义和序列的PWM显著大于随机期望。第二,在发现一个重要的PWM,通常要使用PWM扫描其他序列识别新的图案,和一个需要一个好的显著性检验显示主题识别的可靠性。这将减少假定序列经过实验验证,通常是乏味的和昂贵的<xgydF4y2Baref ref-type="bibr" rid="B101"> 101年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B102"> 102年</xgydF4y2Baref>]。</pgydF4y2Ba> <p>简而言之,三个分离的意义测试要求:一个个人网站,一个用于PWM本身,另一个用于PWM。下面几节详细讨论这些测试。</pgydF4y2Ba> <sec id="sec4.1"> <title>4.1。统计显著性测试对个人网站</gydF4y2Batitle> <p>个人网站的统计显著性可以通过<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M200"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> χ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>测试我错误率控制型的错误发现率(<xgydF4y2Baref ref-type="bibr" rid="B103"> 103年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B104"> 104年</xgydF4y2Baref>]。表中的数据<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>为例。背景的频率是<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M201"> <mml:mtext> 一个</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn> 0.3279</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M202"> <mml:mtext> C</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn> 0.1915</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M203"> <mml:mtext> G</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 0.2043</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M204"> <mml:mtext> U</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 0.2763</米米l:mn> </mml:math> </inline-formula>,使我们能够获得预期数量,C、G和t . 17<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M205"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> χ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>测试(表<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>),我们面临的问题是多重比较和需要控制familywise错误率(<xgydF4y2Baref ref-type="bibr" rid="B105"> 105年</xgydF4y2Baref>这是同义experimentwise错误率。</pgydF4y2Ba> <p>指定的错误率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M206"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 0</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,然后准确的关键<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M207"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>个人测试的拒绝<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M208"> <mml:mtable> <mml:mlabeledtr id="EEq9"> <mml:mtd> <mml:mtext> (9)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msup> <mml:mrow> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mo> /</米米l:mo> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:mrow> </mml:mrow> </mml:msup> </mml:mrow> <mml:mo class="right"> ]</米米l:mo> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M209"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>测试和的数量等于17在我们的案例中。如果我们将<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M210"> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 0</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 0.05</米米l:mn> </mml:math> </inline-formula>,然后<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M211"> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.003012705</米米l:mn> </mml:math> </inline-formula>。Bonferroni标准是基于近似<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M212"> <mml:mtable> <mml:mlabeledtr id="EEq10"> <mml:mtd> <mml:mtext> (10)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msup> <mml:mrow> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mo> /</米米l:mo> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:mrow> </mml:mrow> </mml:msup> </mml:mrow> <mml:mo class="right"> ]</米米l:mo> </mml:mrow> <mml:mi> </mml:mi> <mml:mo> ≈</米米l:mo> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>导致<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M213"> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.002941176</米米l:mn> </mml:math> </inline-formula>。二阶Bonferroni<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M214"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,当满足相关假设<xgydF4y2Baref ref-type="bibr" rid="B105"> 105年</xgydF4y2Baref>),是基于<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M215"> <mml:mtable> <mml:mlabeledtr id="EEq11"> <mml:mtd> <mml:mtext> (11)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> N</米米l:mi> <mml:mi> α</米米l:mi> <mml:mo> - - - - - -</米米l:mo> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mo> - - - - - -</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:msup> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msup> <mml:mo> =</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>导致<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M216"> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.0029493634</米米l:mn> </mml:math> </inline-formula>。在实践中,这些不同<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M217"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值没什么影响。在我们的示例中,所有三个<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M218"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值导致的结论是,频率分布在网站1、2、13日和16日不显著偏离背景频率。</pgydF4y2Ba> <p></p> <p>familywise错误率的统计控制协议被认为太保守,和协议控制的错误发现率(罗斯福)最近因此被提出<xgydF4y2Baref ref-type="bibr" rid="B103"> 103年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B104"> 104年</xgydF4y2Baref>]。经典的罗斯福方法(<xgydF4y2Baref ref-type="bibr" rid="B103"> 103年</xgydF4y2Baref>),现在通常被称为Benjamini-Hochberg过程或者只是BH过程,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M219"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值降序排列和计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M220"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M221"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>th<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M222"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>价值(下标BH代表BH过程)<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M223"> <mml:mtable> <mml:mlabeledtr id="EEq12"> <mml:mtd> <mml:mtext> (12)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:mi> 问</米米l:mi> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:mfrac> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在哪里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M224"> <mml:mrow> <mml:mi> 问</米米l:mi> </mml:mrow> </mml:math> </inline-formula>罗斯福(如0.05),<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M225"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>的排名<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M226"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>排序数组的值<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M227"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M228"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>是测试的数量(即。的数量<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M229"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值)。如果<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M230"> <mml:mrow> <mml:mi> k</米米l:mi> </mml:mrow> </mml:math> </inline-formula>是最大的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M231"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>满足的条件<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M232"> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> ≤</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>,然后我们拒绝假说<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M233"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> H</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>来<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M234"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> H</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> k</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。在我们的例子中,所有的网站都统计上显著的基础上<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M235"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(表<xgydF4y2Baref ref-type="table" rid="tab8"> 8</xgydF4y2Baref>)。</pgydF4y2Ba> <table-wrap id="tab8"> <label>表8</gydF4y2Balabel> <p>评估统计学意义的个人网站两种类型的错误发现率。</pgydF4y2Ba> <table> <thead> <tr> <th align="left">网站</thgydF4y2Ba> <th align="center"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M236"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula></th> <th align="center">pBH<gydF4y2Basup>(1)</gydF4y2Basup></th> <th align="center">pBY<gydF4y2Basup>(2)</gydF4y2Basup></th> </tr> </thead> <tbody> <tr> <td align="left">6</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.002941</gydF4y2Batd> <td align="center">0.000855</gydF4y2Batd> </tr> <tr> <td align="left">10</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.005882</gydF4y2Batd> <td align="center">0.001710</gydF4y2Batd> </tr> <tr> <td align="left">7</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.008824</gydF4y2Batd> <td align="center">0.002565</gydF4y2Batd> </tr> <tr> <td align="left">11</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.011765</gydF4y2Batd> <td align="center">0.003420</gydF4y2Batd> </tr> <tr> <td align="left">8</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.014706</gydF4y2Batd> <td align="center">0.004276</gydF4y2Batd> </tr> <tr> <td align="left">9</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.017647</gydF4y2Batd> <td align="center">0.005131</gydF4y2Batd> </tr> <tr> <td align="left">12</gydF4y2Batd> <td align="center">* 0.0000000000<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.020588</gydF4y2Batd> <td align="center">0.005986</gydF4y2Batd> </tr> <tr> <td align="left">4</gydF4y2Batd> <td align="center">* 0.0000004842<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.023529</gydF4y2Batd> <td align="center">0.006841</gydF4y2Batd> </tr> <tr> <td align="left">3</gydF4y2Batd> <td align="center">* 0.0000013734<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.026471</gydF4y2Batd> <td align="center">0.007696</gydF4y2Batd> </tr> <tr> <td align="left">5</gydF4y2Batd> <td align="center">* 0.0000030965<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.029412</gydF4y2Batd> <td align="center">0.008551</gydF4y2Batd> </tr> <tr> <td align="left">14</gydF4y2Batd> <td align="center">* 0.0002619304<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.032353</gydF4y2Batd> <td align="center">0.009406</gydF4y2Batd> </tr> <tr> <td align="left">15</gydF4y2Batd> <td align="center">* 0.0006307900<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.035294</gydF4y2Batd> <td align="center">0.010261</gydF4y2Batd> </tr> <tr> <td align="left">17</gydF4y2Batd> <td align="center">* 0.0025004071<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.038235</gydF4y2Batd> <td align="center">0.011116</gydF4y2Batd> </tr> <tr> <td align="left">16</gydF4y2Batd> <td align="center">* 0.0033589734<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.041176</gydF4y2Batd> <td align="center">0.011971</gydF4y2Batd> </tr> <tr> <td align="left">13</gydF4y2Batd> <td align="center">* 0.0084455695<gydF4y2Basup>__</gydF4y2Basup></td> <td align="center">0.044118</gydF4y2Batd> <td align="center">0.012827</gydF4y2Batd> </tr> <tr> <td align="left">1</gydF4y2Batd> <td align="center">* 0.0177349476</gydF4y2Batd> <td align="center">0.047059</gydF4y2Batd> <td align="center">0.013682</gydF4y2Batd> </tr> <tr> <td align="left">2</gydF4y2Batd> <td align="center">* 0.0182291629</gydF4y2Batd> <td align="center">0.050000</gydF4y2Batd> <td align="center">0.014537</gydF4y2Batd> </tr> </tbody> </table> <table-wrap-foot> <fn> <p><sup>(1)</gydF4y2Basup>至关重要的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M237"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>基于Benjamini和业务(1995)(<xgydF4y2Baref ref-type="bibr" rid="B103"> 103年</xgydF4y2Baref>]。</pgydF4y2Ba> </fn> <fn> <p> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M238"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mo> </mml:mo> </mml:mrow> <mml:mrow> <mml:mo stretchy="false"> (</米米l:mo> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> <mml:mo stretchy="false"> )</米米l:mo> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>至关重要的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M239"> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> </mml:math> </inline-formula>基于Benjamini和Yekutieli (2001) (<xgydF4y2Baref ref-type="bibr" rid="B104"> 104年</xgydF4y2Baref>]。</pgydF4y2Ba> </fn> <fn> <p>* Benjamini显著的标准和业务(1995)(<xgydF4y2Baref ref-type="bibr" rid="B103"> 103年</xgydF4y2Baref>]。</pgydF4y2Ba> </fn> <fn> <p><sup>__</gydF4y2Basup>重要的标准Benjamini和Yekutieli (2001) (<xgydF4y2Baref ref-type="bibr" rid="B104"> 104年</xgydF4y2Baref>]。</pgydF4y2Ba> </fn> </table-wrap-foot> </table-wrap> <p>上面的罗斯福过程中假设测试统计数据是独立的或积极的依赖(在极端情况下完美的积极的依赖,所有的测试都是一样的,只有一个测试没有多重比较的问题)。更为保守的罗斯福过程已经被开发出来,它放松假设[<xgydF4y2Baref ref-type="bibr" rid="B104"> 104年</xgydF4y2Baref>]。这种方法,现在通常被称为Benjamini-Yekutieli或者只是过程,计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M240"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 通过</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M241"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>th假说是<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M242"> <mml:mtable> <mml:mlabeledtr id="EEq13"> <mml:mtd> <mml:mtext> (13)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 通过</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:mi> 问</米米l:mi> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mrow> <mml:msubsup> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msubsup> <mml:mrow> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mo> /</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:mrow> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mfrac> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:mrow> <mml:msubsup> <mml:mo stretchy="false"> ∑</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msubsup> <mml:mrow> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> <mml:mo> /</米米l:mo> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:mrow> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mfrac> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>与<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M243"> <mml:mi> N</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 17</米米l:mn> </mml:math> </inline-formula>在我们的例子中,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M244"> <mml:mi> Σ</米米l:mi> <mml:mn> 1</米米l:mn> <mml:mo> /</米米l:mo> <mml:mi> k</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 3.439552523</米米l:mn> </mml:math> </inline-formula>。基于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M245"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 通过</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M246"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> χ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>测试网站相关不显著(表1和2<xgydF4y2Baref ref-type="table" rid="tab8"> 8</xgydF4y2Baref>)。通过程序被发现过于保守和提出了几个方案<xgydF4y2Baref ref-type="bibr" rid="B106"> 106年</xgydF4y2Baref>]。对于大型<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M247"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M248"> <mml:mi> Σ</米米l:mi> <mml:mn> 1</米米l:mn> <mml:mo> /</米米l:mo> <mml:mi> k</米米l:mi> </mml:math> </inline-formula>收敛于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M249"> <mml:mi> ln</米米l:mi> <mml:mo></mml:mo> <mml:mo stretchy="false"> (</米米l:mo> <mml:mi> N</米米l:mi> <mml:mo stretchy="false"> )</米米l:mo> <mml:mo> +</米米l:mo> <mml:mi> γ</米米l:mi> </mml:math> </inline-formula>(欧拉常数等于大约0.57721566)。因此,对于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M250"> <mml:mi> N</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 10000年</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M251"> <mml:mi> Σ</米米l:mi> <mml:mn> 1</米米l:mn> <mml:mo> /</米米l:mo> <mml:mi> k</米米l:mi> </mml:math> </inline-formula>接近10。所以<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M252"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 通过</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>近10倍小于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M253"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 至关重要的</米米l:mtext> <mml:mo> ·</米米l:mo> <mml:mtext> 黑洞</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。罗斯福上面的程序都被用于测试意义关于酵母拼接网站(<xgydF4y2Baref ref-type="bibr" rid="B23"> 23</xgydF4y2Baref>]。</pgydF4y2Ba> </sec> <sec id="sec4.2"> <title>4.2。评估统计学意义的PWM Pseudocounts时使用</gydF4y2Batitle> <p>PWM代表一个主题是否具有特定场地约束可以测试通过<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M254"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>统计(<xgydF4y2Baref ref-type="bibr" rid="B6"> 6</xgydF4y2Baref>在(指定)<xgydF4y2Baref ref-type="disp-formula" rid="EEq8"> 8</xgydF4y2Baref>)。然而,的分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M255"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>改变了pseudocounts中指定的(<xgydF4y2Baref ref-type="disp-formula" rid="EEq5"> 5</xgydF4y2Baref>)和(<xgydF4y2Baref ref-type="disp-formula" rid="EEq7"> 7</xgydF4y2Baref>)。例如,的期望<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M256"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>不再是零和pseudocounts当没有特定站点的模式。</pgydF4y2Ba> <p>一个更直接的方法评估PWM的意义是通过重新采样。定义的tetranomial分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M257"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mrow> <mml:mo stretchy="false"> (</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> </mml:mrow> </mml:msub> <mml:mi></mml:mi> <mml:mo> +</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> C</米米l:mtext> </mml:mrow> </mml:msub> <mml:mi></mml:mi> <mml:mo> +</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> G</米米l:mtext> </mml:mrow> </mml:msub> <mml:mi></mml:mi> <mml:mo> +</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> T</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo stretchy="false"> )</米米l:mo> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>,在那里<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M258"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> p</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>核苷酸的核苷酸频率吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M259"> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:math> </inline-formula>,我们可以得到一组新的序列(246 17元序列)和计算<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M260"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>。这是重复的,获得5000年的5000倍<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M261"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值。的99或第95百分位<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M262"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值可以作为至关重要的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M263"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值分别为0.05和0.01的水平,意义。一个观察<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M264"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>PWM的显著大于临界<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M265"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>。根据这一标准,246年捐赠的PWM拼接网站是非常重要的。同样的重采样技术也可以用来评估特定站点的意义模式在前一节中或在下一节pwm的重要性。</pgydF4y2Ba> </sec> <sec id="sec4.3"> <title>4.3。统计学意义的脉宽调制</gydF4y2Batitle> <p>构建一个脉宽调制的目的之一是促进PWMSs的计算。例如,序列UAAAGGUAUGUUUAAUU PWM, PWM表<xgydF4y2Baref ref-type="table" rid="tab1"> 1</xgydF4y2Baref>(四列由A、C、G和U右边),是简单的<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M266"> <mml:mtable> <mml:mlabeledtr id="EEq14"> <mml:mtd> <mml:mtext> (14)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mtext> 脉宽调制</米米l:mtext> <mml:mo> =</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> U</米米l:mtext> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> +</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> 一个</米米l:mtext> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> +</米米l:mo> <mml:mo> ⋯</米米l:mo> <mml:mo> +</米米l:mo> <mml:mtext> PW</米米l:mtext> <mml:msub> <mml:mrow> <mml:mtext> 米</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mtext> U</米米l:mtext> <mml:mn mathvariant="normal"> 17</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>因此,我们可以使用PWM来预测一个新的剪接供体通过扫描窗口的核苷酸序列17核苷酸网站和计算PWM。pwm越大,越可能17-mer拼接供体。然而,我们需要解决的问题有多大等<我talic> 在网上</我talic>预测。</pgydF4y2Ba> <p>pwm从随机序列遵循近似正态分布(图<xgydF4y2Baref ref-type="fig" rid="fig3"> 3</xgydF4y2Baref>),意思是0(或略大于0 pseudocounts使用时小<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M267"> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> </mml:math> </inline-formula>)。分布在图<xgydF4y2Baref ref-type="fig" rid="fig3"> 3</xgydF4y2Baref>有说等于0.068884,标准差等于0.314714254。</pgydF4y2Ba> <fig id="fig3"> <label>图3</gydF4y2Balabel> <p>pwm从随机序列近似正态分布,基于1000个随机序列长度17来自核苷酸的频率的池,C、G和T = 0.3279, 0.1915, 0.2043,和0.2763,分别。分布的意思等于0.068884,标准差等于0.314714254。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/scientifica/2012/917540.fig.003"></graphic> </fig> <p>假设我们使用<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M268"> <mml:mn> 4</米米l:mn> <mml:mo> ×</米米l:mo> <mml:mn> 17</米米l:mn> </mml:math> </inline-formula>脉宽调制扫描目标序列<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M269"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>1000元的剪接供体。有984<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M270"> <mml:mo stretchy="false"> (</米米l:mo> <mml:mo> =</米米l:mo> <mml:mn> 1000年</米米l:mn> <mml:mo> - - - - - -</米米l:mo> <mml:mn> 17</米米l:mn> <mml:mo> +</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>)不同17即序列<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M271"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>984年,产生pwm值。如果最大脉宽调制是1,统计学意义如何?</pgydF4y2Ba> <p>如果目标序列的长度<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M272"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>只有17元,而不是1000元,那么答案很简单。一个正态分布的99%置信上限意味着等于0.0689和0.3147标准差等于0.8808 (<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M273"> <mml:mo> =</米米l:mo> <mml:mn> 0.06888</米米l:mn> <mml:mo> +</米米l:mo> <mml:mn> 2.58</米米l:mn> <mml:mo> ×</米米l:mo> <mml:mn> 0.3147</米米l:mn> </mml:math> </inline-formula>),这意味着一个pwm(1)在0.01水平具有重要意义。然而,因为我们的目标序列<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M274"> <mml:mrow> <mml:mi> 年代</米米l:mi> </mml:mrow> </mml:math> </inline-formula>1000元,最大的pwm等于1 984 pwm值,我们需要走很长一段路要评估这个最大pwm值的重要性。</pgydF4y2Ba> <p>假设我们执行许多抽样实验相同的正态分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M275"> <mml:mi> p</米米l:mi> <mml:mo stretchy="false"> (</米米l:mo> <mml:mi> x</米米l:mi> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>如图<xgydF4y2Baref ref-type="fig" rid="fig3"> 3</xgydF4y2Baref>:<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M276"> <mml:mtable> <mml:mlabeledtr id="EEq15"> <mml:mtd> <mml:mtext> (15)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:mfrac> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> e</米米l:mi> </mml:mrow> <mml:mrow> <mml:msup> <mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:mo> <mml:mrow> <mml:mi> x</米米l:mi> <mml:mo> - - - - - -</米米l:mo> <mml:mi> μ</米米l:mi> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:mo> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msup> <mml:mo> /</米米l:mo> <mml:mo minsize="0.75em" maxsize="0.75em"> (</米米l:mo> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> <mml:msup> <mml:mrow> <mml:mi> σ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> <mml:mo minsize="0.75em" maxsize="0.75em"> )</米米l:mo> </mml:mrow> </mml:msup> </mml:mrow> <mml:mrow> <mml:mi> σ</米米l:mi> <mml:msqrt> <mml:mn mathvariant="normal"> 2</米米l:mn> <mml:mi> π</米米l:mi> </mml:msqrt> </mml:mrow> </mml:mfrac> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>在每个实验,我们样品<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M277"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>次获得<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M278"> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mo> …</米米l:mo> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msub> </mml:math> </inline-formula>。的最大<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M279"> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> </mml:math> </inline-formula>在每一个实验<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M280"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。这相当于用PWM扫描序列获得脉宽调制<gydF4y2Basub>1</gydF4y2Basub>,脉宽调制<gydF4y2Basub>2</gydF4y2Basub>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M281"> <mml:mrow> <mml:mo> …</米米l:mo> </mml:mrow> </mml:math> </inline-formula>,脉宽调制<gydF4y2Basub> <italic> N</我talic></sub>,最大的pwm指定为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M282"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mtext> 脉宽调制</米米l:mtext> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>。的分布是什么<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M283"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,指定为<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M284"> <mml:mi> F</米米l:mi> <mml:mo stretchy="false"> (</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>吗?请注意,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M285"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是一个极端的价值<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M286"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M287"> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值,所以是很自然的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M288"> <mml:mi> F</米米l:mi> <mml:mo stretchy="false"> (</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>一个极端值分布(EVD)。</pgydF4y2Ba> <p>极端值分布或EVD,也称为耿贝尔分布为先锋的极端的统计数据<xgydF4y2Baref ref-type="bibr" rid="B107"> 107年</xgydF4y2Baref>),是用于爆炸<xgydF4y2Baref ref-type="bibr" rid="B108"> 108年</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B109"> 109年</xgydF4y2Baref>和FASTA的新版本<xgydF4y2Baref ref-type="bibr" rid="B110"> 110年</xgydF4y2Baref>)高度统计学意义两个序列之间的匹配分数。它还可以用于执行意义测试包括PWM (<xgydF4y2Baref ref-type="bibr" rid="B5"> 5</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B6"> 6</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B55"> 55</xgydF4y2Baref>]。在这里我将概述EVD与pwm的数学框架。</pgydF4y2Ba> <p>的概率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M289"> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> </mml:math> </inline-formula>值小于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M290"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>是<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M291"> <mml:mtable> <mml:mlabeledtr id="EEq16"> <mml:mtd> <mml:mtext> (16)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> G</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> x</米米l:mi> <mml:mo> <</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:mrow> <mml:msubsup> <mml:mo stretchy="false"> ∫</米米l:mo> <mml:mrow> <mml:mn mathvariant="normal"> 0</米米l:mn> </mml:mrow> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:msubsup> <mml:mrow> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mi> d</米米l:mi> <mml:mi> x</米米l:mi> </mml:mrow> </mml:mrow> <mml:mo> 。</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>请注意,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M292"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>可以是<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M293"> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 1</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> ,</米米l:mo> <mml:mo> …</米米l:mo> <mml:mo> ,</米米l:mo> <mml:mi></mml:mi> </mml:math> </inline-formula>或<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M294"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M295"> <mml:mrow> <mml:mi> N</米米l:mi> </mml:mrow> </mml:math> </inline-formula>的可能性。<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M296"> <mml:mrow> <mml:mo stretchy="false"> (</米米l:mo> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mo> - - - - - -</米米l:mo> <mml:mn> 1</米米l:mn> </mml:mrow> <mml:mo stretchy="false"> )</米米l:mo> </mml:mrow> </mml:math> </inline-formula> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M297"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 我</米米l:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值小于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M298"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>在每一个实验。这让我们<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M299"> <mml:mtable> <mml:mlabeledtr id="EEq17"> <mml:mtd> <mml:mtext> (17)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> F</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:mi> N</米米l:mi> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mi> G</米米l:mi> <mml:msup> <mml:mrow> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:mi> x</米米l:mi> <mml:mo> <</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> </mml:mrow> <mml:mrow> <mml:mi> N</米米l:mi> <mml:mo> - - - - - -</米米l:mo> <mml:mn mathvariant="normal"> 1</米米l:mn> </mml:mrow> </mml:msup> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>这是策划的<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M300"> <mml:mi> μ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.068884</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M301"> <mml:mi> σ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.314714254</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M302"> <mml:mi> N</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 984年</米米l:mn> </mml:math> </inline-formula>(图<xgydF4y2Baref ref-type="fig" rid="fig4"> 4</xgydF4y2Baref>)。比的分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M303"> <mml:mi> p</米米l:mi> <mml:mo stretchy="false"> (</米米l:mo> <mml:mi> x</米米l:mi> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>在图<xgydF4y2Baref ref-type="fig" rid="fig3"> 3</xgydF4y2Baref>的分布<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M304"> <mml:mrow> <mml:mi> F</米米l:mi> </mml:mrow> </mml:math> </inline-formula>(<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M305"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>)已大幅转向正确的和山峰<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M306"> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 1.05</米米l:mn> </mml:math> </inline-formula>。</pgydF4y2Ba> <fig id="fig4"> <label>图4</gydF4y2Balabel> <p>极端值分布中指定的(<xgydF4y2Baref ref-type="disp-formula" rid="EEq17"> 17</xgydF4y2Baref>),<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M307"> <mml:mi> μ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.068884</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M308"> <mml:mi> σ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.314714254</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M309"> <mml:mi> N</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 984年</米米l:mn> </mml:math> </inline-formula>。</pgydF4y2Ba> <graphic xlink:href="//www.newsama.com/downloads/journals/scientifica/2012/917540.fig.004"></graphic> </fig> <p>现在我们可以回答这个问题是否我们的观察<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M310"> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> <mml:mo> =</米米l:mo> <mml:mn> 1</米米l:mn> </mml:math> </inline-formula>统计学意义。观察一个的概率<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M311"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>值等于1或更大<d我sp-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M312"> <mml:mtable> <mml:mlabeledtr id="EEq18"> <mml:mtd> <mml:mtext> (18)</米米l:mtext> </mml:mtd> <mml:mtd> <mml:mi> p</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> <mml:mo> ≥</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> 奥林匹克广播服务公司</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mo> =</米米l:mo> <mml:mrow> <mml:msubsup> <mml:mo stretchy="false"> ∫</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mtext> obx</米米l:mtext> </mml:mrow> </mml:msub> </mml:mrow> <mml:mrow> <mml:mi> ∞</米米l:mi> </mml:mrow> </mml:msubsup> <mml:mrow> <mml:mi> F</米米l:mi> <mml:mrow> <mml:mo class="left"> (</米米l:mo> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> <mml:mo class="right"> )</米米l:mo> </mml:mrow> <mml:mi> d</米米l:mi> <mml:msub> <mml:mrow> <mml:mi> x</米米l:mi> </mml:mrow> <mml:mrow> <mml:mi> 马克斯</米米l:mi> <mml:mo></mml:mo> </mml:mrow> </mml:msub> </mml:mrow> </mml:mrow> <mml:mo> ,</米米l:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>大约0.7986,也就是说,它不具有统计学意义。</pgydF4y2Ba> <p>一个简单得多,但可能不准确,方法基于<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M313"> <mml:mi> p</米米l:mi> <mml:mo stretchy="false"> (</米米l:mo> <mml:mi> x</米米l:mi> <mml:mo stretchy="false"> )</米米l:mo> </mml:math> </inline-formula>只是没有推导(<xgydF4y2Baref ref-type="disp-formula" rid="EEq16"> 16</xgydF4y2Baref>)- (<xgydF4y2Baref ref-type="disp-formula" rid="EEq18"> 18</xgydF4y2Baref>),是使用Bonferroni标准(<xgydF4y2Baref ref-type="disp-formula" rid="EEq10"> 10</xgydF4y2Baref>)。与<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M314"> <mml:mi> α</米米l:mi> <mml:mn> 0</米米l:mn> <mml:mo> =</米米l:mo> <mml:mn> 0.05</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M315"> <mml:mi> α</米米l:mi> <mml:mo> =</米米l:mo> <mml:msub> <mml:mrow> <mml:mi> α</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 0</米米l:mn> </mml:mrow> </mml:msub> <mml:mo> /</米米l:mo> <mml:mn> 986年</米米l:mn> <mml:mo> =</米米l:mo> <mml:mn> 0.00005081</米米l:mn> </mml:math> </inline-formula>需要一个pwm值等于1.292076814近乎显著,给吗<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M316"> <mml:mi> μ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.068884</米米l:mn> </mml:math> </inline-formula>,<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M317"> <mml:mi> σ</米米l:mi> <mml:mo> =</米米l:mo> <mml:mn> 0.314714254</米米l:mn> </mml:math> </inline-formula>。当我们观察到的最大脉宽调制<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M318"> <mml:mn> 1</米米l:mn> <mml:mo> <</米米l:mo> <mml:mn> 1.292076814</米米l:mn> </mml:math> </inline-formula>,它不是重要的在0.05显著性水平。</pgydF4y2Ba> <p>总之,PWM-based序列分析包括三种类型的输出:站点特定的频率偏离背景,位置权重矩阵本身和位置权重矩阵得分为每个输入序列。第一个可以评估的重要性<我nline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M319"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> χ</米米l:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</米米l:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>测试使用错误发现率作为标准拒绝零假设,第二次重采样方法,第三,基于统计数据的极值分布。这些测试的最新版本已经实现DAMBE [<xgydF4y2Baref ref-type="bibr" rid="B53"> 53</xgydF4y2Baref>,<xgydF4y2Baref ref-type="bibr" rid="B54"> 54</xgydF4y2Baref>]。</pgydF4y2Ba> </sec> </sec> <back> <ack> <title>确认</gydF4y2Batitle> <p>支持这项研究的发现,和战略研究资助自然科学与工程研究委员会加拿大。作者感谢美国Aris-Brosou, s·m·Ragonnet芬德雷和a . van Weringh评论。特别是,美国芬来纠正了错误并帮助澄清模棱两可。</pgydF4y2Ba> </ack> <ref-list> <ref id="B1" content-type="book"> <label>1</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Ptashne</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <source> <italic> 一个基因开关:基因控制和噬菌体λ</我talic> <year> 1986年</gydF4y2Bayear> <publisher-loc> 美国马萨诸塞州剑桥市</pgydF4y2Baublisher-loc> <publisher-name> 细胞出版社和布莱克韦尔科学</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B2" content-type="article"> <label>2</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Staden</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> </person-group> <article-title> 计算机方法来定位信号在核酸序列</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 1984年</gydF4y2Bayear> <volume> 12</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 505年</fpgydF4y2Baage> <lpage> 519年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0021760026</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B3" content-type="article"> <label>3</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Stormo</gydF4y2Basurname> <given-names> g D。</g我ven-names> </name> <name> <surname> 施耐德</gydF4y2Basurname> <given-names> t D。</g我ven-names> </name> <name> <surname> 黄金</gydF4y2Basurname> <given-names> l</g我ven-names> </name> </person-group> <article-title> 定量分析核苷酸序列和功能之间的关系的活动</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 1986年</gydF4y2Bayear> <volume> 14</gydF4y2Bavolume> <issue> 16</我ssue> <fpage> 6661年</fpgydF4y2Baage> <lpage> 6679年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0023057575</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / 14.16.6661</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B4" content-type="article"> <label>4</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 赫兹</gydF4y2Basurname> <given-names> g . Z。</g我ven-names> </name> <name> <surname> Hartzell</gydF4y2Basurname> <given-names> g·W。</g我ven-names> </name> <name> <surname> Stormo</gydF4y2Basurname> <given-names> g D。</g我ven-names> <suffix> 三世</gydF4y2Basuffix> </name> </person-group> <article-title> 识别共识模式未对齐的DNA序列已知功能相关</gydF4y2Baarticle-title> <source> <italic> 计算机应用在生物科学</我talic> <year> 1990年</gydF4y2Bayear> <volume> 6</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 81年</fpgydF4y2Baage> <lpage> 92年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025372992</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B5" content-type="article"> <label>5</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Claverie</gydF4y2Basurname> <given-names> j . M。</g我ven-names> </name> <name> <surname> 音频</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> 核苷酸position-weight矩阵匹配的统计学意义</gydF4y2Baarticle-title> <source> <italic> 计算机应用在生物科学</我talic> <year> 1996年</gydF4y2Bayear> <volume> 12</gydF4y2Bavolume> <issue> 5</我ssue> <fpage> 431年</fpgydF4y2Baage> <lpage> 439年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0030449157</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B6" content-type="article"> <label>6</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 赫兹</gydF4y2Basurname> <given-names> g . Z。</g我ven-names> </name> <name> <surname> Stormo</gydF4y2Basurname> <given-names> g D。</g我ven-names> </name> </person-group> <article-title> 识别DNA和蛋白质模式显著多序列的比对</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 1999年</gydF4y2Bayear> <volume> 15</gydF4y2Bavolume> <issue> 7 - 8</我ssue> <fpage> 563年</fpgydF4y2Baage> <lpage> 577年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0032826179</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B7" content-type="article"> <label>7</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Bhagwat</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 阿拉</gydF4y2Basurname> <given-names> l</g我ven-names> </name> </person-group> <article-title> PSI-BLAST教程</gydF4y2Baarticle-title> <source> <italic> 分子生物学方法</我talic> <year> 2007年</gydF4y2Bayear> <volume> 395年</gydF4y2Bavolume> <fpage> 177年</fpgydF4y2Baage> <lpage> 186年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 36549012653</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1385 / 1 - 59745 - 514 - 8:177</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B8" content-type="article"> <label>8</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 黄</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 郭</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> <name> <surname> “库兹涅佐夫”</gydF4y2Basurname> <given-names> i B。</g我ven-names> </name> </person-group> <article-title> DP-Bind: web服务器在dna结合蛋白质序列预测dna结合蛋白残留</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 23</gydF4y2Bavolume> <issue> 5</我ssue> <fpage> 634年</fpgydF4y2Baage> <lpage> 636年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 34047094501</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 /生物信息学/ btl672</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B9" content-type="article"> <label>9</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 金</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> 公园</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> </person-group> <article-title> 与支持向量机预测的蛋白质相对溶剂可访问性和远程交互三维局部描述符</gydF4y2Baarticle-title> <source> <italic> 蛋白质:结构、功能和遗传学</我talic> <year> 2004年</gydF4y2Bayear> <volume> 54</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 557年</fpgydF4y2Baage> <lpage> 562年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 1042268067</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1002 / prot.10602</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B10" content-type="article"> <label>10</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 拉希德</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 萨哈</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Raghava</gydF4y2Basurname> <given-names> g p S。</g我ven-names> </name> </person-group> <article-title> 基于支持向量机的预测方法使用进化分枝杆菌蛋白质的亚细胞定位信息和主题</gydF4y2Baarticle-title> <source> <italic> BMC生物信息学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 8日,第337条</gydF4y2Bavolume> <pub-id pub-id-type="other"> 2 - s2.0 - 37249058502</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1186 / 1471-2105-8-337</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B11" content-type="article"> <label>11</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Sim卡</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 金</gydF4y2Basurname> <given-names> s Y。</g我ven-names> </name> <name> <surname> 李</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> </person-group> <article-title> PPRODO:使用神经网络预测蛋白质域边界</gydF4y2Baarticle-title> <source> <italic> 蛋白质:结构、功能和遗传学</我talic> <year> 2005年</gydF4y2Bayear> <volume> 59</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 627年</fpgydF4y2Baage> <lpage> 632年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 17844363963</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1002 / prot.20442</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B12" content-type="article"> <label>12</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 李</gydF4y2Basurname> <given-names> g . L。</g我ven-names> </name> <name> <surname> 梁</gydF4y2Basurname> <given-names> t Y。</g我ven-names> </name> </person-group> <article-title> 特征选择的翻译起始位点的预测</gydF4y2Baarticle-title> <source> <italic> 基因组学、蛋白质组学和生物信息学</我talic> <year> 2005年</gydF4y2Bayear> <volume> 3</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 73年</fpgydF4y2Baage> <lpage> 83年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 29544452226</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1504 / IJVD.2005.007220</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B13" content-type="article"> <label>13</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 格雷奇</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Maetschke</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 马修斯</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 蒂姆斯</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> </person-group> <article-title> 披衣菌的全基因组分析启动子,过去的足迹</gydF4y2Baarticle-title> <source> <italic> 微生物学研究</我talic> <year> 2007年</gydF4y2Bayear> <volume> 158年</gydF4y2Bavolume> <issue> 8 - 9</我ssue> <fpage> 685年</fpgydF4y2Baage> <lpage> 693年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 36749044857</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / j.resmic.2007.08.005</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B14" content-type="article"> <label>14</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Aerts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> van Helden</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 沙子</gydF4y2Basurname> <given-names> O。</g我ven-names> </name> <name> <surname> 哈桑</gydF4y2Basurname> <given-names> b。</g我ven-names> </name> </person-group> <article-title> 微调增强模型预测跨多个基因组转录目标</gydF4y2Baarticle-title> <source> <italic> 《公共科学图书馆•综合》</我talic> <year> 2007年</gydF4y2Bayear> <volume> 2</gydF4y2Bavolume> <issue> 11</我ssue> <pub-id pub-id-type="other"> 2 - s2.0 - 36048948489</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1371 / journal.pone.0001115</pgydF4y2Baub-id> <pub-id pub-id-type="publisher-id"> e1115</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B15" content-type="article"> <label>15</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Fickett</gydF4y2Basurname> <given-names> j·W。</g我ven-names> </name> </person-group> <article-title> 定量MEF2网站的歧视</gydF4y2Baarticle-title> <source> <italic> 分子和细胞生物学</我talic> <year> 1996年</gydF4y2Bayear> <volume> 16</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 437年</fpgydF4y2Baage> <lpage> 441年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0029655429</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B16" content-type="article"> <label>16</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 弗兰克</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> Makkonen</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> 邓洛普</gydF4y2Basurname> <given-names> t·W。</g我ven-names> </name> <name> <surname> Matilainen</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Vaisanen</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 他本人</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> </person-group> <article-title> 孕烷X受体结合位点的识别基因的监管区域参与胆汁酸体内平衡</gydF4y2Baarticle-title> <source> <italic> 分子生物学杂志</我talic> <year> 2005年</gydF4y2Bayear> <volume> 346年</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 505年</fpgydF4y2Baage> <lpage> 519年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 12544256026</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / j.jmb.2004.12.003</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B17" content-type="article"> <label>17</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Hertzberg</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> Izraeli</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Domany</gydF4y2Basurname> <given-names> E。</g我ven-names> </name> </person-group> <article-title> 站:寻找转录因子使用基因表达主题</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 23</gydF4y2Bavolume> <issue> 14</我ssue> <fpage> 1737年</fpgydF4y2Baage> <lpage> 1743年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 34547866080</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 /生物信息学/ btm249</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B18" content-type="article"> <label>18</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 京ydF4y2Ba</surname> <given-names> v . X。</g我ven-names> </name> <name> <surname> 低浓缩铀</gydF4y2Basurname> <given-names> y W。</g我ven-names> </name> <name> <surname> Liyanarachchi</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 太阳</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> 风扇</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 侄子</gydF4y2Basurname> <given-names> k P。</g我ven-names> </name> <name> <surname> 黄</gydF4y2Basurname> <given-names> t·h·M。</g我ven-names> </name> <name> <surname> Davuluri</gydF4y2Basurname> <given-names> r . V。</g我ven-names> </name> </person-group> <article-title> 确定雌激素受体<我talic> α</我talic>使用集成计算基因组学和目标基因染色质免疫沉淀反应微阵列</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2004年</gydF4y2Bayear> <volume> 32</gydF4y2Bavolume> <issue> 22</我ssue> <fpage> 6627年</fpgydF4y2Baage> <lpage> 6635年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 13544265659</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkh1005</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B19" content-type="article"> <label>19</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Kamalakaran</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Radhakrishnan</gydF4y2Basurname> <given-names> 美国K。</g我ven-names> </name> <name> <surname> 贝克</gydF4y2Basurname> <given-names> w·T。</g我ven-names> </name> </person-group> <article-title> 识别基因过量使用全基因组转录因子结合位点分析的子元素</gydF4y2Baarticle-title> <source> <italic> 生物化学杂志</我talic> <year> 2005年</gydF4y2Bayear> <volume> 280年</gydF4y2Bavolume> <issue> 22</我ssue> <fpage> 21491年</fpgydF4y2Baage> <lpage> 21497年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 20444427206</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1074 / jbc.M409176200</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B20" content-type="article"> <label>20.</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 勒梅</gydF4y2Basurname> <given-names> d·G。</g我ven-names> </name> <name> <surname> 黄</gydF4y2Basurname> <given-names> d . H。</g我ven-names> </name> </person-group> <article-title> 全基因组鉴定过氧物酶体扩散者使用集成响应元素计算基因组学</gydF4y2Baarticle-title> <source> <italic> 脂质研究期刊》的研究</我talic> <year> 2006年</gydF4y2Bayear> <volume> 47</gydF4y2Bavolume> <issue> 7</我ssue> <fpage> 1583年</fpgydF4y2Baage> <lpage> 1587年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33746080426</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1194 / jlr.M500504-JLR200</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B21" content-type="article"> <label>21</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Ostrin</gydF4y2Basurname> <given-names> e . J。</g我ven-names> </name> <name> <surname> 李</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> 霍夫曼</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 王</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 张</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> 学生证</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> 陈</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> </person-group> <article-title> 全基因组的直接目标的识别<我talic> 果蝇</我talic>视网膜测定蛋白质瞎的</gydF4y2Baarticle-title> <source> <italic> 基因组研究</我talic> <year> 2006年</gydF4y2Bayear> <volume> 16</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 466年</fpgydF4y2Baage> <lpage> 476年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33645515900</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1101 / gr.4673006</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B22" content-type="article"> <label>22</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 元</gydF4y2Basurname> <given-names> z . C。</g我ven-names> </name> <name> <surname> 查希尔</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 莫顿</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 菲南</gydF4y2Basurname> <given-names> t M。</g我ven-names> </name> </person-group> <article-title> 基因组预测PhoB监管的推动者<我talic> Sinorhizobium meliloti</我talic>和12个变形菌门</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2006年</gydF4y2Bayear> <volume> 34</gydF4y2Bavolume> <issue> 9</我ssue> <fpage> 2686年</fpgydF4y2Baage> <lpage> 2697年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33744797980</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkl365</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B23" content-type="article"> <label>23</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 马</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> </person-group> <article-title> 影响酵母基因拼接强度的因素</gydF4y2Baarticle-title> <source> <italic> 比较和功能基因组学</我talic> <year> 2011年</gydF4y2Bayear> <volume> 2011年</gydF4y2Bavolume> <lpage> 13</gydF4y2Balpage> <pub-id pub-id-type="publisher-id"> 212146年</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1155 / 2011/2121462012</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B24" content-type="article"> <label>24</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 小林</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> Akitomi</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 藤井裕久</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> 小林</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> Altaf-Ul-Amin</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Kurokawa</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 小笠原群岛</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> Kanaya</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> 整个组织的转录单位<我talic> 枯草芽孢杆菌</我talic>基因组</gydF4y2Baarticle-title> <source> <italic> BMC基因组学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 8日,第197条</gydF4y2Bavolume> <pub-id pub-id-type="other"> 2 - s2.0 - 34447639280</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1186 / 1471-2164-8-197</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B25" content-type="article"> <label>25</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 蒙泰罗</gydF4y2Basurname> <given-names> p . T。</g我ven-names> </name> <name> <surname> 门德斯</gydF4y2Basurname> <given-names> n D。</g我ven-names> </name> <name> <surname> 特谢拉</gydF4y2Basurname> <given-names> m . C。</g我ven-names> </name> <name> <surname> D 'orey</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Tenreiro</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 米拉</gydF4y2Basurname> <given-names> n P。</g我ven-names> </name> <name> <surname> 《国家</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> 旧金山</gydF4y2Basurname> <given-names> 答:P。</g我ven-names> </name> <name> <surname> 卡瓦略</gydF4y2Basurname> <given-names> a . M。</g我ven-names> </name> <name> <surname> Lourenco</gydF4y2Basurname> <given-names> 答:B。</g我ven-names> </name> <name> <surname> Sa-Correia</gydF4y2Basurname> <given-names> 我。</g我ven-names> </name> <name> <surname> 奥利维拉</gydF4y2Basurname> <given-names> 答:我。</g我ven-names> </name> <name> <surname> Freitas</gydF4y2Basurname> <given-names> a . T。</g我ven-names> </name> </person-group> <article-title> YEASTRACT-DISCOVERER:新工具,以改善转录监管协会的分析<我talic> 酿酒酵母</我talic> </article-title> <source> <italic> 核酸的研究</我talic> <year> 2008年</gydF4y2Bayear> <volume> 36</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> D132</fpgydF4y2Baage> <lpage> D136</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 38549135468</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkm976</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B26" content-type="article"> <label>26</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 年轻的</gydF4y2Basurname> <given-names> j . A。</g我ven-names> </name> <name> <surname> 约翰逊</gydF4y2Basurname> <given-names> j . R。</g我ven-names> </name> <name> <surname> Benner</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> 杨ydF4y2Ba</surname> <given-names> 美国F。</g我ven-names> </name> <name> <surname> 陈</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> Le罗氏制药</gydF4y2Basurname> <given-names> k·G。</g我ven-names> </name> <name> <surname> 周</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> Winzeler</gydF4y2Basurname> <given-names> 大肠。</g我ven-names> </name> </person-group> <article-title> 在网上发现的转录调控元件<我talic> 恶性疟原虫</我talic> </article-title> <source> <italic> BMC基因组学</我talic> <year> 2008年</gydF4y2Bayear> <volume> 9日,第70条</gydF4y2Bavolume> <pub-id pub-id-type="other"> 2 - s2.0 - 41049114729</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1186 / 1471-2164-9-70</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B27" content-type="article"> <label>27</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 郑</gydF4y2Basurname> <given-names> c . L。</g我ven-names> </name> <name> <surname> 向冬</gydF4y2Basurname> <given-names> f . U。</g我ven-names> </name> <name> <surname> Gribskov</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 特点和监管元素定义本构拼接和可变剪接在人类和小鼠的不同模式</gydF4y2Baarticle-title> <source> <italic> 核糖核酸</我talic> <year> 2005年</gydF4y2Bayear> <volume> 11</gydF4y2Bavolume> <issue> 12</我ssue> <fpage> 1777年</fpgydF4y2Baage> <lpage> 1787年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 28344452441</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1261 / rna.2660805</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B28" content-type="article"> <label>28</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 杜威</gydF4y2Basurname> <given-names> c . N。</g我ven-names> </name> <name> <surname> 罗戈津</gydF4y2Basurname> <given-names> i B。</g我ven-names> </name> <name> <surname> Koonin</gydF4y2Basurname> <given-names> e . V。</g我ven-names> </name> </person-group> <article-title> 补偿接头地点和其实剪接信号之间的关系取决于脊椎动物内含子的长度</gydF4y2Baarticle-title> <source> <italic> BMC基因组学</我talic> <year> 2006年</gydF4y2Bayear> <volume> 7日,第311条</gydF4y2Bavolume> <pub-id pub-id-type="other"> 2 - s2.0 - 33845895301</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1186 / 1471-2164-7-311</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B29" content-type="article"> <label>29日</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Ben-Gal</gydF4y2Basurname> <given-names> 我。</g我ven-names> </name> <name> <surname> 沙尼</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Gohr</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> 格劳</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> Arviv</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Shmilovici</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Posch</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Grosse</gydF4y2Basurname> <given-names> 我。</g我ven-names> </name> </person-group> <article-title> 转录因子结合位点的识别与variable-order贝叶斯网络</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2005年</gydF4y2Bayear> <volume> 21</gydF4y2Bavolume> <issue> 11</我ssue> <fpage> 2657年</fpgydF4y2Baage> <lpage> 2666年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 20744440509</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 /生物信息学/ bti410</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B30" content-type="article"> <label>30.</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> <name> <surname> Altschul</gydF4y2Basurname> <given-names> 美国F。</g我ven-names> </name> <name> <surname> Boguski</gydF4y2Basurname> <given-names> m . S。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> <name> <surname> Neuwald</gydF4y2Basurname> <given-names> 答:F。</g我ven-names> </name> <name> <surname> 伍</gydF4y2Basurname> <given-names> j . C。</g我ven-names> </name> </person-group> <article-title> 检测的序列信号:吉布斯抽样策略多个对齐</gydF4y2Baarticle-title> <source> <italic> 科学</我talic> <year> 1993年</gydF4y2Bayear> <volume> 262年</gydF4y2Bavolume> <issue> 5131年</我ssue> <fpage> 208年</fpgydF4y2Baage> <lpage> 214年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0027912333</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B31" content-type="article"> <label>31日</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Mannella</gydF4y2Basurname> <given-names> c。</g我ven-names> </name> <name> <surname> Neuwald</gydF4y2Basurname> <given-names> 答:F。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 检测可能跨膜<我talic> β</我talic>海滨地区的毛孔线粒体蛋白质序列使用吉布斯采样器</gydF4y2Baarticle-title> <source> <italic> 杂志的生物能学和生物膜</我talic> <year> 1996年</gydF4y2Bayear> <volume> 28</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 163年</fpgydF4y2Baage> <lpage> 169年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0029971312</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B32" content-type="book"> <label>32</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> </person-group> <source> <italic> 生物信息学和细胞:现代计算方法在基因组学、蛋白质组学、转录组</我talic> <year> 2007年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 施普林格</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B33" content-type="article"> <label>33</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 梁</gydF4y2Basurname> <given-names> k . C。</g我ven-names> </name> <name> <surname> 王</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> Anastassiou</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> </person-group> <article-title> profile-based确定性的序贯蒙特卡罗算法为主题的发现</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2008年</gydF4y2Bayear> <volume> 24</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 46</fpgydF4y2Baage> <lpage> 55</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 37549019305</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 /生物信息学/ btm543</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B34" content-type="article"> <label>34</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 贝利</gydF4y2Basurname> <given-names> t . L。</g我ven-names> </name> <name> <surname> 威廉姆斯</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> Misleh</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> 李</gydF4y2Basurname> <given-names> W·W。</g我ven-names> </name> </person-group> <article-title> MEME:发现和分析DNA和蛋白质序列图案</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2006年</gydF4y2Bayear> <volume> 34</gydF4y2Bavolume> <fpage> W369</fpgydF4y2Baage> <lpage> W373</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33747823564</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkl198</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B35" content-type="article"> <label>35</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 绿色</gydF4y2Basurname> <given-names> j . P。</g我ven-names> </name> </person-group> <article-title> 支持向量机的预测信号肽裂解位点的内核使用一个新类的字符串</gydF4y2Baarticle-title> <source> <italic> 太平洋生物运算研讨会上</我talic> <year> 2002年</gydF4y2Bayear> <fpage> 649年</fpgydF4y2Baage> <lpage> 660年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036366691</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B36" content-type="article"> <label>36</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 华</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 太阳</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> </person-group> <article-title> 支持向量机方法对蛋白质亚细胞定位预测</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2001年</gydF4y2Bayear> <volume> 17</gydF4y2Bavolume> <issue> 8</我ssue> <fpage> 721年</fpgydF4y2Baage> <lpage> 728年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0034843744</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B37" content-type="article"> <label>37</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 虽然早</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Ratsch</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> 米卡</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Scholkopf</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Lengauer</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> 穆勒</gydF4y2Basurname> <given-names> k·R。</g我ven-names> </name> </person-group> <article-title> 工程支持向量机内核承认翻译起始位点</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2000年</gydF4y2Bayear> <volume> 16</gydF4y2Bavolume> <issue> 9</我ssue> <fpage> 799年</fpgydF4y2Baage> <lpage> 807年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0033670134</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B38" content-type="article"> <label>38</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 库马尔</gydF4y2Basurname> <given-names> K·K。</g我ven-names> </name> <name> <surname> Shelokar</gydF4y2Basurname> <given-names> p S。</g我ven-names> </name> </person-group> <article-title> 支持向量机方法使用过敏蛋白的进化信息识别</gydF4y2Baarticle-title> <source> <italic> 信息学手段</我talic> <year> 2008年</gydF4y2Bayear> <volume> 2</gydF4y2Bavolume> <fpage> 253年</fpgydF4y2Baage> <lpage> 256年</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B39" content-type="article"> <label>39</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> “库兹涅佐夫”</gydF4y2Basurname> <given-names> i B。</g我ven-names> </name> <name> <surname> 郭台铭</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> <name> <surname> 李</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 黄</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> 使用进化和结构信息预测dna结合蛋白网站dna结合蛋白质</gydF4y2Baarticle-title> <source> <italic> 蛋白质:结构、功能和遗传学</我talic> <year> 2006年</gydF4y2Bayear> <volume> 64年</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 19</fpgydF4y2Baage> <lpage> 27</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33744817325</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1002 / prot.20977</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B40" content-type="article"> <label>40</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Brumme</gydF4y2Basurname> <given-names> z L。</g我ven-names> </name> <name> <surname> 越南盾</gydF4y2Basurname> <given-names> w·w·Y。</g我ven-names> </name> <name> <surname> 叫喊声</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Wynhoven</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> 霍夫曼</gydF4y2Basurname> <given-names> n G。</g我ven-names> </name> <name> <surname> Swanstrom</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 詹森</gydF4y2Basurname> <given-names> m·A。</g我ven-names> </name> <name> <surname> 马林斯</gydF4y2Basurname> <given-names> j . I。</g我ven-names> </name> <name> <surname> 霍格</gydF4y2Basurname> <given-names> r S。</g我ven-names> </name> <name> <surname> 褐煤</gydF4y2Basurname> <given-names> j·s·G。</g我ven-names> </name> <name> <surname> Harrigan</gydF4y2Basurname> <given-names> p R。</g我ven-names> </name> </person-group> <article-title> 临床和免疫的影响艾滋病信封V3序列变异后开始最初的三重抗逆转录病毒治疗</gydF4y2Baarticle-title> <source> <italic> 艾滋病</我talic> <year> 2004年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> F1</fpgydF4y2Baage> <lpage> F9</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 12144291059</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1097 / 00002030-200403050-00001</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B41" content-type="article"> <label>41</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Chakrabarti</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Lanczycki</gydF4y2Basurname> <given-names> c·J。</g我ven-names> </name> </person-group> <article-title> 分析和预测功能蛋白质的重要网站</gydF4y2Baarticle-title> <source> <italic> 蛋白质科学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 16</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 4</fpgydF4y2Baage> <lpage> 13</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33845924786</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1110 / ps.062506407</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B42" content-type="article"> <label>42</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Delorenzi</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 速度</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> </person-group> <article-title> 一个嗯卷曲螺旋模型域和一个与PSSM-based预测</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2002年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 617年</fpgydF4y2Baage> <lpage> 625年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0035999986</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B43" content-type="article"> <label>43</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 希勒</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 格罗特</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> 舍尔</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 蒙克</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 扬</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> </person-group> <article-title> PrediSi:预测信号肽和乳沟的位置</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2004年</gydF4y2Bayear> <volume> 32</gydF4y2Bavolume> <fpage> W375</fpgydF4y2Baage> <lpage> W379</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 3242878999</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkh378</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B44" content-type="article"> <label>44</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Obenauer</gydF4y2Basurname> <given-names> j . C。</g我ven-names> </name> <name> <surname> 坎特</gydF4y2Basurname> <given-names> l . C。</g我ven-names> </name> <name> <surname> Yaffe</gydF4y2Basurname> <given-names> m B。</g我ven-names> </name> </person-group> <article-title> Scansite 2.0: proteome-wide预测的细胞信号交互使用短序列图案</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2003年</gydF4y2Bayear> <volume> 31日</gydF4y2Bavolume> <issue> 13</我ssue> <fpage> 3635年</fpgydF4y2Baage> <lpage> 3641年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0042622251</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkg584</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B45" content-type="article"> <label>45</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 尼古拉斯</gydF4y2Basurname> <given-names> h . B。</g我ven-names> <suffix> Jr。</gydF4y2Basuffix> </name> <name> <surname> 常ydF4y2Ba</surname> <given-names> 美国年代。</g我ven-names> </name> <name> <surname> Rosenquist</gydF4y2Basurname> <given-names> g . L。</g我ven-names> </name> </person-group> <article-title> 重新评估的酪氨酸硫酸盐化作用的决定因素</gydF4y2Baarticle-title> <source> <italic> 内分泌</我talic> <year> 1999年</gydF4y2Bayear> <volume> 11</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 285年</fpgydF4y2Baage> <lpage> 292年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0033512008</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B46" content-type="article"> <label>46</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 林</gydF4y2Basurname> <given-names> h . C。</g我ven-names> </name> <name> <surname> 蔡</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 常</gydF4y2Basurname> <given-names> b . L。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 年轻的</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 许</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> 路易</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 尼古拉斯</gydF4y2Basurname> <given-names> h . B。</g我ven-names> </name> <name> <surname> Rosenquist</gydF4y2Basurname> <given-names> g . L。</g我ven-names> </name> </person-group> <article-title> 酪氨酸硫酸盐化作用预测网站在动物病毒</gydF4y2Baarticle-title> <source> <italic> 生物化学和生物物理研究通信</我talic> <year> 2003年</gydF4y2Bayear> <volume> 312年</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 1154年</fpgydF4y2Baage> <lpage> 1158年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0344064128</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / j.bbrc.2003.11.047</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B47" content-type="article"> <label>47</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 刘</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 路易</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 许</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> 余</gydF4y2Basurname> <given-names> k . M。</g我ven-names> </name> <name> <surname> 尼古拉斯</gydF4y2Basurname> <given-names> h . B。</g我ven-names> </name> <name> <surname> Rosenquist</gydF4y2Basurname> <given-names> g . L。</g我ven-names> </name> </person-group> <article-title> 在人类趋化因子受体酪氨酸硫酸盐化作用普遍存在重要的肺部疾病</gydF4y2Baarticle-title> <source> <italic> 美国呼吸系统细胞和分子生物学》杂志上</我talic> <year> 2008年</gydF4y2Bayear> <volume> 38</gydF4y2Bavolume> <issue> 6</我ssue> <fpage> 738年</fpgydF4y2Baage> <lpage> 743年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 45249124053</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1165 / rcmb.2007 - 0118摄氏度</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B48" content-type="article"> <label>48</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 余</gydF4y2Basurname> <given-names> k . M。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> Moy</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 林</gydF4y2Basurname> <given-names> h . C。</g我ven-names> </name> <name> <surname> 尼古拉斯</gydF4y2Basurname> <given-names> h . B。</g我ven-names> </name> <name> <surname> Rosenquist</gydF4y2Basurname> <given-names> g . L。</g我ven-names> </name> </person-group> <article-title> 预测seven-transmembrane肽受体的酪氨酸硫酸盐化作用</gydF4y2Baarticle-title> <source> <italic> 内分泌</我talic> <year> 2002年</gydF4y2Bayear> <volume> 19</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 333年</fpgydF4y2Baage> <lpage> 338年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036999414</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1385 / ENDO: 19:3:333</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B49" content-type="article"> <label>49</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 施耐德</gydF4y2Basurname> <given-names> t D。</g我ven-names> </name> <name> <surname> 史蒂芬斯</gydF4y2Basurname> <given-names> r·M。</g我ven-names> </name> </person-group> <article-title> 序列标识:显示共识序列的新方法</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 1990年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 20.</我ssue> <fpage> 6097年</fpgydF4y2Baage> <lpage> 6100年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025008168</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B50" content-type="article"> <label>50</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Gorodkin</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 嘿</gydF4y2Basurname> <given-names> l . J。</g我ven-names> </name> <name> <surname> 椰子饼</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Stormo</gydF4y2Basurname> <given-names> g D。</g我ven-names> </name> </person-group> <article-title> 显示的信息内容结构RNA对齐:结构标识</gydF4y2Baarticle-title> <source> <italic> 计算机应用在生物科学</我talic> <year> 1997年</gydF4y2Bayear> <volume> 13</gydF4y2Bavolume> <issue> 6</我ssue> <fpage> 583年</fpgydF4y2Baage> <lpage> 586年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0031473030</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B51" content-type="article"> <label>51</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 施瓦兹</gydF4y2Basurname> <given-names> s . H。</g我ven-names> </name> <name> <surname> 席尔瓦</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> Burstein</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> <name> <surname> Pupko</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> 小野猫</gydF4y2Basurname> <given-names> E。</g我ven-names> </name> <name> <surname> Ast</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> </person-group> <article-title> 大规模的剪接信号的比较分析及其相应的拼接在真核生物因素</gydF4y2Baarticle-title> <source> <italic> 基因组研究</我talic> <year> 2008年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 88年</fpgydF4y2Baage> <lpage> 103年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 38049029652</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1101 / gr.6818908</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B52" content-type="article"> <label>52</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Sheth</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> 罗卡角</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 黑斯廷斯</gydF4y2Basurname> <given-names> m . L。</g我ven-names> </name> <name> <surname> 罗德</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> 报告中</gydF4y2Basurname> <given-names> a。R。</g我ven-names> </name> <name> <surname> Sachidanandam</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> </person-group> <article-title> 全面的剪切位点使用比较基因组学分析</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2006年</gydF4y2Bayear> <volume> 34</gydF4y2Bavolume> <issue> 14</我ssue> <fpage> 3955年</fpgydF4y2Baage> <lpage> 3967年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 33748581324</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkl556</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B53" content-type="article"> <label>53</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 谢</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> </person-group> <article-title> DAMBE:数据分析软件包的分子生物学与进化</gydF4y2Baarticle-title> <source> <italic> 遗传杂志</我talic> <year> 2001年</gydF4y2Bayear> <volume> 92年</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 371年</fpgydF4y2Baage> <lpage> 373年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0034848170</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B54" content-type="book"> <label>54</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> </person-group> <source> <italic> 分子生物学与进化数据分析</我talic> <year> 2001年</gydF4y2Bayear> <publisher-loc> 波士顿,美国质量</pgydF4y2Baublisher-loc> <publisher-name> Kluwer学术</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B55" content-type="article"> <label>55</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Claverie</gydF4y2Basurname> <given-names> j . M。</g我ven-names> </name> </person-group> <article-title> position-weight矩阵的一些有用的统计特性</gydF4y2Baarticle-title> <source> <italic> 电脑和化学</我talic> <year> 1994年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 287年</fpgydF4y2Baage> <lpage> 294年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0028502095</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B56" content-type="inproceedings"> <label>56</gydF4y2Balabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 布朗</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Hughey</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 克罗</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <etal></etal> </person-group> <article-title> 使用狄利克雷混合先验获得隐马尔可夫模型对蛋白质的家庭</gydF4y2Baarticle-title> <volume> 1</gydF4y2Bavolume> <conf-name> 智能系统的国际会议为分子生物学(ISMB 93)</cgydF4y2Baonf-name> <conf-date> 1993年</cgydF4y2Baonf-date> <fpage> 47</fpgydF4y2Baage> <lpage> 55</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B57" content-type="article"> <label>57</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 锋利的</gydF4y2Basurname> <given-names> p . M。</g我ven-names> </name> <name> <surname> 李</gydF4y2Basurname> <given-names> w·H。</g我ven-names> </name> </person-group> <article-title> 定向同义密码子使用的密码子适应指数测量偏差,及其潜在的应用</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 1987年</gydF4y2Bayear> <volume> 15</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 1281年</fpgydF4y2Baage> <lpage> 1295年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0023650543</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / 15.3.1281</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B58" content-type="article"> <label>58</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> </person-group> <article-title> 一种改进的实现密码子适应指数</gydF4y2Baarticle-title> <source> <italic> 进化的生物信息学</我talic> <year> 2007年</gydF4y2Bayear> <volume> 3</gydF4y2Bavolume> <fpage> 53</fpgydF4y2Baage> <lpage> 58</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B59" content-type="article"> <label>59</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 莱特</gydF4y2Basurname> <given-names> F。</g我ven-names> </name> </person-group> <article-title> 使用的有效数量的密码子的基因</gydF4y2Baarticle-title> <source> <italic> 基因</我talic> <year> 1990年</gydF4y2Bayear> <volume> 87年</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 23</fpgydF4y2Baage> <lpage> 29日</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025318864</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / 0378 - 1119 (90)90491 - 9</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B60" content-type="unpublished"> <label>60</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 太阳</gydF4y2Basurname> <given-names> x Y。</g我ven-names> </name> <name> <surname> 杨</gydF4y2Basurname> <given-names> Q。</g我ven-names> </name> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> </person-group> <article-title> 一种改进的实现有效的密码子的数量(<我talic> N</我talic> <sub>c</gydF4y2Basub>)</gydF4y2Baarticle-title> <comment> <italic> 分子生物学与进化</我talic>。在新闻</cgydF4y2Baomment> <pub-id pub-id-type="doi"> 10.1093 / molbev / mss201</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B61" content-type="article"> <label>61年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 德国造</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 德国造</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> </person-group> <article-title> 随机放松、吉布斯分布和贝叶斯重建图像</gydF4y2Baarticle-title> <source> <italic> IEEE模式分析与机器智能</我talic> <year> 1984年</gydF4y2Bayear> <volume> 6</gydF4y2Bavolume> <issue> 6</我ssue> <fpage> 721年</fpgydF4y2Baage> <lpage> 741年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0021518209</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B62" content-type="book"> <label>62年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Schena</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <source> <italic> 微阵列分析</我talic> <year> 2003年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> Wiley-Liss</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B63" content-type="article"> <label>63年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Schena</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 基因与基因表达微阵列分析</gydF4y2Baarticle-title> <source> <italic> BioEssays</我talic> <year> 1996年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 5</我ssue> <fpage> 427年</fpgydF4y2Baage> <lpage> 431年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0030139470</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B64" content-type="article"> <label>64年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 萨哈</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 火花</gydF4y2Basurname> <given-names> 答:B。</g我ven-names> </name> <name> <surname> Rago</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> Akmaev</gydF4y2Basurname> <given-names> V。</g我ven-names> </name> <name> <surname> 王</gydF4y2Basurname> <given-names> c·J。</g我ven-names> </name> <name> <surname> 福格斯坦</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> 从事</gydF4y2Basurname> <given-names> k W。</g我ven-names> </name> <name> <surname> Velculescu</gydF4y2Basurname> <given-names> 诉E。</g我ven-names> </name> </person-group> <article-title> 使用注释基因组的转录组</gydF4y2Baarticle-title> <source> <italic> 自然生物技术</我talic> <year> 2002年</gydF4y2Bayear> <volume> 20.</gydF4y2Bavolume> <issue> 5</我ssue> <fpage> 508年</fpgydF4y2Baage> <lpage> 512年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036246030</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1038 / nbt0502 - 508</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B65" content-type="article"> <label>65年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Velculescu</gydF4y2Basurname> <given-names> 诉E。</g我ven-names> </name> <name> <surname> 张</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> 福格斯坦</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> 从事</gydF4y2Basurname> <given-names> k W。</g我ven-names> </name> </person-group> <article-title> 基因表达系列分析</gydF4y2Baarticle-title> <source> <italic> 科学</我talic> <year> 1995年</gydF4y2Bayear> <volume> 270年</gydF4y2Bavolume> <issue> 5235年</我ssue> <fpage> 484年</fpgydF4y2Baage> <lpage> 487年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0028789793</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B66" content-type="article"> <label>66年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 马赫</gydF4y2Basurname> <given-names> c。</g我ven-names> </name> <name> <surname> Kumar-Sinha</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> 曹</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> Kalyana-Sundaram</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 汉</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> 京</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 山姆</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> 巴雷特</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> Palanisamy</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> Chinnaiyan</gydF4y2Basurname> <given-names> a . M。</g我ven-names> </name> </person-group> <article-title> 转录组测序检测融合基因在癌症</gydF4y2Baarticle-title> <source> <italic> 自然</我talic> <year> 2009年</gydF4y2Bayear> <volume> 458年</gydF4y2Bavolume> <issue> 7234年</我ssue> <fpage> 97年</fpgydF4y2Baage> <lpage> 101年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 62049085786</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1038 / nature07638</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B67" content-type="article"> <label>67年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Prensner</gydF4y2Basurname> <given-names> j . R。</g我ven-names> </name> <name> <surname> 艾耶</gydF4y2Basurname> <given-names> m·K。</g我ven-names> </name> <name> <surname> Balbin</gydF4y2Basurname> <given-names> o . A。</g我ven-names> </name> <name> <surname> Dhanasekaran</gydF4y2Basurname> <given-names> s M。</g我ven-names> </name> <name> <surname> 曹</gydF4y2Basurname> <given-names> Q。</g我ven-names> </name> <name> <surname> 布伦纳</gydF4y2Basurname> <given-names> j . C。</g我ven-names> </name> <name> <surname> Laxman</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Asangani</gydF4y2Basurname> <given-names> 我一个。</g我ven-names> </name> <name> <surname> 格拉索</gydF4y2Basurname> <given-names> c·S。</g我ven-names> </name> <name> <surname> Kominsky</gydF4y2Basurname> <given-names> h . D。</g我ven-names> </name> <name> <surname> 曹</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 京</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 王</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 西迪基</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 魏</gydF4y2Basurname> <given-names> j . T。</g我ven-names> </name> <name> <surname> 罗宾逊</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> <name> <surname> 艾耶</gydF4y2Basurname> <given-names> h·K。</g我ven-names> </name> <name> <surname> Palanisamy</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> 马赫</gydF4y2Basurname> <given-names> c。</g我ven-names> </name> <name> <surname> Chinnaiyan</gydF4y2Basurname> <given-names> a . M。</g我ven-names> </name> </person-group> <article-title> 转录组测序在前列腺癌组识别PCAT-1,一个未经lincRNA涉及疾病进展</gydF4y2Baarticle-title> <source> <italic> 自然生物技术</我talic> <year> 2011年</gydF4y2Bayear> <volume> 29日</gydF4y2Bavolume> <issue> 8</我ssue> <fpage> 742年</fpgydF4y2Baage> <lpage> 749年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 79961202865</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1038 / nbt.1914</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B68" content-type="article"> <label>68年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 王</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> <name> <surname> 格斯坦</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 斯奈德</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> RNA-Seq:转录组的一个革命性的工具</gydF4y2Baarticle-title> <source> <italic> 自然遗传学评论</我talic> <year> 2009年</gydF4y2Bayear> <volume> 10</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 57</fpgydF4y2Baage> <lpage> 63年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 57749195712</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1038 / nrg2484</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B69" content-type="article"> <label>69年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 夏</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <name> <surname> 麦凯</gydF4y2Basurname> <given-names> V。</g我ven-names> </name> <name> <surname> 姚</gydF4y2Basurname> <given-names> X。</g我ven-names> </name> <etal></etal> </person-group> <article-title> 翻译起始:保利(a)的监管角色大片在8月前密码子<我talic> 酿酒酵母</我talic> </article-title> <source> <italic> 遗传学</我talic> <year> 2011年</gydF4y2Bayear> <volume> 189年</gydF4y2Bavolume> <fpage> 469年</fpgydF4y2Baage> <lpage> 478年</gydF4y2Balpage> <pub-id pub-id-type="doi"> 10.1534 / genetics.111.132068</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B70" content-type="book"> <label>70年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 大都市</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> </person-group> <source> <italic> 的Beginnning蒙特卡罗方法</我talic> <year> 1987年</gydF4y2Bayear> <publisher-name> 洛斯阿拉莫斯国家实验室科学</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B71" content-type="article"> <label>71年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Neuwald</gydF4y2Basurname> <given-names> 答:F。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 吉布斯抽样:主题检测细菌外膜蛋白重复</gydF4y2Baarticle-title> <source> <italic> 蛋白质科学</我talic> <year> 1995年</gydF4y2Bayear> <volume> 4</gydF4y2Bavolume> <issue> 8</我ssue> <fpage> 1618年</fpgydF4y2Baage> <lpage> 1632年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0029144601</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B72" content-type="inproceedings"> <label>72年</gydF4y2Balabel> <nlm-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 曲</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 麦丘</gydF4y2Basurname> <given-names> l。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 贝叶斯蛋白质家族分类器</gydF4y2Baarticle-title> <volume> 6</gydF4y2Bavolume> <conf-name> 智能系统的国际会议为分子生物学(ISMB 98)</cgydF4y2Baonf-name> <conf-date> 1998年</cgydF4y2Baonf-date> <fpage> 131年</fpgydF4y2Baage> <lpage> 139年</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B73" content-type="article"> <label>73年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Samso</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 查克</gydF4y2Basurname> <given-names> m·J。</g我ven-names> </name> <name> <surname> Radermacher</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 贝叶斯方法的分类图像的电子显微图</gydF4y2Baarticle-title> <source> <italic> 结构生物学杂志》上</我talic> <year> 2002年</gydF4y2Bayear> <volume> 138年</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 157年</fpgydF4y2Baage> <lpage> 170年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036420046</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / s1047 - 8477 (02) 00001 - 1</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B74" content-type="article"> <label>74年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 朱</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 贝叶斯自适应序列比对算法</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 1998年</gydF4y2Bayear> <volume> 14</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 25</fpgydF4y2Baage> <lpage> 39</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0031874740</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B75" content-type="article"> <label>75年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 詹森</gydF4y2Basurname> <given-names> j·L。</g我ven-names> </name> <name> <surname> 嗯</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> </person-group> <article-title> 吉布斯采样器统计多个对齐</gydF4y2Baarticle-title> <source> <italic> Statistica中央研究院</我talic> <year> 2005年</gydF4y2Bayear> <volume> 15</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 889年</fpgydF4y2Baage> <lpage> 907年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 30744472934</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B76" content-type="article"> <label>76年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 福尔摩斯</gydF4y2Basurname> <given-names> 我。</g我ven-names> </name> <name> <surname> 布鲁诺</gydF4y2Basurname> <given-names> w·J。</g我ven-names> </name> </person-group> <article-title> 进化摘要:贝叶斯方法多个对齐</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2001年</gydF4y2Bayear> <volume> 17</gydF4y2Bavolume> <issue> 9</我ssue> <fpage> 803年</fpgydF4y2Baage> <lpage> 820年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0034791551</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B77" content-type="article"> <label>77年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Aerts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 范厕所</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> Thijs</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> 迈耶</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> 德马丁</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 男人</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> 德摩尔人</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> </person-group> <article-title> 巨嘴鸟2:广泛的开源工作台监管序列分析</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2005年</gydF4y2Bayear> <volume> 33</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> W393</fpgydF4y2Baage> <lpage> W396</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 23144431920</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gki354</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B78" content-type="article"> <label>78年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Coessens</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Thijs</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> Aerts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Marchal</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> 迪斯美特</gydF4y2Basurname> <given-names> F。</g我ven-names> </name> <name> <surname> Engelen</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> Glenisson</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> 男人</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> 数学</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 德摩尔人</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> </person-group> <article-title> 包容:门户网站和服务注册中心的微阵列和监管序列分析</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2003年</gydF4y2Bayear> <volume> 31日</gydF4y2Bavolume> <issue> 13</我ssue> <fpage> 3468年</fpgydF4y2Baage> <lpage> 3470年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0042622369</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkg615</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B79" content-type="article"> <label>79年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Thijs</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> Marchal</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> Lescot</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Rombauts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 德摩尔人</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Rouze</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> 男人</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> </person-group> <article-title> 吉布斯抽样方法来检测过多图案coexpressed基因的上游地区</gydF4y2Baarticle-title> <source> <italic> 计算生物学杂志》上</我talic> <year> 2002年</gydF4y2Bayear> <volume> 9</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 447年</fpgydF4y2Baage> <lpage> 464年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036108622</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1089 / 10665270252935566</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B80" content-type="article"> <label>80年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Thijs</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> 男人</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> 迪斯美特</gydF4y2Basurname> <given-names> F。</g我ven-names> </name> <name> <surname> 数学</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> Lescot</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Rombauts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Rouze</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> 德摩尔人</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Marchal</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> </person-group> <article-title> 包容:集成的集群,上游序列检索和主题抽样</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2002年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 331年</fpgydF4y2Baage> <lpage> 332年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036191009</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B81" content-type="article"> <label>81年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Thijs</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> Lescot</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> Marchal</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> <name> <surname> Rombauts</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 德摩尔人</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Rouze</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> 男人</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> </person-group> <article-title> 一个高阶的背景模型提高了检测启动子调控元件的吉布斯抽样</gydF4y2Baarticle-title> <source> <italic> 生物信息学</我talic> <year> 2001年</gydF4y2Bayear> <volume> 17</gydF4y2Bavolume> <issue> 12</我ssue> <fpage> 1113年</fpgydF4y2Baage> <lpage> 1122年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0036137323</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B82" content-type="article"> <label>82年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 秦</gydF4y2Basurname> <given-names> z S。</g我ven-names> </name> <name> <surname> 麦丘</gydF4y2Basurname> <given-names> l。</g我ven-names> </name> <name> <surname> 汤普森</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> Mayerhofer</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> </person-group> <article-title> 重新鉴定的基因通过贝叶斯聚类预测监管结合位点</gydF4y2Baarticle-title> <source> <italic> 自然生物技术</我talic> <year> 2003年</gydF4y2Bayear> <volume> 21</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 435年</fpgydF4y2Baage> <lpage> 439年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 12244259677</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1038 / nbt802</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B83" content-type="article"> <label>83年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 汤普森</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> 查克</gydF4y2Basurname> <given-names> m·J。</g我ven-names> </name> <name> <surname> 沃瑟曼</gydF4y2Basurname> <given-names> W·W。</g我ven-names> </name> <name> <surname> 刘</gydF4y2Basurname> <given-names> j·S。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 解码人类管理电路</gydF4y2Baarticle-title> <source> <italic> 基因组研究</我talic> <year> 2004年</gydF4y2Bayear> <volume> 14</gydF4y2Bavolume> <issue> 10</我ssue> <fpage> 1967年</fpgydF4y2Baage> <lpage> 1974年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 6344265848</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1101 / gr.2589004</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B84" content-type="article"> <label>84年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 汤普森</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> Rouchka</gydF4y2Basurname> <given-names> e . C。</g我ven-names> </name> <name> <surname> 劳伦斯</gydF4y2Basurname> <given-names> c, E。</g我ven-names> </name> </person-group> <article-title> 吉布斯采样器递归:发现转录因子结合位点</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 2003年</gydF4y2Bayear> <volume> 31日</gydF4y2Bavolume> <issue> 13</我ssue> <fpage> 3580年</fpgydF4y2Baage> <lpage> 3585年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0043123063</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / gkg608</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B85" content-type="book"> <label>85年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Rouchka</gydF4y2Basurname> <given-names> e . C。</g我ven-names> </name> </person-group> <source> <italic> 吉布斯抽样的简要概述</我talic> <year> 1997年</gydF4y2Bayear> <publisher-name> IBC统计研究小组,华盛顿大学生物医学研究所的计算</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B86" content-type="article"> <label>86年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Kullback</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Leibler</gydF4y2Basurname> <given-names> r。</g我ven-names> </name> </person-group> <article-title> 在信息和充分性</gydF4y2Baarticle-title> <source> <italic> 《数理统计</我talic> <year> 1951年</gydF4y2Bayear> <volume> 22</gydF4y2Bavolume> <fpage> 79年</fpgydF4y2Baage> <lpage> 86年</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B87" content-type="book"> <label>87年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Kullback</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <source> <italic> 信息理论和统计</我talic> <year> 1959年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 约翰•威利父子</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B88" content-type="article"> <label>88年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Kullback</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> Kullback-Leibler距离</gydF4y2Baarticle-title> <source> <italic> 美国统计学家</我talic> <year> 1987年</gydF4y2Bayear> <volume> 41</gydF4y2Bavolume> <fpage> 340年</fpgydF4y2Baage> <lpage> 341年</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B89" content-type="book"> <label>89年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> Bucklew</gydF4y2Basurname> <given-names> j . A。</g我ven-names> </name> </person-group> <source> <italic> 大偏差技术决策、模拟和估算</我talic> <year> 1990年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 约翰•威利父子</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B90" content-type="article"> <label>90年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 西村</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 高桥</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Kuroha</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> Suwabe</gydF4y2Basurname> <given-names> N。</g我ven-names> </name> <name> <surname> Nagasawa</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> 特莱诺尔</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> 山本</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 叫框GATA-1基因造血增强器是一个关键的元素在网络GATA因素和调节基因的网站</gydF4y2Baarticle-title> <source> <italic> 分子和细胞生物学</我talic> <year> 2000年</gydF4y2Bayear> <volume> 20.</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 713年</fpgydF4y2Baage> <lpage> 723年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0033983960</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1128 / mcb.20.2.713 - 723.2000</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B91" content-type="article"> <label>91年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Aird</gydF4y2Basurname> <given-names> w . C。</g我ven-names> </name> <name> <surname> 帕文</gydF4y2Basurname> <given-names> j . D。</g我ven-names> </name> <name> <surname> 锋利的</gydF4y2Basurname> <given-names> p。</g我ven-names> </name> <name> <surname> 罗森博格</gydF4y2Basurname> <given-names> r D。</g我ven-names> </name> </person-group> <article-title> GATA-binding蛋白质之间的相互作用和基底转录因子GATA盒子的核心启动子。组织基因表达的模式</gydF4y2Baarticle-title> <source> <italic> 生物化学杂志</我talic> <year> 1994年</gydF4y2Bayear> <volume> 269年</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 883年</fpgydF4y2Baage> <lpage> 889年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0028009791</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B92" content-type="article"> <label>92年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 方</gydF4y2Basurname> <given-names> t . C。</g我ven-names> </name> <name> <surname> 爱默生</gydF4y2Basurname> <given-names> b . M。</g我ven-names> </name> </person-group> <article-title> erythroid-specific蛋白cGATA-1介导远端增强器通过一个专门的活动<我talic> β</我talic>球蛋白TATA盒</gydF4y2Baarticle-title> <source> <italic> 基因和发展</我talic> <year> 1992年</gydF4y2Bayear> <volume> 6</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 521年</fpgydF4y2Baage> <lpage> 532年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0026608803</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B93" content-type="article"> <label>93年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 莫伊</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> Loudianos</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> Lavinha</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> Murru</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Cossu</gydF4y2Basurname> <given-names> P。</g我ven-names> </name> <name> <surname> Casu</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> Oggiano</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> Longinotti</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> <name> <surname> 曹</gydF4y2Basurname> <given-names> 一个。</g我ven-names> </name> <name> <surname> Pirastu</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> <italic> δ</我talic>地中海贫血是由于一个erythroid-specific结合蛋白序列的突变3′<我talic> δ</我talic>球蛋白基因</gydF4y2Baarticle-title> <source> <italic> 血</我talic> <year> 1992年</gydF4y2Bayear> <volume> 79年</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 512年</fpgydF4y2Baage> <lpage> 516年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0026558458</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B94" content-type="article"> <label>94年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 奥尔金</gydF4y2Basurname> <given-names> s . H。</g我ven-names> </name> </person-group> <article-title> GATA-binding造血细胞的转录因子</gydF4y2Baarticle-title> <source> <italic> 血</我talic> <year> 1992年</gydF4y2Bayear> <volume> 80年</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 575年</fpgydF4y2Baage> <lpage> 581年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0026691333</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B95" content-type="article"> <label>95年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 佐恩</gydF4y2Basurname> <given-names> l . I。</g我ven-names> </name> <name> <surname> Gurish</gydF4y2Basurname> <given-names> m F。</g我ven-names> </name> <name> <surname> 史蒂文斯</gydF4y2Basurname> <given-names> r . L。</g我ven-names> </name> <name> <surname> 马瑟</gydF4y2Basurname> <given-names> C。</g我ven-names> </name> <name> <surname> 雷诺兹</gydF4y2Basurname> <given-names> d S。</g我ven-names> </name> <name> <surname> 奥斯丁</gydF4y2Basurname> <given-names> k . F。</g我ven-names> </name> <name> <surname> 奥尔金</gydF4y2Basurname> <given-names> s . H。</g我ven-names> </name> </person-group> <article-title> GATA-binding在肥大细胞转录因子调节柱状细胞羧肽酶基因的启动子</gydF4y2Baarticle-title> <source> <italic> 生物化学杂志</我talic> <year> 1991年</gydF4y2Bayear> <volume> 266年</gydF4y2Bavolume> <issue> 34</我ssue> <fpage> 22948年</fpgydF4y2Baage> <lpage> 22953年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0026352777</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B96" content-type="article"> <label>96年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 奥尔金</gydF4y2Basurname> <given-names> s . H。</g我ven-names> </name> </person-group> <article-title> 球蛋白基因调控和切换:大约1990年</gydF4y2Baarticle-title> <source> <italic> 细胞</我talic> <year> 1990年</gydF4y2Bayear> <volume> 63年</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 665年</fpgydF4y2Baage> <lpage> 672年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025201279</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / 0092 - 8674 (90)90133 - y</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B97" content-type="article"> <label>97年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 埃文斯</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> Felsenfeld</gydF4y2Basurname> <given-names> G。</g我ven-names> </name> <name> <surname> 莱特曼</gydF4y2Basurname> <given-names> M。</g我ven-names> </name> </person-group> <article-title> 控制球蛋白基因的转录</gydF4y2Baarticle-title> <source> <italic> 细胞生物学的年度审查</我talic> <year> 1990年</gydF4y2Bayear> <volume> 6</gydF4y2Bavolume> <fpage> 95年</fpgydF4y2Baage> <lpage> 124年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025242239</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B98" content-type="article"> <label>98年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 洛瑞</gydF4y2Basurname> <given-names> j . A。</g我ven-names> </name> <name> <surname> Atchley</gydF4y2Basurname> <given-names> w·R。</g我ven-names> </name> </person-group> <article-title> 但GATA转录因子家族的分子进化:保护dna结合域内</gydF4y2Baarticle-title> <source> <italic> 杂志的分子进化</我talic> <year> 2000年</gydF4y2Bayear> <volume> 50</gydF4y2Bavolume> <issue> 2</我ssue> <fpage> 103年</fpgydF4y2Baage> <lpage> 115年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0033944801</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B99" content-type="article"> <label>99年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 车每</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> Devriendt</gydF4y2Basurname> <given-names> K。</g我ven-names> </name> </person-group> <article-title> 转录因子GATA3和人类HDR综合症</gydF4y2Baarticle-title> <source> <italic> 细胞和分子生命科学</我talic> <year> 2001年</gydF4y2Bayear> <volume> 58</gydF4y2Bavolume> <issue> 9</我ssue> <fpage> 1296年</fpgydF4y2Baage> <lpage> 1300年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0034856120</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B100" content-type="article"> <label>One hundred.</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 安德森</gydF4y2Basurname> <given-names> k P。</g我ven-names> </name> <name> <surname> Crable</gydF4y2Basurname> <given-names> s . C。</g我ven-names> </name> <name> <surname> Lingrel</gydF4y2Basurname> <given-names> j·B。</g我ven-names> </name> </person-group> <article-title> 多个蛋白质绑定到一个GATA-E box-GATA主题调节红细胞Kruppel-like因素(EKLF)基因</gydF4y2Baarticle-title> <source> <italic> 生物化学杂志</我talic> <year> 1998年</gydF4y2Bayear> <volume> 273年</gydF4y2Bavolume> <issue> 23</我ssue> <fpage> 14347年</fpgydF4y2Baage> <lpage> 14354年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0032486401</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1074 / jbc.273.23.14347</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B101" content-type="article"> <label>101年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Hiard</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Maree</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 寇尔森</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> Hoskisson</gydF4y2Basurname> <given-names> p。</g我ven-names> </name> <name> <surname> Titgemeyer</gydF4y2Basurname> <given-names> F。</g我ven-names> </name> <name> <surname> 范Wezel</gydF4y2Basurname> <given-names> g . P。</g我ven-names> </name> <name> <surname> 尤里斯。</gydF4y2Basurname> <given-names> B。</g我ven-names> </name> <name> <surname> Wehenkel</gydF4y2Basurname> <given-names> l</g我ven-names> </name> <name> <surname> Sebastien Rigali</gydF4y2Basurname> </name> </person-group> <article-title> PREDetector:新工具来识别监管元素在细菌基因组</gydF4y2Baarticle-title> <source> <italic> 生物化学和生物物理研究通信</我talic> <year> 2007年</gydF4y2Bayear> <volume> 357年</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 861年</fpgydF4y2Baage> <lpage> 864年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 34247893728</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1016 / j.bbrc.2007.03.180</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B102" content-type="article"> <label>102年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 京ydF4y2Ba</surname> <given-names> v . X。</g我ven-names> </name> <name> <surname> O 'Geen</gydF4y2Basurname> <given-names> H。</g我ven-names> </name> <name> <surname> Iyengar</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> <name> <surname> 绿色</gydF4y2Basurname> <given-names> R。</g我ven-names> </name> <name> <surname> 萨利</gydF4y2Basurname> <given-names> p . J。</g我ven-names> </name> </person-group> <article-title> 识别OCT4和SRY监管模块使用集成计算基因组学和实验方法</gydF4y2Baarticle-title> <source> <italic> 基因组研究</我talic> <year> 2007年</gydF4y2Bayear> <volume> 17</gydF4y2Bavolume> <issue> 6</我ssue> <fpage> 807年</fpgydF4y2Baage> <lpage> 817年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 34250369235</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1101 / gr.6006107</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B103" content-type="article"> <label>103年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Benjamini</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> 业务</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> </person-group> <article-title> 控制错误发现率:一种实用和强大的多个测试方法</gydF4y2Baarticle-title> <source> <italic> 皇家统计学会杂志》的系列B</我talic> <year> 1995年</gydF4y2Bayear> <volume> 57</gydF4y2Bavolume> <fpage> 289年</fpgydF4y2Baage> <lpage> 300年</gydF4y2Balpage> </nlm-citation> </ref> <ref id="B104" content-type="article"> <label>104年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Benjamini</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> Yekutieli</gydF4y2Basurname> <given-names> D。</g我ven-names> </name> </person-group> <article-title> 错误发现率的控制下在多个测试依赖</gydF4y2Baarticle-title> <source> <italic> 统计年鉴</我talic> <year> 2001年</gydF4y2Bayear> <volume> 29日</gydF4y2Bavolume> <issue> 4</我ssue> <fpage> 1165年</fpgydF4y2Baage> <lpage> 1188年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0035733108</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1214 /市场/ 1013699998</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B105" content-type="article"> <label>105年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 尼克尔斯</gydF4y2Basurname> <given-names> T。</g我ven-names> </name> <name> <surname> Hayasaka</gydF4y2Basurname> <given-names> 年代。</g我ven-names> </name> </person-group> <article-title> 控制familywise错误率在功能神经成像:比较评估</gydF4y2Baarticle-title> <source> <italic> 医学研究统计方法</我talic> <year> 2003年</gydF4y2Bayear> <volume> 12</gydF4y2Bavolume> <issue> 5</我ssue> <fpage> 419年</fpgydF4y2Baage> <lpage> 446年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0242721216</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1191 / 0962280203 sm341ra</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B106" content-type="article"> <label>106年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 通用电气</gydF4y2Basurname> <given-names> Y。</g我ven-names> </name> <name> <surname> Sealfon</gydF4y2Basurname> <given-names> s . C。</g我ven-names> </name> <name> <surname> 速度</gydF4y2Basurname> <given-names> t P。</g我ven-names> </name> </person-group> <article-title> 某些降压过程控制下的错误发现率依赖</gydF4y2Baarticle-title> <source> <italic> Statistica中央研究院</我talic> <year> 2008年</gydF4y2Bayear> <volume> 18</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 881年</fpgydF4y2Baage> <lpage> 904年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 55349093320</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B107" content-type="book"> <label>107年</gydF4y2Balabel> <nlm-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 甘力克</gydF4y2Basurname> <given-names> e . J。</g我ven-names> </name> </person-group> <source> <italic> 极端的统计数据</我talic> <year> 1958年</gydF4y2Bayear> <publisher-loc> 纽约,纽约,美国</pgydF4y2Baublisher-loc> <publisher-name> 哥伦比亚大学出版社</pgydF4y2Baublisher-name> </nlm-citation> </ref> <ref id="B108" content-type="article"> <label>108年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Altschul</gydF4y2Basurname> <given-names> 美国F。</g我ven-names> </name> <name> <surname> 吉什</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> 米勒</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> 迈尔斯</gydF4y2Basurname> <given-names> e·W。</g我ven-names> </name> <name> <surname> Lipman</gydF4y2Basurname> <given-names> d . J。</g我ven-names> </name> </person-group> <article-title> 基本的局部比对搜索工具</gydF4y2Baarticle-title> <source> <italic> 分子生物学杂志</我talic> <year> 1990年</gydF4y2Bayear> <volume> 215年</gydF4y2Bavolume> <issue> 3</我ssue> <fpage> 403年</fpgydF4y2Baage> <lpage> 410年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0025183708</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1006 / jmbi.1990.9999</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B109" content-type="article"> <label>109年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Altschul</gydF4y2Basurname> <given-names> 美国F。</g我ven-names> </name> <name> <surname> 马登</gydF4y2Basurname> <given-names> t . L。</g我ven-names> </name> <name> <surname> 谢弗</gydF4y2Basurname> <given-names> 答:一个。</g我ven-names> </name> <name> <surname> 张</gydF4y2Basurname> <given-names> J。</g我ven-names> </name> <name> <surname> 张</gydF4y2Basurname> <given-names> Z。</g我ven-names> </name> <name> <surname> 米勒</gydF4y2Basurname> <given-names> W。</g我ven-names> </name> <name> <surname> Lipman</gydF4y2Basurname> <given-names> d . J。</g我ven-names> </name> </person-group> <article-title> 有缺口的爆炸和PSI-BLAST:新一代的蛋白质数据库搜索程序</gydF4y2Baarticle-title> <source> <italic> 核酸的研究</我talic> <year> 1997年</gydF4y2Bayear> <volume> 25</gydF4y2Bavolume> <issue> 17</我ssue> <fpage> 3389年</fpgydF4y2Baage> <lpage> 3402年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0030801002</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1093 / nar / 25.17.3389</pgydF4y2Baub-id> </nlm-citation> </ref> <ref id="B110" content-type="article"> <label>110年</gydF4y2Balabel> <nlm-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 皮尔森</gydF4y2Basurname> <given-names> w·R。</g我ven-names> </name> </person-group> <article-title> 经验统计估计序列相似性搜索</gydF4y2Baarticle-title> <source> <italic> 分子生物学杂志</我talic> <year> 1998年</gydF4y2Bayear> <volume> 276年</gydF4y2Bavolume> <issue> 1</我ssue> <fpage> 71年</fpgydF4y2Baage> <lpage> 84年</gydF4y2Balpage> <pub-id pub-id-type="other"> 2 - s2.0 - 0032512799</pgydF4y2Baub-id> <pub-id pub-id-type="doi"> 10.1006 / jmbi.1997.1525</pgydF4y2Baub-id> </nlm-citation> </ref> </ref-list> </back> </article> </body> </html>