Monte Carlo simulations."> 一种非参数寻峰算法及其在寻找新物理中的应用 - raybet雷竞app,雷竞技官网下载,雷电竞下载苹果

高能量物理学的进展

高能量物理学的进展/2013年/文章
特殊的问题

高能物理的计算方法

查看此特殊问题

研究文章|开放访问

体积 2013年 |文章ID. 162986 | https://doi.org/10.1155/2013/162986

S. V. Chekanov,M. Erickson 一种非参数寻峰算法及其在寻找新物理中的应用“,高能量物理学的进展 卷。2013年 文章ID.162986 4. 页面 2013年 https://doi.org/10.1155/2013/162986

一种非参数寻峰算法及其在寻找新物理中的应用

学术编辑器:穆罕默德Bektasoglu
收到了 2013年9月13日
公认 2013年12月06
发表 2013年12月29日

摘要

在存在统计和系统的不确定因素存在下,我们开发了一种用于非参数拟合和提取统计上显着峰的算法。讨论了该算法对高能碰撞数据分析的应用。特别是,我们说明了如何在不变 - 质谱中使用该算法在不变质量谱中搜索新物理学 蒙特卡罗模拟。

1.介绍

在大型强子对撞机中,寻找粒子谱峰是一项越来越受欢迎的任务,该对撞机专注于tev尺度以外的新物理。Bump搜索可以在单粒子(例如 分布)或不变质谱。例如,搜索新颗粒衰减成双体最终状态(喷射喷射,γ-γ等)和多体衰减通常通过检查不变质量的最终状态对象(喷射器,Leptons,缺失横向动量)来完成, 等等。)。例如,假设七个识别的颗粒(喷射,光子,电子,μONs,Taus, - 博纳斯,缺失 ),可以对父母颗粒衰减成2,3或4个子颗粒来进行搜索。这导致322个独特的女儿团体。因此,分析这种不变质量组合的任务变得相当乏味且难以处理。考虑到扫描许多频道的“盲”分析技术[1[任何切割变化是否增加了需要研究的信道的数量。最后,对于新的Reronic共振结合曲目的自动搜索存在类似的挑战[2].

找到颠簸的任务最终与使用理论或已知横截面确定正确的背景形状的任务。然而,一个理论在感兴趣的区域中可能是不确定的,难以用于背景模拟,或者完全不存在。即使对于简单的喷射射流不变质量,也可以找到一个分析背景功能,适合跨越跨越许多订单的QCD驱动的背景,并且可用于提取由于新物理学而提取过量的事件需要仔细检查。在CMS中讨论了适合两次喷射和三次喷射不变质量的尝试[3.4.]及ATLAS [5.[论文;虽然两个实验已经使用初始低统计数据达到了这种配合的必要精度,但是使用的分析功能相当不同并且具有许多自由参数。考虑到多个频道(不变质量分布)具有各种剪切或检测器选择标准(如 - 标记)。每个这样的信道需要仔细选择用于背景适合的分析功能,并在确定期望平滑的背景形状时对非线性回归收敛的初始值的调整。在其他地方讨论了一种全自动地搜索新物理学的方法[6.].

一种技术上有吸引力的方法是找到一种非参数的方法来提取统计上显著的峰值先天的对背景形状的假设。这种方法在很多领域都很流行,从图像处理到金融市场的研究,典型的峰值识别任务被简化为数据平滑,以创建一个试图近似背景的函数。平滑可以使用移动平均[7.],洛杉矶[8.]和样条曲线[9.]算法。与平滑分布的统计学显着的偏差可以被认为是峰。这种技术肯定适用于峰提取,但它不追求峰值鉴定的目标,正确治疗统计(或系统)的不确定性。后来可以是不对称的。

最近的高峰搜索方法的高能物理应用已发展为研究 射线光谱,通常感兴趣的特征是光峰的能量和强度。已经发展了几种技术,如基于最小二乘的技术[10.,用最小二乘拟合的第二差值[11.],傅里叶变换[12.],马尔可夫链[13.]和卷积[14.],(只是命名几个)。虽然这种方法非常适合计数型可观察,但它们通常专注于小而经常平坦的背景上的狭窄峰。

例如,根分析框架[15.用于高能量物理学中的含有TSPECTRUM一种基于包平滑方法开发的 -ray spectra [14.].后者通常在平滑的背景上有狭窄的山峰。该算法在寻找尖锐的峰是有效的,而检测宽峰需要可视化的检查数据,以调整该工具的几个自由参数。因此,这种方法不适用于完全自动的峰值搜索。此外,数据点的系统不确定性不容易纳入这种方法。

在高能碰撞中,典型的标准模型背景分布具有跨越多个数量级的下降形状。一个典型的例子是用于新粒子搜索的喷射-喷射不变质量[3.5.].对于这种光谱,最有趣的区域是指数抑制的分布的尾部,其中新的高度 - 物理学可能会出现。这意味着根据相空间区域的不同,对统计噪声应该有不同的阈值,因此,对统计和系统不确定性的正确处理是必须的。不像 射线能谱中峰是相当普遍的,并有各种分类技术,而高能量碰撞中的峰是相当罕见的。因此,在开发高能物理应用的非参数拟合技术方面取得的进展相对较小。在高能物理应用中,峰的观测通常是寻找新物理的一个主题,而不是峰的分类目的。

以上的讨论导致了需要一种非参数的背景估计方法和峰值提取机制,这可以适用于高能碰撞分布,如不变质量。该算法应该能够考虑到输入分布的离散性及其不确定性。与平滑方法(如在ROOT [14.15.),因为它只使用一个空闲参数。此外,它可以考虑数据点上的系统不确定性(可能是不对称的),从而可以估计存在系统不确定性时可能峰值的统计意义。

非参数峰峰发现器算法

由于上面讨论的原因,使用数值迭代方法开发了称为非参数峰发现器(NPFinder)的程序,以检测事件计数分布中的统计上显着的峰。简而言之,NPFinder通过输入直方图的区间迭代,并且仅使用一个灵敏度参数,确定可能峰的位置和统计显着性。与已知的平滑算法不同,该方法的主要焦点不是如何平滑数据,然后提取峰值,而是如何通过比较相邻点来提取峰值,然后调用剩余的“背景”。下面我们讨论了该算法的主要元素,然后我们说明并讨论了其限制和可能的改进。

对于每一点 在直方图中,一阶导数 考虑到可能(统计或/和系统)的不确定性。这是通过计算两点之间的坡度来完成的,包括其实验不确定性:如果点 低于点 ,使用较高误差,如果点 高于点 ,采用较低的误差不确定度。这样做是为了始终处于保守的一边,同时减少统计噪声。数学上,这可以写成 在哪里不确定性 用负面标志拍摄 否则有正标志。不确定性可能不需要对称,但是为了简单起见,我们假设它们是对称的,因为这通常是不确定性统计性质的情况。衍生物的平均计算任何给定位置的运行平均值 如果本地衍生物满足,则算法触发了峰值的开头 在哪里 是一个反映(未知)峰值斜率的自由阳性参数。该参数应经验上发现,我们将低于其价值的可能范围。当上述条件为真时,NPFinder注册可能的峰值并开始将下一个点分类为峰的一部分。运行的平均等式(2)不会对属于一个可能的峰值的点进行累积。 是唯一的免费参数,它指定了峰值查找的灵敏度。该参数应随着对峰的敏感性的增加而减小(并且可能会增加对统计波动的敏感性)。

NPFinder继续走过数据点,直到 都是负面的,这表示已经达到了最大峰的最大值。双重状况(3.)用于加强峰值搜索的鲁棒性。当满足此条件时,NPFinder退出峰值,并从峰中心向右侧添加相同数量的点。具有相同数量的点的要求意味着预期峰值是对称的,这是最常见的情况。对于陡峭的下降分布,例如横向动态光谱或Dijet质量分布,这种假设通常意味着我们有点低估了峰值意义。数字1说明了用于下降不变质量分布的NPFinder算法。分布的每个点可以具有上下统计(或系统)的不确定性。

在检测所有峰候选后,NPFinder通过可能的峰列表迭代,以便为每个峰形成背景。这是通过在峰值中的第一和最后一个点之间执行线性回归来实现的,即应用该功能 , 在哪里 是线性回归的斜率和截距,在这种情况下,这在这种情况下是相当琐碎的,因为它仅通过两点执行。应该注意的是,还考虑到不确定因素的线性回归: 在哪里 是峰的第一点, 是峰的最后一点,和 它们分别是统计的不确定性。这里添加了统计不确定性,以始终在峰值下的背景水平估计的保守方面。然后拦截参数是

应该提到的是,上面考虑的峰值发现的技术有点类似于讨论的 -Ray应用[11.].但是NPFinder与这个算法有几个重要的区别:NPFinder可以检测任意形状的峰(不仅仅是高斯形状的峰,如[11.]),没有使用拟合或平滑程序,并且在峰值发现过程中包括数据点的统计和系统的不确定性。算法[11.]由于其源代码不公开,未进行测试。

最后,NPFinder使用背景点来计算给定直方图中每个峰值的统计意义。这是通过总结差异来实现的 峰值中的原始点相对于计算的背景点,然后通过自己的平方根划分这个值。对于给定的峰值,可以近似 总和在峰值中的所有点运行。该算法在输入直方图或图形上运行,构建峰值列表,并估计其统计学意义。这种方法中典型的统计学显着的峰值具有 .通常忽略第一峰,因为它对应于背景分布的运动峰。

下面我们通过生成完全包含的方法来说明上述方法 使用Pythia生成器的碰撞事件[16.].所需的集成光度为200 pb-1.喷流用反射流重构 算法 [17.]使用切割0.6的距离参数  GeV. Then, the dijet invariant-mass distribution is calculated and the NPFinder finder is applied using the parameter .不出所料,无峰带 被发现。

接下来,使用具有不同峰值位置和宽度的高斯分布产生一些假峰。将峰值添加到原始背景直方图中。数字2显示了一个在1000 GeV (20 GeV宽度,200000事件),1500 GeV (50 GeV宽度,30000事件)和2800 GeV (40 GeV宽度,1200事件)产生3个峰值的例子。该算法找到了所有的三个峰,并给出了正确的估计其位置,宽度,和近似的统计意义使用输入参数

为了进行比较,使用相同的分布来测试TSPECTRUM介绍中讨论的根计划包。结果发现了PECTRUM还可以检测此类峰值,但是,已经需要对数据进行视觉检查的几次迭代来调整该算法的自由参数, (搜索峰的有效Sigma),以及预期峰的幅度。在第一个TS之后PECTRUM通过,需要额外的分析拟合来确定每个峰的统计学意义。发现这种方法难以在全自动峰搜索中实现。

需要注意的是,所提出的非参数方法的峰值统计显著性可能小于使用传统方法计算的峰值统计显著性,如基于a 在适当的背景和信号功能最小化。这可以是由于提取峰的对称形式的假设,峰下的背景的线性近似,以及在峰值显着计算中结合不确定性的方式。实验分辨率的影响也可能是一个问题[18.],只能通过正确识别的信号和背景功能来解决。对于图中所示的最高质量峰来说,这种缺点尤其很好地看到2与峰值右侧的统计波动拉动背景水平,与预期的下降形状相比。鉴于统计显着性计算的近似性质,该计算仅用于触发需要更详细地研究发现峰值的分析仪的分析仪的关注,发现算法的性能是合理的。

需要注意的是,峰值宽度和输入参数之间存在相关性 :检测更宽的峰值通常需要更小的值 (低至0.2)。

总之,我们开发了一种峰值检测算法,它可以用于提取事件计数分布中统计上显著的峰值,考虑到统计(和潜在的系统)不确定性。该方法可用于高能粒子实验中的新物理搜索,在这些实验中,正确处理此类不确定性是最重要的问题之一。非参数寻峰器只有一个自由参数,与输入背景分布无关。该算法经过测试,表现良好。代码在Python编程语言中实现,图形输出使用ROOT (c++) [15.或scavis(java)[19.].代码示例可供下载[20.].

致谢

作者希望感谢J. Housfoot进行讨论和评论。提交的文件是由奥金翁国家实验室(Argonne)的普罗科尼克·艾古恩,LLC创建的。Argonne,美国能源部能源办公室,在合同中运营。DE-AC02-06CH11357。

参考文献

  1. G. Choudalakis,在垓电子加速器中对新物理的模型独立探索。论文),2008年,http://arxiv.org/abs/0805.3954
  2. S. Chekanov,“用于自动搜索和识别共振的C ++框架”Hera和LHC的诉讼程序:关于HERA对LHC物理影响的影响的研讨会,B部分,Cern-2005-014,desyproc-2005-01,p。624,2005。视图:谷歌学术
  3. V.Khachatryan,A.M. Sirunyan,A.Tumasyan等,“在7 Tev搜索Dijet共振PP.CMS的碰撞,“物理评论快报,卷。105,没有。21,图211801,14页,2010年。视图:出版商网站|谷歌学术
  4. S. Chatrchyan,V.Khachatryan,A. M. Sirunyan等,“搜索三次喷射共振PP.碰撞 S. = 7.  TeV,”物理评论快报,卷。107,没有。10,图101801,15页,2011年。视图:出版商网站|谷歌学术
  5. G. AAD,B. Abbott,J.Abdallah等,“在PP碰撞中寻找Dijet质量和角度分布的新物理学 S. = 7. TeV是用ATLAS探测器测量的。”新物理杂志第13卷,没有。5、文章ID 053044, 2011。视图:出版商网站|谷歌学术
  6. T.Aaltonen,J. Adelman,T.Akimoto等,“全球搜索2.0 FB的新物理-1在CDF,“物理评论D.,卷。79,没有。1,文章ID 011101(R),9页,2009。视图:出版商网站|谷歌学术
  7. E. S. Kenney,数学统计,第1部分,第3版,1962年。
  8. W. S.克利夫兰,“强大的当地加权回归和平滑的散点图”,美国统计协会杂志,卷。74,没有。368,pp。829-836,1979。视图:出版商网站|谷歌学术|Zentralblatt Math.|Mathscinet.
  9. 勋伯格,“解析函数A和B部分对等距数据近似问题的贡献”,应用数学季度,卷。4,pp。45-99,112-141,1946。视图:谷歌学术
  10. F.C.P.Huang,C.H. Osman和T. R. Ophel,用GE(Li)探测器获得的光谱线形状分析“核工具和方法,第68卷,不。第141-148页,1969年。视图:谷歌学术
  11. M. Mariscotti,“在存在背景下自动识别峰的方法及其应用于频谱分析”​​,“核工具和方法第50卷,没有。2, pp. 309-320, 1967。视图:出版商网站|谷歌学术
  12. K.J.Blinowska和E. F. Wessner,“通过采用傅里叶变换的小型计算机,”一种在线谱评估的方法“核工具和方法,卷。118,没有。2,pp。597-604,1974。视图:谷歌学术
  13. Z.K.Silagadze,“自动photopak搜索的新算法”,物理研究中的核仪器和方法,卷。376,没有。3,第451-454,1996。视图:出版商网站|谷歌学术
  14. M.Morháč,J.Kliman,V.MATOUŠEK,M.Veselský,我是Turzo,“鉴定多维巧合的峰值γ-REART Spectra,“物理研究中的核仪器和方法,卷。443,没有。1,pp。108-125,2000。视图:出版商网站|谷歌学术
  15. I. Antcheva, M. Ballintijn, B. Bellenot等人,“root -一个用于pb数据存储、统计分析和可视化的c++框架,”计算机物理通信第180卷,没有。12,页2499-2512,2009。视图:出版商网站|谷歌学术
  16. T. Sjostrand,S. Mrenna和P. Z. Skands,“Pythia 6.4物理和手册”高能物理学报, 2006年第2期。2006年第26条。视图:出版商网站|谷歌学术
  17. M.Cacciari,G.P. Salam和G. Soyez,“抗辩kt喷气式聚类算法,“高能物理学报,卷。2008年,没有。4,第63号,2008年。视图:出版商网站|谷歌学术
  18. S. V. Chekanov和B.B.Levchenko,“实验分辨率对信号统计显着性的影响:对Pentaquark搜索的含义”,“物理评论D.,卷。76,没有。7,物品ID 074025,7页,2007。视图:出版商网站|谷歌学术
  19. S. Chekanov,使用Jython脚本和Java进行科学数据分析,春天,伦敦,英国,2010年,http://jwork.org/scavis/
  20. M. Erickson和S. Chekanov,“非参数峰发现算法”,http://atlaswww.hep.anl.gov/asc/packages/NPFinder/视图:谷歌学术

版权所有©2013 S.V. Chekanov和M. Erickson。这是分布下的开放式访问文章创意公共归因许可证,允许在任何媒介上不受限制地使用、分发和复制,只要原稿被适当引用。


更多相关文章

PDF. 下载引用 引文
下载其他格式更多的
订单印刷副本订单
意见2843
下载815.
引用

相关文章