数学杂志

在这一页上

文摘介绍预赛结论数据可用性的利益冲突引用版权相关文章

研究文章|开放获取

体积2021年| 文章的ID7660113| https://doi.org/10.1155/2021/7660113

使用随机梯度估计的条件概率的过程

阿里Labriji ,¹ Abdelkrim Bennar,¹ 和Mostafa Rachik ¹

学术编辑器: 芭芭拉Martinucci

收到了 2021年8月22日

修改后的 2021年11月03

接受 2021年11月13日

发表 2021年12月06

文摘

条件概率的使用越来越受欢迎各领域如医学、金融和成像处理。这发生尤其是大型数据集的可用性,使我们能够提取可用的全部潜能的估计算法。然而,如此大量的数据往往伴随着一个重要的需要计算能力以及随之而来的编译时间。在本文中,我们提出一个低成本的估算方法:我们首先证明分析方法的收敛所需的概率,然后我们进行仿真来支持我们的观点。

1。介绍

一个事件的可能性会知道事件吗已经发生称为条件概率,用吗或。例如,如果一个卡是随机从甲板,有四分之一的机会得到一个心套装,但是如果一个红色反射看到桌子上,现在有一个两个的概率。如果事件一个和B有非零概率,那么贝叶斯定理州吗。这是科学的一部分,但在日常生活中也各领域条件概率是有用的,甚至获得越来越多的利益。例如,银行估计违约概率的借款人或债券发行人使用条件概率评估方法基于新巴塞尔协议规定(见[1]的更多信息)。这个概率的估计是至关重要的,因为它允许银行计算预期的损失和因此的后果。条件概率的估计是另一个领域重要的是营销,它是用来估计一个客户的利益在一个给定的产品或服务。因此,他们能够专注于最具吸引力的人口为了优化营销成本(2]。这个概率的估计也经常用于医学领域,作为医生需要估计病人的可能性受到特定疾病的影响基于症状的病人的礼物(3)和更多的领域,如药物发现,计算机视觉、语音识别、手写识别、生物特征识别、文档分类、网络搜索引擎、模式识别、和推荐系统4- - - - - -11]。

在实践中,我们分为两类条件概率估计方法,可分为线性和非线性分类器。线性分类器可以分为两个子分类,生成和歧视模型(12,13),最常用的是(我)Fisher线性判别(2)逻辑回归(3)朴素贝叶斯分类器

非线性分类器可以分为以下的方法:(我)线性分类器和转换数据,如连续变量离散化(2)支持向量机(3)二次分类器(iv)再(v)决策树(vi)神经网络(七)学习矢量量化

更多地了解这些不同的算法,看到14- - - - - -20.]。

让我们考虑一个可观测的随机二进制变量和一个随机变量。我们定义这样

我们愿意估计向量这样的条件概率写在表单:

我们正在寻找一个简单的参数估计方法不会那么苛刻的计算能力。这是特别有用,在大数据时代,可以大规模数据集和任何常见的迭代估计可以花很多时间。为此,我们使用随机近似,它引入了1951年赫伯特·罗宾斯和萨顿孟氏[21]。目标是找到独特的根的一个函数 ,而不能直接观测到。然而,我们认为我们可以观察到一个变量这样。根据(21),存在一个序列满足等过程定义为收敛于独特的根。在我们的例子中,我们从Bennar等的工作。22)建立了几近收敛条件,以及随机梯度的二次平均收敛的过程的参数让我们的估计。在这里,我们感兴趣的是二进制随机变量的情况下,在什么地方相当于 ,我们可以看到在下面:

我们也选择了这些结果作为我们工作的基础,因为随机梯度过程在每次迭代中进行抽样,以达到估计不依赖所有可用的数据。

在本文中,我们首先呈现收敛结果阐述了Bennar et al .,然后显示这些结果也有效估计的框架条件概率。我们也提出一个模拟强调结果,最后,我们结束我们的工作,解决发展的观点。

2。预赛

让我们考虑一个可观测的随机变量和一个随机变量 ,都有价值法律的。我们试图估计参数在这样方法在最小二乘意义上。还应该指出的是,逻辑回归的参数估计的最小二乘已经通过迭代加权最小二乘方法(23),与我们的目的不同,重和拥有巨大的计算能力的大型数据集。

让是真正的积极函数中定义通过我们正在寻找的价值最小化函数。

让我们定义真正的积极作用在通过

我们有因此,问题降低了寻找最小化函数。我们有

估计在顺序的方式,我们使用一个随机梯度算法。我们考虑一个随机在定义为与(我) 是一个正实数序列(2) 是独立的随机变量的样本夫妇相同的概率法 (3) 是一个真正的已知的可测函数

在接下来的缩写意味着几乎收敛二次平均收敛。

2.1。几近收敛

Bennar等人考虑过以下假设: , , :存在和这样对所有 , :存在这样对所有 , 是一个局部最小值的 : 独特的平稳点吗 :

引理1。在假设下 ,我们有

证明。参见[22]。

2.2。二次平均收敛

Bennar等人考虑过以下假设: 和一致有界的和。 :存在两个真正的积极功能和中定义的这样 , 是一个真正的随机变量有界的。

引理2。在假设下 ,我们有

证明。参见[22]。

3所示。应用程序

3.1。证明过程收敛

让我们假设是的功能可衡量的实际变量。我们注意到

为了评估的价值,最大限度地减少 ,我们考虑以下随机逼近的过程在定义为与在哪里是一个样本形成独立随机变量和的分布相同。

我们假设以下主张: 观察到在一个有限的方式是一个随机变量,这样

定理3。在假设下 ,我们有

证明。让是真正的功能定义为让我们证明了假设3是正确的。
我们有为 ,我们有因此,对于 ,我们有随着观察到在一个有限的方式,然后呢然后,存在这样对所有 , 让我们证明假设6是正确的。
我们有与 ;
然后, 和 ,由于观察到在一个有限的方式,那么存在呢这样对所有和 , 。然后, 和一致有界的和。
7让我们证明的假设是正确的。为此,我们使用下面的结果。

引理4(平均值不等式)。让和是两个真正的赋范矢量空间,一个开放的 ,和一个可微的应用程序。对于任何一个段包含在 ,我们有任何时候,在哪里的 , 微分算子范数的吗点。

证明。参见[24),31页。
然后,存在两个真正的积极功能和中定义的这样
, 让我们证明 ,和。
我们已经看到这一点由于
观察到在一个有限的方式呢。
此外,我们有 ,然后 ,由于观察到在一个有限的方式呢。
此外,由于是一个二进制随机变量,然后假设8是正确的。
然后,假设下 ,我们有

3.2。模拟

为了说明我们的工作,我们进行一个模拟中我们估计一个逻辑回归的不同参数。我们的模拟使用的编程语言执行”R。“我们模拟观测的随机变量 ,我们定义这样与 ,为了避免一个完美的拟合模型。然后,我们安装与费舍尔得分古典逻辑回归算法,融合在12次迭代。我们定义正确的数量分类的准确率观察在我们的观察的总数,和经典模型的精度90.34%。表1显示所有剩余的模型的输出。

关于提议的过程中,我们开始以下随机选择的值, ,我们选择 ;作为和是有限的,我们可以看到这个假设验证,我们还随机画一个观察的样本进行我们在每次迭代的计算。最后,我们也设立了一个精度。模拟后,得到的结果如下。

通过数据我们可以看到1和2,以及人物3,聚集在10的迭代过程。因此,我们只需要10个样本的观察获得稳健估计的系数。此外,我们可以看到在图3在总结的过程中,在表2,后者记录预测精度的模拟观测的89%,因此损失1%的准确性,但是,作为回报,我们的计算能力大大增强。

4所示。结论

在这项工作中,我们证明了收敛过程的研究对值函数最小化 ,后我们的模拟,我们可以看到,这个理论结果也是有效的在经验层面上。然而,这个模拟要求我们任意设定一个起点,可能导致收敛速度慢的过程在远离目标的情况下,初始点是价值。此外,收敛速度也大大影响的选择。因此,一个可能的改进将是找到最优序列提供最快的收敛。

数据可用性

没有数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突。

引用

巴塞尔银行监管委员会,咨询文档“基于内部评级方法”支持文档巴塞尔新资本协议的公布:2001 - 01瑞士巴塞尔,巴塞尔银行监管委员会,2001年。
r·米歇尔。Schnakenburg, t·冯·马顿斯”有效的客户选择营销活动基于净得分,”互动营销研究杂志》上,11卷,不。1,2017。
视图: 出版商的网站 | 谷歌学术搜索
w·d·s·w·Ho Schierding, m .后r . Saffery j . O ' sullivan,“基于机器学习的SNP的预测精度医学”,遗传学前沿,10卷,p。267年,2019年。
视图: 出版商的网站 | 谷歌学术搜索
r·亚伯s Mondal c . et al。”加速药物发现通过分子设计和预测评分紧密集成的专家,”当前结构生物学的观点,43卷,38-44,2017页。
视图: 出版商的网站 | 谷歌学术搜索
p . Hu d . Cai a姚明,s . Wang和y . Chen”学习监督得分整体情感识别在野外,”19 ACM国际会议的程序多通道交互格拉斯哥,页553 - 560年,英国,2017年11月。
视图: 谷歌学术搜索
y . j . Shin李和k·荣格,“有效的语音识别,使用伯特句子评分法”机器学习亚洲会议PMLR,页1081 - 1093年,名古屋,日本,2019年10月。
视图: 谷歌学术搜索
j . Calvo-Zaragoza a . h . Toselli和e·维达尔,“概率music-symbol发现手写的分数,”学报》2018年16前沿国际会议上手写识别(ICFHR)IEEE,页558 - 563年,尼亚加拉大瀑布,纽约,美国,2018年8月。
视图: 出版商的网站 | 谷歌学术搜索
a . Abozaid a . Haggag h . Kasban, m . Eltokhy“多通道生物对人类身份验证技术方案基于语音和面部识别融合,“多媒体工具和应用程序,卷78,不。12日,第16361 - 16345页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
r s Perdana和a . Pinandito”结合likes-retweet分析和朴素贝叶斯分类器在微博情感分析,“《电信、电子和计算机工程(JTEC),10卷,不。1 - 8,41-46,2018页。
视图: 谷歌学术搜索
公元前塞尔、m·特纳和ai Nesvizhskii,“提高灵敏度的概率结果从搜索多个MS / MS方法,结合”蛋白质组研究期刊》的研究,7卷,不。1,第253 - 245页,2008。
视图: 出版商的网站 | 谷歌学术搜索
k .吉井m . Goto k . Komatani理事长绪方t·h . g . Okuno,”一个高效的混合音乐推荐系统使用一个增量可训练的概率生成模型,”IEEE音频语音和语言处理,16卷,不。2、435 - 447年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
t·米切尔,生成和歧视的分类器:朴素贝叶斯和逻辑回归美国宾夕法尼亚州匹兹堡卡内基梅隆大学,2005。
a . y . Ng和乔丹,”歧视与生成分类器:比较逻辑回归和朴素贝叶斯的”先进的神经信息处理系统,2卷,第848 - 841页,2002年。
视图: 谷歌学术搜索
j·勒,2018年旅游的十大算法对机器学习的新手。
c·科尔特斯和诉Vapnik支持向量网络。”机器学习,20卷,不。3、273 - 297年,1995页。
视图: 出版商的网站 | 谷歌学术搜索
a . Tharwat“线性和二次判别分析分类器:一个教程中,“应用模式识别的国际期刊,3卷,不。2、145 - 180年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
e .修复和j·l·霍奇斯,“判别分析。非参数歧视:一致性属性。”在统计学第一节国际统计审查/ Revue国际歌卷,57号3、238 - 247年,1989页。
视图: 出版商的网站 | 谷歌学术搜索
Shalev-Shwartz和s . Ben-David了解机器学习:从理论算法英国剑桥,剑桥大学出版社,2014年。
f . Rosenblatt“感知器:一个概率模型为信息存储和组织在大脑中,“心理评估,卷65,不。6,386 - 408年,1958页。
视图: 出版商的网站 | 谷歌学术搜索
t . Kohonen“学习向量量化,”自组织映射施普林格,页175 - 189年,柏林,海德堡,1995年。
视图: 出版商的网站 | 谷歌学术搜索
h·罗宾斯和美国孟氏随机近似法”,数理统计年鉴中,22卷,不。3、400 - 407年,1951页。
视图: 出版商的网站 | 谷歌学术搜索
a . Bennar a Bouamaine, a . Namir”几近收敛和二次平均梯度随机过程的序列估计的条件期望,”应用数学科学,卷2,不。8,387 - 395年,2008页。
视图: 谷歌学术搜索
j . a . Nelder和r·w·m·Wedderburn“广义线性模型,”英国皇家统计学会杂志》:系列,卷135,不。3、370 - 384年,1972页。
视图: 出版商的网站 | 谷歌学术搜索
s . Benzoni-Gavage计算Differentiel Differentielles-2e ed等方程。:课程等Exercices CorrigesDunod,巴黎,法国,2014年。

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

652年

下载

459年

引用