文摘

伪的数学/统计概念复合泊松和分区表示离散型概率进行了综述和澄清。几何分布的卷积组合解释牛顿的变种的身份。的实际使用两个卷积导致一种改进的拟合优度的数据集从汽车保险是到目前为止不令人满意。

1。介绍

考虑离散算法的类随机变量 概率生成函数(pgf) 和非零的零概率 。假设pgf可以写成 对于一些生成函数 。伪复合泊松表示之间的二元性的担忧 ,这是最好的表达的身份 或者同样的递推关系 因此,它已被证明 无穷可分当且仅当有吗 , (例如,(1];(2,83页)。大约在同一时间伐木机(3,290页)显示 是无穷可分当且仅当它是一个复合泊松随机变量和参数吗 概率和严重程度 。如果 不是无限可分的,那么(1仍然适用于一些 ,至少有一个负值,这产权激励的命名伪复合泊松表示

部分1总结了其主要特性。幂级数的身份 领导也更复杂和更少的表达式 在哪里 自由分区的设置的重量吗 ,被称为分区表示。尽管(2)已经被应用于Hurlimann [4存在,定理3.2),获得一个标准的建设信心边界离散抽样分布,表达式(2)不是说正确,证明是失踪。部分3填充这些空白和分区提供了一个组合的解释表示。

作为一个新的说明,部分4认为的卷积 几何随机变量的伪复合泊松表示指定的 th权力和多项式 。分区表示(2)标识 多个的 th完全对称函数 的变量 。递归(1)是相当于一个变种牛顿的身份,激励我们称之为卷积牛顿分布。应用于估计理论,我们表明,该分布满足高斯定律(意思是极大似然估计量的样本均值)和构造参数向量正交的意思。两个参数的情况下,我们推导出最大似然方程,说明它们的使用5在一个特定的数据集从汽车保险。通过重组类,我们表明,牛顿胜在拟合优度负二项分布和泊松逆高斯分布,同时提高了不满意的符合之前的案例研究中获得。

2。通过伪特征复合泊松表示

回忆的伪复合泊松表示从Hurlimann离散概率理论5,6]。让 是一个随机变量离散算术上定义自然数与概率 ,这样 。除了概率生成函数(pgf) 一个认为累积量pgf定义为 它的名字是出于累积生成函数的级数展开(cgf)

命题1(伪复合泊松表示)。 是一个随机变量离散算法 这样 并设置 。然后的概率 满足潘尼尔的递归 和下面的伪复合泊松表示 是适用的:

证明。递归(5)是一个直接的结果(3)。事实上,方程的导数 满足的关系 ,相当于身份(5)。详情请咨询Hurlimann [5推论2],Hurlimann [6定理1]。

备注1。显然,如果 , ,复合泊松分布参数 概率和严重程度 , 用,一个事实 。在这种情况下,递归(5潘尼尔(后)被命名为潘尼尔递归7]。与伐木机(3第十二节。2], one knows that 复合泊松当且仅当它是无穷可分(参见[6]更一般的描述)。否则,一个说 有一个伪复合泊松分布。在术语的Sundt [8),它属于类 (参见[9])。伪复合泊松分布的理论和实践效用已经证明了作者在众多出版物。有时,序列 定义为(5)称为De Pril变换 后德Pril [10)(例如,11])。递归关系的兴趣(5)超出离散概率一般整数序列的上下文。让 身份映射等 对于所有非负整数。然后,卷积方程 对于整数序列 发生在数学的许多领域。一个重要的问题是两个序列的渐近行为之间的关系 (例如,(12)和它的引用)。

命题的交谈1,虽然使用的应用程序(例如,(6,13- - - - - -15]),研究。在负 的累积量pgf这样(必要条件5)定义了一个真正的概率分布已被征收首次发现。

命题2。是一种有限的生成函数 。假设 。为了使(5)定义了一个离散型概率分布,它是必要的条件(NC) ,满足了。

证明。条件(NC)在卢卡奇(16,252页)和约翰逊等。17,356页)。证明在征收(18,19]和Cuppens [20.,8.4节和附录B)。

备注2。精确的充分条件(SC)的命题2是不知道。原则上,任何剩余的 只要是足够小的可以是负数的绝对值;也就是说, , ,对于一些 (cf。18,263页);(13备注1,定理3.1])。莱维(18,263页)指出 是最简单的情况下承认消极 。范低质粗支亚麻纱[21,84页)获得四个不等式约束 在其他的方面 的年代。卢卡奇(16显示,如果,251页) , ,然后(5)定义了一个离散型概率分布(cf。13备注3定理3.1])。

3所示。分区表示和组合的解释

除了伪复合泊松的幂级数表示身份 另一个重要的直接后果。

命题3(分区表示)。假设X是一个离散的随机变量算法 这样 ,让 是它的累积量 。然后,以下分区表示持有: 在哪里 自由分区的设置的重量吗

证明。这个结果之前的计算 这意味着身份(7)。

备注3。虽然变异之前(例如,22第二节);(23方程(3.4)]),一般的分区表示(7)伪复合泊松分布算法已经在推论3.1中首次规定Hurlimann [4]。不幸的是,给定的公式包含了一个印刷错误:多样性的阶乘 被错误地取代了吗 。注意,这个错误仍然没有影响的有效性定理3.2来自这种表示方法。然而,声称但缺少用归纳法证明最好是被目前的证据。简单的幂级数操纵麦克唐纳(已经使用2425页)在他的证明类似但更特别导致对称函数的理论(参见后面的一节4.3)。节我。1的the mentioned textbook is recommended reading for definitions and properties around partitions (in particular weight, length, and multiplicity of a partition).

有一个很好的组合解释分区表示。为了方便起见,集 , 。然后,表达 源于(7)确定周期指数多项式(或周期指标)对称群的秩序 的变量 (例如,(24示例9。(a)第29页)。事实上,系数(9)的任意单项 等于所有排列的分数吗 固定的点, 周期的长度 , 周期的长度 。我们注意到,这个组合的解释是这部小说的关键的例子研究了在接下来的两个部分。

4所示。的卷积几何随机变量:牛顿类型分布

进一步说明离散概率概念的部分23,考虑权力和规范的累积量pgf (3);也就是说, 在哪里 , , , ,都是 未知参数。计算表明,该数量 是有限的。命题的条件(C1)2是满足的,所以(10)属于随机变量 一些复合泊松分布,待定。显然,一个 从哪一个获得 的pgf是哪一个的卷积 几何随机变量;因此 考虑命题的分区表示3。一个观察 是什么以外的 th权力和多项式的变量 , 。身份(9)因此等于 并显示与麦克唐纳(24方程(2.14′),页25) th概率 ,即 ,是 多个的 th完全对称函数 的变量 。在这个组合中潘尼尔递归(5)相当于身份 这是什么其他的变异牛顿的身份(见[24方程(2.11)和(2.11′),页23])。因此,分布(14)的几何随机变量的递归卷积(15)也可以被称为牛顿分布。相对应的分布随机变量(13)略

现在,我们运用我们的概念来研究一些估计牛顿分布的性质。在第一步中,我们建立一个参数向量 正交的意思 一般来说,得到一个随机变量 我们假设的意思 是功能独立于特定参数向量 ,也就是说, , ,表示对数似的 通过 。的意思是 正交参数向量 ,用 ,如果有 , 。此外,让 被所有离散算法的类分布的极大似然估计量的意思是样本均值,也就是这样 (高斯定律)。子类 ,称为正交类,包括所有这些分布,除了满足高斯的原则意思是正交属性 。众所周知,这个班 关闭下卷积(见[15定理2.2]),可以如下特点。假设存在一个参数 和一对一的坐标变换映射 ,并设置 。然后 相当于以下条件(见[15引理3.1,方程(3.8))): 在哪里 ,是由伪复合泊松的代表 。应用于牛顿分布,看到一些计算后(17), , 实现提供了偏微分方程 能够解决。很容易看出这都将提供一个实现 这些偏微分方程的解 它遵循的意思 正交于参数向量

接下来,我们得到两个参数的最大似然方程牛顿分布 从卷积获得 两个几何分布的参数 , 。概率在上面的正交参数化 是由 为每一个 被观测的随机变量的数量 等于 ,让 被观察的总数, 对所有 。从(21一个获得了对数似函数 最大似然方程 是由 这两个非线性方程组在两个变量 和替换设置可以解决吗 。插入 在第一个方程 唯一的可行解二次方程的负号, 使用该 和插入(25)第二个方程(23)看到,后者除了观察只取决于 ,是由 前面的简单推导最大似然属性是可能的美德的伪复合泊松表示(主要是(17))。让我们也说明分区表示数学的好处。我们依赖定理3.2 Hurlimann [4),保证良好定义的信心的存在范围的意思是以下提供的统计分布规律的假设是实现。(RA)存在一个正整数 和一个常数 这样 对所有分区 这样 现在,对于牛顿分布等两个参数 ,一个 因此 。规律的假设与 满足了。

5。一个数值例子从汽车保险

选择一个适当的索赔数量模型汽车保险是一个杰出的保险精算研究课题的最后一50岁的故事始于Bichsel [25),使用了负二项构建一个系统(NB)分布。其他不错的选择,泊松逆高斯(猪)经常被提倡(见例3.4 (4]和讨论)。由于在南方浸信会(Schwartz贝叶斯准则)分数最好的整体健康是在任何情况下获得两个参数分布(见[4结束,第四节)。在这种背景下,我们问牛顿分布是否与NB和猪的竞争。为一个特定的例子,在一个非常精确的意义上(重组类),它打败了他们,同时也提高了数据集的不令人满意的拟合4在表4.5 Hurlimann [4]。

自从矩量法是不合适的,见她Gossiaux和(26),我们使用最大似然估计(标定)方法,最好在视图的渐近性质。的基础上,建立了拟合优度SBC得分和 卡方值与适当的重组类统计。改进的结果发现在表12。虽然最小SBC得分是猪卡方和获得 值(最后两个重组类)最适合牛顿分布。猪的拟合优度下降是由于宽松合适的重组最后两类,缺乏合适的类有两个观察保险索赔。

让我们结束目前的工作。我们的目的是给出一个系统的概述伪复合泊松和分区的概念表征在离散概率和现在的一个新的应用程序。通过详细研究一个新例子,我们已经为一些典型特征,进一步我们的方法的潜力。

利益冲突

作者宣称没有利益冲突有关的出版。