研究文章|开放获取
Irmak Acarlar, Harun Kınacı, Vadoud Najjari, "一种检测DEA中影响dmu的新方法",杂志上的优化, 卷。2014, 文章的ID567692, 7 页面, 2014. https://doi.org/10.1155/2014/567692
一种检测DEA中影响dmu的新方法
摘要
本文对有影响的dmu进行了讨论,并对相关文献进行了综述。在此基础上,提出了一种基于欧氏距离的有效dmu检测方法。我们的方法将用一个经验例子来解释。
1.介绍
数据包络分析(Data envelopment analysis, DEA)是一种基于多输入和多输出评价决策单元相对效率的非参数方法。近年来,DEA在能源等领域的应用中发挥了重要作用[1,2)、银行(3.,以及体育运动[4,5].
DEA是评价决策单元绩效的一种有效方法;同时,如果一个数据集包含一个或多个有影响的dmu,很明显会改变性能的计算结果(通过DEA)。有影响的dmu是非典型观察结果。其中一些是记录或测量错误的结果,应该更正(如果可能)或从数据中删除。因此,检测有影响的观察在DEA中具有重要作用[6].
库克首次提出了有影响力的观点[7]在回归分析中,有影响的观测对回归中参数和拟合值的估计有显著的影响。他还提出了一种基于马氏距离的实用统计方法,称为库克距离。然后提出了几种方法和统计方法来检测回归中有影响的观测值。这些方法大多是基于案例删除的方法。其中一些方法和统计是由Belsley等人给出的[8,库克和韦斯伯格[9,查特吉和哈迪[10].
检测有影响的观察的一般方法是病例删除技术。该技术应用于单个和多个病例的删除[8].在单例删除中,将观测值从数据中剔除,然后将计算结果与用所有数据计算的结果进行比较。多例是单例删除的一般化形式;也就是说,这些情况是通过消除来应用的的观察,和为观察次数。
DEA中影响观测的主要思想与回归分析相似。确实,一个有影响力的DMU是一个高效的DMU,基本上是按照自己的坐标扩展生产可能性集,因此可能会造成以下几个问题。(1)有影响力的DMU可能会导致其中一个DMU是低效的,而通过忽略有影响力的DMU,它可能是有效的。(2)有影响的DMU可能导致某些有效DMU的超效率评分降低。(3)有影响的DMU可能会导致一些无效率的DMU的效率评分降低。
特别是上面提到的最后一项是重要的,因为DEA的主要目标之一是识别有效的决策单元,然后表达几个建议,以提高低效的决策单元的效率。显然,这些有影响力的决策单元可能会对提高低效决策单元的效率产生错误的建议。
Wilson提出的关于在DEA中检测有影响力的dmu的第一个命题之一[6].他提出了一种基于改进DEA超效率评分的方法,该方法包含了案例删除技术。这种方法允许研究人员优先考虑有效子集中的观察结果,以供未来的审查。这种优先级取决于受给定观察结果影响的效率分数的数量。
牧师等[11]提出了一种基于一致最强大测试的影响多单元检测方法。他们考虑了BCC模型并定义了一个通过除法计算的比率从所有dmu和通过消去得到的效率分数有效DMU。然后他们定义一个二进制变量根据该比率小于0.95或大于0.95。因此,他们通过这些二进制变量的和得到一个二项式变量。Ruiz and Sirvent [12]采用类似的方法,并提出了一种替代方法来识别径向和非径向DEA中有影响的dmu。
Jahanshahloo等人提出的一种方法[13]的目的是通过径向DEA中低效dmu劣化效率评分的方式检测有影响的dmu。他们专注于BCC模型,但他们指出该方法也可以用于CCR模型。该方法基于一个特定的比率,如Pastor等人提出的比率[11].
在本研究中,我们提出了一种新的方法来检测有影响的dmu。该方法基于欧几里得距离,采用单例删除的方法剔除有效的数据单元。
本研究的结构如下。下一节介绍DEA的一些基本概念。节3.在此基础上,讨论了影响观测在DEA中的应用,并提出了一种新的检测影响dmu的方法。部分4通过实例说明了该方法的有效性。最后,本节给出了结论5.
2.数据包络分析
首先介绍DEA的是Charnes等人[14].他们提出了CCR模型,也称为常数规模回报(Constant Return to Scale, CRS)。CCR模型通过比值形式的最优值来评估技术效率和规模效率。CCR模型的改进版本是BCC模型,也称为Scale Variable Returns,由Banker等人提出[15].采用BCC模型,参照效率边界来估计dmu的纯技术效率。
DEA可以应用于两种模型,即面向输入模型和面向输出模型。本文考虑了面向输入的BCC (VRS)模型的原始形式,给出如下: 在哪里为效率得分,和(所有非负)th输入和输出分别为,是强度.如果等于1,那么称为有效DMU。
在数据包络分析(DEA)中,在分析结果中通常会出现大量的有效数据单元。因此,有效的dmu不能相互评价,因为他们的分数等于1。为了克服这一问题,分析人员可以在数据集中添加新的数据单元,或者使用某种标准对有效的数据单元进行排序。安徒生及彼得森[16]提出了一个获得超效率分数的模型,这些分数在DEA中对有效dmu的排序和相互比较都是有用的。
本文考虑了面向投入的BCC (VRS)超效率模型的原始形式,给出如下: 在哪里超级效率得分是多少.在以投入为导向的BCC模型中,有效决策单元的超效率得分大于或等于1。而低效dmu的超效率得分与BCC模型在(1).
3.一种检测有影响dmu的新方法
dmu包括影响dmu和非影响dmu两组。一个有影响力的DMU被定义为影响某些低效DMU的效率分数的DMU [6].该DMU还改变了生产可能性集,并将其扩展到自己的坐标。在本研究中,我们将无影响的dmu分为以下三组。(1)第一组为有效的决策单元,包括或排除有影响的决策单元对这些决策单元的效率得分没有任何影响。(2)第二组为低效的决策单元,包括或排除有影响力的决策单元对这些决策单元的低效没有任何影响。(3)第三组为低效的决策单元,排除了有影响力的决策单元,使之成为有效的决策单元。显然,在BCC模型中,第一种类型的dmu处于效率边界,因此它们的效率分数等于1。
表格1由12个人工决策单元组成,并由输入导向的BCC模型给出它们的效率和超效率得分。这些数据由一个输入组成和一个输出变量。让和分别为高效和低效dmu的集合。显然,如果数据涉及一个有影响力的DMU,因为这个有影响力的DMU也是一个有效的DMU,它就成为集合的一个元素.在表1,这些集合是和.为了解细节,我们研究变量的散点图(和)以确定这些数据中有影响力的dmu。数字1提供了表中dmu的模式1;并通过BCC模型展示了效率边界。显然,DMU是一个有影响力的DMU,因为该DMU将生产可能性设置扩展到其坐标(参见图1).它还影响了一些有效决策单元的超效率得分和一些低效决策单元的效率得分。与不含DMU,研究,,,在一组效率得分稳定;然而,他们的超效率得分受到有影响力的DMU的影响。这些dmu被归类为第一类dmu。排除DMU,研究,,,,,在一组节约效率低,但其中一些效率得分可能会受到影响。这些dmu被归类为第二类dmu。最后,是否有一个特定的DMU在集合中;通过省略DMU,它成为一个有效的DMU.即该点位于省略了有影响的DMU后的边界,生产可能性集变小。DMU被归类为第三类DMU。当然以上讨论只是基于数据的可视化,我们需要一个可靠的方法来检测有影响的dmu。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.1.检测有影响的研究
我们准备提出一种新的方法来确定有影响的dmu。假设数据包括观察,在任何点th DMU,和分别为有效和低效dmu的集合。让是一个由这些数据中效率分数组成的向量,由面向输入的BCC模型得到, 在那里,,效率得分是DMU。让为的效率得分省略后由面向输入的BCC模型得到的第一个DMU从数据(由于省略,无法计算th DMU),是一个由这些效率分数组成的向量如下: 以便生成一个可供比较的度量和(这些向量的维数必须相同),让.然后可以重写如下: 对于任何计算的影响在有效DMU中,我们提出使用欧几里得距离度量。因此,两者之间的欧氏距离的平方和给出如下: 在哪里表明规范。此距离仅用于研究有效dmu的影响。显然,如果次DMU对低效DMU的影响较小,其次为小于其他有效dmu距离。另一方面,如果的值对效率较低的DMU影响更大增加。因此,如果最大的距离是,表示第一个DMU对低效DMU的影响最大。我们必须确定一个上界(分界点),例如,在哪里,为任何,意味着大连海事大学是一个有影响力的大学。
让;然后我们定义一个检测有影响的dmu的上界如下: 因此,对于任何, DMUp是一个有影响力的DMU,如果.然而,这个分界点的主要问题是,均值和方差都是非鲁棒性的。极端值使平均值和方差膨胀,产生一个高的截断点。为了避免这个问题,可以用更稳健的估计值代替均值和方差,如中位数和中位数绝对偏差,如下所示: 在哪里 该标准最初由Hadi提出[17]在线性回归中检测有影响的观测值;详情请参阅[10,18].
为了说明这种方法,我们使用表中的人工数据1结果见表2.在这些数据中,截点值为.DMU和DMU违反这个分界点;因此,它们是有影响力的dmu。让我们准确地对待这些有影响力的备忘录。可以看出,dmu的效率得分没有变化,,,在省略DMU的情况下,它们的效率分数等于1。然而,低效的dmu的一些效率评分,如,,是增加了。DMU的效率得分增加到.这种增长是显而易见的。如图所示1,省略DMU创造了一个更接近重点的新领域(被宠爱的边界),它导致dmu中效率分数的增加,,.此外,省略DMU, DMU的效率得分就1。由于忽略了DMU,这种增长也很明显开辟了一条跨越边界的新疆界(腐烂的边境)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
最后,由于和,所以DMU是最有影响力的大连海事大学。
4.实证例子
本节给出了一个实证例子来检验本节中提出的新方法3.1.我们提供了土耳其国家气象局2010年1月50个地区的气象数据,如表所示3..数据由一个输出变量组成两个输入变量,,在那里为平均太阳辐射,平均日照时间(小时),和平均风速是多少.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
:平均太阳辐射,:平均日照时间,和:平均风速。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
表格4提供效率分数()及超效率评分()。它还提供诊断结果,如效率分数()通过省略得到的有效DMU和欧氏距离的平方,在本节讨论3.1.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
用表4,可以看出,,,是高效的,他们的超级效率得分是.
让我们更精确地讨论这个问题和在表4.通过省略,效率低下成为一个高效的DMU,也是低效的效率分数,,有显著的增长。是一个值得注意的例子,它的效率评分从0,6008上升到0,9016。在排除情况下的分数有显著的增长和使这两个dmu成为有效的dmu。此外,所有低效dmu的效率得分(除)增加,而这些dmu挽救他们的低效率。显然,忽略一个有效的决策单元会影响低效决策单元的效率分数,而低效决策单元的效率分数会被有效决策单元引用。
的对于有效的dmu, distance列在表的最后一列4如下:,,,;切点值也是.依靠本节讨论的措施3.1,只有这样才能清楚地看到;因此是这些数据中一个有影响力的DMU。
5.结论
在本研究中,我们将无影响的dmu分为三组,分别如下。(1)第一组为有效的决策单元,包括或排除有影响的决策单元对这些决策单元的效率得分没有任何影响。(2)第二组为低效的DMU,包括或排除有影响力的DMU对这些DMU的低效没有任何影响。(3)第三组为低效的决策单位,排除有影响力的决策单位则为高效决策单位。显然,在BCC模型中,第一种类型的dmu处于效率边界,因此它们的效率分数等于1。在此基础上,提出了一种基于欧氏距离的有效dmu检测方法。本文将该方法应用于土耳其国家气象局2010年1月50个地区的气象资料。该方法也比其他一些类似的方法更实用,因为度量是基于单例删除的。
利益冲突
作者声明本文的发表不存在利益冲突。
致谢
作者非常感谢匿名审稿人和编辑,他们的深刻评论帮助改进了这篇文章的原始版本。
参考文献
- I. Alp和A. Sözen,“土耳其炭化指数效率评估”,能源A部分:回收、利用和环境影响第33卷第3期18, pp. 1678-1691, 2011。视图:出版商的网站|谷歌学术搜索
- A. Sözen, I. Alp,和A. Özdemir,“使用数据包络分析评估土耳其火电厂的运行和环境绩效”,能源政策第38卷第2期10, pp. 6194 - 6203,2010。视图:出版商的网站|谷歌学术搜索
- M. Mercan, a . Reisman, R. Yolalan,和a . B. Emel,“规模和所有权模式对土耳其银行业财务绩效的影响:基于dea的分析结果”,社会经济规划科学,第37卷,第2期3,页185-202,2003。视图:出版商的网站|谷歌学术搜索
- İ。Alp,“世界杯守门员评价的表现”,加齐大学科学学报第19卷第2期2,页119-125,2006。视图:谷歌学术搜索
- t·r·安德森和g·p·夏普,《一种使用DEA衡量棒球击球手的新方法》,运筹学研究年鉴,第73卷,141-155页,1997。视图:出版商的网站|谷歌学术搜索
- P. W. Wilson,“在数据包络分析中检测有影响的观察”,生产力分析杂志,第6卷,第2期1,页27-45,1995。视图:出版商的网站|谷歌学术搜索
- r·d·库克,《线性回归中有影响力观察的检测》技术计量学第19卷第2期1,第15-18页,1977。视图:谷歌学术搜索|MathSciNet
- 贝尔斯利检察官,e·库和r·e·韦尔什,回归诊断:识别共线性的影响数据和来源,《概率与数理统计的威利级数》,约翰·威利父子公司,纽约,美国,1980。视图:MathSciNet
- r·d·库克和s·韦斯伯格,残差与回归的影响,查普曼和霍尔,纽约,纽约,美国,1982年。
- 查特吉和哈迪,实例回归分析,《概率与数理统计中的Willey系列》,John Wiley & Sons,美国新泽西州霍博肯,2006。
- J. T. Pastor, J. L. Ruiz,和I. Sirvent,“检测DEA中有影响的观察的统计检验”,欧洲运筹学研究杂志第115卷第1期3,第542-554页,1999。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- J. L. Ruiz和I. Sirvent,“DEA影响评估技术”,欧洲运筹学研究杂志第132卷第1期2,页390-399,2001。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- G. R. Jahanshahloo, F. Hosseinzadeh, N. Shoja, G. Tohidi,和S. Razavyan,“在径向DEA模型中检测有影响的观察的方法”,应用数学与计算第147卷2,页415-421,2004。视图:出版商的网站|谷歌学术搜索|MathSciNet
- A. Charnes, W. W. Cooper和E. Rhodes,《衡量决策单元的效率》,欧洲运筹学研究杂志,第2卷,第2期6、1978年。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
- b . D. Banker, A. Charnes, W. W. Cooper,“在数据包络分析中估计技术和规模低效的一些模型”,管理科学,第30卷,第2期9,第1078-1092页,1984。视图:出版商的网站|谷歌学术搜索
- P. Andersen和N. C. Petersen,“数据包络分析中高效单元排序的方法”,管理科学第39卷第3期10,第1261-1264页,1993。视图:出版商的网站|谷歌学术搜索
- A. S. Hadi,“线性回归中整体潜在影响的一种新方法,”计算统计和数据分析第14卷第2期1,第1 - 27页,1992。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- P. J. Rousseeuw和C. Croux,《绝对偏差中位数的替代方案》美国统计协会杂志第88期424页,第1273-1283页,1993。视图:出版商的网站|谷歌学术搜索|MathSciNet
版权
版权所有©2014 Irmak Acarlar et al。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。