ISSN: 2322 - 0066
部门统计和应用数学,联邦大学的西阿拉福塔雷萨,巴西
收到日期:06/03/2017;接受日期:18/04/2017;发表日期:07/04/2017
访问更多的相关文章研究和评论:研究的生物雷竞技苹果下载学》杂志上
2006年,Rathie和Swamee提出了泛化的物流配送更加灵活和多通道。这项工作提出了一种增加新的参数增加flexibilization分布以及使用Azzalini非对称分布方法,添加另一个参数的不对称。五数据集(人体脂肪指数、艾滋病毒、降水、pH值浓度、相对湿度)进行了分析,运用新的发行版。参数的估计的分布和混合的法线是通过automaximum可能性的方法。由于复杂的数学资源要求计算新分布的估计,我们使用交互式L-BFGS-B等数值方法,挠挠,君等使用一个自适应障碍算法添加到执行约束和全球最大的适应函数,搜索一个非常复杂的非线性目标函数的初始值估计的算法。所有计算r在大多数工作是实现软件情况下哈,我们使用的测试拒绝单峰性。使用KolmogorovSmirnov测试在5%的显著性水平和应用不同的标准,如均方误差、平均绝对偏差和最大偏差,表明最合适。古典和通用多通道方法调整的混合分布,特别是混合正态分布的正态分布提供了良好的数学性质。在法线的混合的情况下,我们使用EM算法来计算估计。我们也使用Akaike信息标准和贝叶斯信息准则选择标准强调最好的分布,在这两种情况下,比较他们的混合正态分布来说明结果的适用性派生。
Rathie-Swamee分布,Azzalini方法,多通道数据集分析、Akaike标准信息,贝叶斯标准信息,极大似然方法,Kolmogorov-Smirnov测试
有几种经典模型,如正常、指数、二项式分布、泊松分布、物流等来分析不同数据集。因为没有一个统一的模型,我们需要建立新的模型适用于数据集在考虑。物流模型是非常有用的在许多领域的统计数据和物理。本文分为如下:第二节处理对称广义物流分布而在第三节斜形式进行了研究。第四节提出了应用分析五个真实数据集使用前面的结果部分,比较两个正态分布的混合。本文提出了一个简短的结论和引用的列表。Rathie et al。1)定义了一个多通道对称分布函数G (x)为一个随机变量x∼RS (a、b、p)
1
同时与a和b不是零。b = 0或p = 0时,(1)被编写为一个物流分布
2
c =或c = a + b。相对应的密度函数(1)是什么
3
可以生成对称分布利用琼斯在2004年提出的方法(2]。让你~β(α,α),和X = G -1(U), G (x)的分布函数G (x)。然后,给出了分布函数H (x)的x
4
区分H (x)收益率相应的密度函数
5
使用(1)和(3)(5),广义对称逻辑密度函数X ~显示(a、b、pα)给出
6
同时,a和b都不是零和b (。,是β函数。为α= 1,(3)减少。我们可能引入模型中的位置参数μ(6)。没有必要引入尺度参数,否则密度函数将成为不可辨认。密度函数(6)接受下列形式引入位置参数μєR:
7
的图1来4图(6)和(7)分别对各种参数μ的值,a、b、p和α。
分布函数
在本节中,我们证明了相对应的分布函数(6)给出
8
证明。x > 0,
9
Substuting我们得到了
我们有
10
通过对称,我们很容易写出x < 0的结果。
时刻
在本节中,我们获得关于原点的第n个时刻。根据定义,
当n是一个偶数
11
然后,通过扩大分母二项式定理,我们有
12
当n是一个偶数。
的方差X ~显示(a、b、pα)是由
13
在Azzalini密度(3]
年代(x) = 2 v (x) [w (x)], x∈R14
w (x) = kx;k 2 R, v (x)的密度函数x ~显示(一个;b;p。)和V (x)的分布函数x ~ RS(一个;b;p)。然后,广义斜物流模型的密度函数X ~ RSGA(一个;b;p;α;给出k)
15
介绍了位置参数μ∈R的密度函数X∼RSGA (a、b、pαk)是由
16
对某些参数的值,s (x)和s1 (x)中绘制图5k = 0.7±图6和7分别= 0和b = 0。
在本节中,五个数据集进行了分析通过使用前面部分中定义的分布以及双向数据的两个法线的混合物。参数的估计是通过利用最大似然估计的方法。Akaike Cri - terion信息(4),贝叶斯信息准则、均方误差、绝对平均偏差和最大绝对偏差计算来判断显示的适合,RSGA和混合两个法线。Kolmogorov-Smirnov拟合优度检验的显著性水平为5%。使用一些包sotfware R。GenSA包(5)用于获取初始值交互算法。交互式算法中,我们使用bbmle:: mle2包(6),在大多数情况下,使用蓄热方法和优化器constrOptim保证估计参数是一致的在各自的参数空间。更多细节算法自适应障碍,看到统计数据::constrOptim软——器皿r .我们获得参数的估计,近似的标准错误估计基于曲率的二阶近似最大似然估计,和测试(z测试)的参数差异从零根据这个标准误差和抽样分布的假设估计的参数是正常的。
AIC和BIC的分类模型在各种应用程序将使用的数据集。这些定义如下
17
在ņ票面价值参数的数量是估计和l(。)的对数似然函数估计。
18
η是观测的数量。均方误差(MSE),平均绝对偏差(疯狂)和最大绝对偏差(MD)定义如下:
在哪里经验累积分布和吗是累积分布的数据。当然,获得的最小值将表明,有一个不错的选择。
人体肥胖指数
17日数据包括252个观测变量对人体脂肪。详情,请参阅Jonhson [7彭罗斯,et al。8],Ambler et al。9]。图8表明数据是单峰也证实了测试(10,11)统计D = 0.014114和假定值接近1。使用显示参数的估计和RSGA模型给出了表1。
显示参数 | 估计 | 错误 | z值 | P (z) |
µ | 19.26 | 2.1087×10−5 | 9.1336×105 | < 0.0001 |
一个 | 0.15401 | 1.127×10−2 | 13.662 | < 0.0001 |
b | 10−4 | 3.3937×10−5 | 2.9467 | < 0.004 |
p | 2.1986 | 1.0742×10−4 | 2.0468×104 | < 0.0001 |
α | 1.2338 | 8.1766×10−4 | 1.5089×103 | < 0.0001 |
日志L | −890.9885 | |||
RSGA参数 | 估计 | 错误 | z值 | P (z) |
µ | 7.8768 | 1.0392×10−2 | 757.9289 | < 0.0001 |
一个 | 0.18403 | 2.8006×10−2 | 6.5712 | < 0.0001 |
b | 10−4 | 3.0035×10−5 | 3.3294 | < 0.0001 |
p | 2.2996 | 1.9703×10−3 | 1167.086 | < 0.0001 |
α | 0.35062 | 7.2149×10−2 | 4.8597 | < 0.0001 |
k | 1.7177 | 2.8455×10−2 | 60.3678 | < 0.0001 |
日志L−889.786 |
表1:与显示相关的评估和RSGA模型。
表2显示了模型的比较。图8介绍了直方图调整模型。实证和理论分布显示图9。
模型 | 钴 | 假定值 | MSE (10−4) | 疯了 | 医学博士 | 另类投资会议 | BIC |
---|---|---|---|---|---|---|---|
显示 | 0.047619 | 0.9375 | 1.315639 | 0.009163 | 0.033421 | 1791.977 | 1809.624 |
RSGA | 0.06746 | 0.615 | 1.189378 | 0.008951 | 0.030355 | 1791.572 | 1812.749 |
表2:调整模型的比较。
AIC,它可以观察到,RSGA适合比显示适合这个数据集。贝叶斯准则表明更适合显示分布。
降水
数据包括121对年降水量(雨)在1978年和1998年之间的中心城市洛杉矶。这些数据从网站获得12]。图10表明数据是单峰也证实了哈的测试统计D = 0.027273和假定值等于0.7971。参数的估计,用RSGA分布,给出了表3。
参数 | 估计 | 错误 | z值 | P (z) |
---|---|---|---|---|
µ | 4.0393 | 4.4968×10−2 | 89.825 | < 0.0001 |
一个 | 49.999 | 2:6007×104 | 1.9225×105 | < 0.0001 |
b | 34.113 | 3.9072×10−4 | 8.7308×104 | < 0.0001 |
p | 0.7582 | 0.1095 | 6.9239 | < 0.0001 |
α | 2.9333×10−4 | 8.0064×10−5 | 3.6638 | < 0.0003 |
3.838 | 2.6556×104 | 1.4452.104 | < 0.0001 | |
日志l - 393.2849 |
表3:估计与RSGA相关模型。
应用非参数Kolmogorov-Smirnov测试,钴价值获得从假定值0.8914是0.07438,因此不拒绝假设数据满足RSGA distribu,。2014年,Eirado et al。13)提出了一个非对称模型,并应用于该数据集。获得的MSE等于0.001058396,平均绝对偏差(疯狂)是0.02785116和0.06496284绝对偏差的最大值(MD)。同时,我们获得了MSE等于0.0002414233,疯狂等于0.01185483和MD等于0.04669135。
AIC和BIC给出适合的两个模型表3、4。实证和理论分布显示图11。显然,RSGA分布给降水数据更好地适应。
模型 | 对数似 | 另类投资会议 | BIC |
---|---|---|---|
RSGA | −393.2849 | 798.5697 | 815.3444 |
Eirado-Rathie | −551.6425 | 1113.285 | 1127.264 |
表4:模型的比较。
艾滋病毒数据
艾滋病毒与2843年数据观测提供fitdistrplus: Aids2包的软件R,给年龄当病人诊断为艾滋病1991年在澳大利亚。表5介绍了参数的估计显示和RSGA模型。
显示 | 估计 | 错误 | z值 | P (z) |
µ | 36.931 | 0.18698 | 197.51 | < 0.0001 |
一个 | 0.16731 | 0.017989 | 9.3006 | < 0.0001 |
p | 8.9282 | 5.2278×10−17 | 1.7078×1017 | < 0.0001 |
α | 1.1148 | 0.017463 | 6.3838 | < 0.0001 |
日志L | −10552.23 | |||
RSGA | 估计 | 错误 | z值 | P (z) |
µ | 27.477 | 0.031826 | 86.336 | < 0.0001 |
一个 | 0.05717 | 0.001222 | 46.779 | < 0.0001 |
p | 9.7371 | 1.0564×10−15 | 9.2174×1015 | < 0.0001 |
α | 3.5391 | 0.20708 | 17.091 | < 0.0001 |
k | 4.5317 | 0.17192 | 26.359 | < 0.0001 |
日志L−10508.95 |
表5:估计与RSGA和显示模式。
NORSKEW | 估计 | 错误 | z值 | P (z) |
---|---|---|---|---|
µ | 37.5304 | 0.187355 | 200.317 | < 0.0001 |
σ | 10.01696 | 0.13529 | 74.041 | < 0.0001 |
ξ | 1.273675 | 0.031561 | 40.355 | < 0.0001 |
日志L−10549.26 | ||||
µ | 37.40907 | 0.1887 | 198.245 < 0.0001 | |
σ | 10.06149 | 0.13343 | 75.406 < 0.0001 | |
日志L−10597.72 |
表6:估计与不对称的正常和正态分布。
直方图和RSGA分布艾滋病毒数据所示图12而实证和RSGA分布图13。在表7,Kolmogorov-Smirnov测试拒绝几乎所有调整分布除了RSGA分布。
模型 | 钴 | 假定值 | MSE (10−4) | 疯了 | 医学博士 | 另类投资会议 | BIC |
---|---|---|---|---|---|---|---|
显示 | 0.289524 | 0.0014 | 4.376593 | 0.017052 | 0.04955 | 21112.47 | 21136.28 |
RSGA | 0.063492 | 0.69 | 1.450326 | 0.009691 | 0.032249 | 21027.9 | 21057.66 |
NORSKEW | 0.041857 | 0.01373 | 3.033533 | 0.014451 | 0.040824 | 21104.53 | 21122.39 |
正常的 | 0.059796 | 7.696×10−5 | 8.539093 | 0.025396 | 0.058367 | 21199.44 | 21211.35 |
表7:比较使用的模型。比较使用的模型。
pH值浓度数据
pH值浓度数据14)与252年观测显示双峰性也证明了哈测试的统计测试等于0.046498和假定值为0.00045。中给出的参数的估计表8。
RSGA | 估计 | 错误 | z值 | P (z) |
---|---|---|---|---|
µ | 3.094726 | 0.071289 | 43.4109 | < 0.0001 |
一个 | 8.242063 | 2.241954 | 3.6763 | < 0.0003 |
b | 0.003 | 0.001066 | 2.8153 | 0.004874 |
p | 6.244648 | 0.344886 | 18.1064 | < 0.0001 |
α | 0.045077 | 0.011673 | 3.8616 | < 0.0002 |
k | 0.86603 | 0.335523 | 2.5811 | 0.009848 |
日志L−364.2 | ||||
µ | 4.918676 | 0.042907 | 114.6364 | < 0.0001 |
一个 | 6.027683 | 0.616692 | 9.7742 | < 0.0001 |
b | 2.906972 | 1.071397 | 2.7133 | < 0.007 |
p | 2.711035 | 0.459798 | 5.8961 | < 0.0001 |
α | 0.068114 | 0.006893 | 9.8812 | < 0.0001 |
日志L−363.7172 |
表8:估计与RSGA和显示模式。
席尔瓦et al。15由Azzalini]提出了两个新的不对称模型方法h1 (x)和h2 (x) pH值浓度数据被这两个模型拟合。表10显示安装发行版的性能。
使用包Benaglia et al。16),给出了估计的法线的混合物表9与参数引导执行标准误差近似。
参数 | 组件1 | 组件2 | 错误的组件1 | 错误的组件2 |
---|---|---|---|---|
λ | 0.50439 | 0.49561 | 0.041677 | 0.0416768 |
µ | 3.892103 | 5.961384 | 0.076694 | 0.07539492 |
σ | 0.575443 | 0.568638 | 0.056243 | 0.05409495 |
日志L | −366.8661 |
表9:估计两个正常的混合物。
pH值以及分布的直方图调整所示图14和15
表10给AIC的精度值,BIC, MSE等,对各种模型。双向数据显示模型调整好。
模型 | 钴 | 假定值 | MSE (10−4) | 疯了 | 医学博士 | 另类投资会议 | BIC |
---|---|---|---|---|---|---|---|
显示 | 0.06746 | 0.61 | 1.814886 | 0.01067501 | 0.039083 | 737.4343 | 755.0871 |
RSGA | 0.075397 | 0.4709 | 2.546568 | 0.01283771 | 0.038684 | 740.4067 | 761.5833 |
NORMIX | 0.083333 | 0.3457 | 7.407901 | 0.02202145 | 0.064505 | 743.7322 | 761.3793 |
h1 (x) | - - - - - - | 0.8316 | 3 | 0.0152 | 0.0373 | 744.6913 | 776.4561 |
h2 (x) | - - - - - - | 0.09438 | 96年 | 0.0912 | 0.1454 | 857.387 | 889.1519 |
表10:比较使用的模型。
相对湿度(RH)
RH观测数据取自Nychka et al。17]。参数的估计使用RSGA RH数据模型给出了表11。
参数 | 估计 | 错误 | z值 | P (z) |
---|---|---|---|---|
µ | 59.72236 | 0.008989 | 6643.879 | < 0.0001 |
一个 | 0.034228 | 0.016025 | 2.1359 | < 0.04 |
b | 0.002588 | 0.001281 | 2.0199 | < 0.05 |
p | 1.227392 | 0.151744 | 8.0886 | < 0.0001 |
α | 0.266291 | 0.115667 | 2.3022 | < 0.03 |
k | −0.4621166 | 0.095596 | −4.8341 | < 0.0001 |
表11:RSGA模型的参数估计。
估计混合两个正常的年代了表12。AIC的价值观,BIC等测量质量适合的表13。
NORMIX | 组件1 | 组件2 | 错误组件1 | 错误组件2 |
---|---|---|---|---|
λ | 0.6975 | 0.3025 | 0.025634 | 0.02563423 |
µ | 36.8122 | 77.08626 | 0.865337 | 1.139471 |
σ | 11.835 | 9.28641 | 0.648855 | 0.8474422 |
日志L | −1958.626 |
表12:的参数估计两个正常的混合物。
模型 | 钴 | 假定值 | 秦岭(10−4) | 疯了 | 医学博士 | 另类投资会议 | BIC |
---|---|---|---|---|---|---|---|
RSGA | 0.080178 | 0.1115 | 8.497387 | 0.0217099 | 0.076005 | 3926.544 | 3951.182 |
NORMIX | 0.073497 | 0.1768 | 9.316102 | 0.02176488 | 0.066207 | 3927.252 | 3947.787 |
表13:比较使用的模型,
在图16、直方图和适合使用经验,RSGA和两个法线的混合分布。在图17,实证和理论分布。
Rathie-Swamee广义分布(显示)和倾斜的形式(RSGA)被证明是有用的五个数据集分析,从而展示其适用性在两个法线的混合物,在双峰集(pH值浓度和相对湿度)。
p . n . Rathie感谢协调更高级别人员的改进(披肩)支持他的高级国家访问教授。