一 : 拟合优度检验
可决系数
可决系数(coefficient of determination)
如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,由样本回归做出解释的离差平方和与总离差平方和越相近;反之,拟合程度越差,相差越大。[www.61k.com)
可决系数的计算式:
可决系数可以作为综合度量回归模型对样本观测值拟合优度的度量指标。
可决系数是测定多个变量间相关关系密切程度的统计分析指标,它也是反映多个自变量对因变量的影响程度。可决系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。可决系数的取值范围在0到1之间,它是一个非负统计量。随着抽样的不同而不同,既是随样本而变动的统计量。
拟合优度
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。
度量拟合优度的统计量是可决系数(亦称确定系数)R。
R的取值范围是[0,1]。R的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R的值越接近0,说明回归直线对观测值的拟合程度越差。
R衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R等于回归平方和在总平方和总所占的比率,即回归方程所能解释的因变量变异性的百分比。实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
统计上定义剩余误差除以自由度n – 2所得之商的平方根为估计标准误。为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数R。R 是无量纲系数,有确定的取值范围 (0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较。
拟合优度检验
主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。
当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。
拟合优度检验是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法。 eg. 一个总体可分为r类,现从该总体获得了一批分类数据,现在需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一颗骰子是否是均匀的,那么可以将该骰子抛掷若干次,记录每一面出现的次数,从这些数据出发去检验各面出现的概率是否都是1/6.
二 : 卡方拟合优度检验在教学中的应用及Matlab实现_刘泽显
第22卷第4期长春大学学报Vol.22No.42012年4月JOURNALOFCHANGCHUNUNIVERSITYApr.2012
2χ拟合优度检验在教学中的应用及Matlab实现
112刘泽显,莫达隆,冯祖针
(1.贺州学院
摘2数学系,广西贺州542800;2.红河学院数学学院,云南蒙自661100)要:采用χ拟合优度检验对119名学生的考试成绩进行假设检验,得到在显著性水平0.01下它服从正态分
2布,并对教学提出一些建议。(www.61k.com)关键词:χ拟合优度检验;极大似然估计;正态分布
中图分类号:O212文献标志码:A文章编号:1009-3907(2012)04-0419-04
0引言
在数理统计中,统计推断,如参数估计和参数的假设检验,都是在总体分布已知的基础上进行的。而在实际应用中,对总体的分布知之甚少,因此首先要研究总体分布的性质。一般来说,总体的精确分布很复杂也很难确定,甚至它根本不服从什么分布,在这种情况下只能寻找总体的极限分布或用已知的分布去近似它。通常的做法是采用拟合优度检验对样本数据进行假设检验。到目前为止,拟合优度检验的方法很多,发
2展也比较成熟,拟合优度检验统计量大体可分为χ检型、基于经验分布的EDF型和条件积分变换型,以及
[1]针对常用分布(例如正态分布、指数分布,均匀分布等等),体现分布特征的检验统计量。在这些拟合优度
检验方法中,χ拟合优度检验法是最重要也是最常用的拟合优度检验方法之一。本文采用χ拟合优度检验法对贺州学院某专业119名学生的概率论与数理统计考试成绩进行假设检验,得到在给定的显著性水平下它服从正态分布,并对教学给出一些建议。22
1χ拟合优度检验法的基本步骤
(1)抽样。从总体X中抽出样本X1,X2…,Xn。抽样的方法有很多,例如简单随机抽样法、分层随机抽
[2]2X2…,Xn独立同分样法、比估计法和系统样本法等。本文采用的是简单随机抽样法,即抽样所得样本X1,
布,且与总体X有共同的分布F。
(2)判断总体X分布的类型,建立原假设。判断方法主要有两种:第一种是经验判断法。例如某一电子元件的寿命有可能服从指数分布;某一地区人们的智商有可能服从的是正态分布;某一地区在一天内邮递遗失的信件数有可能服从泊松分布等等。当然,这种判断方法要求研究者对研究对象的性质和特征有一定的了解。第二种是频率直方图判断法。样本容量较大时,频率直方图的外廓曲线与总体X的概率密度函数曲
[1]线比较接近。根据此原理,作出样本的频率直方图,观察它与哪些已知分布的概率密度函数曲线比较接
然后判断其可能服从什么分布。若它与几种分布的概率密度函数曲线都很接近,则要进行多个假设检验近,
[3]原假设分为两种类型:(a)简单假设:H0:F=F0,其中F0不含未用似然比检验法来择优。建立原假设H0,
F0(x,知参数。(b)复合假设:H0:F∈F0(x,θ),其中θ是一个参数标量或参数向量,θ)形式确定,但θ含有未
22知参数,如在正态分布族N(μ,σ),θ=(μ,σ)未知,在指数分布族中E(θ)中,θ未知,等等。θ的未知参数
[4,5][6,7]。可用不同的参数估计方法来估计,比较常用的是极大似然估计法和最小距离估计法
(3)选择检验统计量。分布拟合检验中不同方法的关键区别在于选择不同的检验统计量。先把总体X
S2,…,Sk,2,…,k)表示样本X1,X2…,Xn落入的样本空间分成k互不相交的子集(或区间)S1,其中ni(i=1,
Si的个数,pi=P{X∈Si}(i=1,2,…,k)表示X落入Si的概率。样本容量较且∑ni=n,其中n为样本容量,i=1k
02-17收稿日期:2012-
基金项目:广西高等学校科研资助项目(200103YB141);贺州学院院级科研立项项目(2011ZRKY13)
),男,作者简介:刘泽显(1984-广西昭平人,助教,硕士,主要从事最优化理论与方法方面研究;
),莫达隆(1970-男,广西蒙山人,副教授,主要从事数理统计与时间序列方面的研究。
matlab假设检验 卡方拟合优度检验在教学中的应用及Matlab实现_刘泽显
420长春大学学报第22卷
nini
H0成立时与pi(i=1,2,…,k)的值应该比较接近[8]。(www.61k.com)若与pi(i=1,2,…,k)的大时,由大数定理可知,
nn1900年K.Pearson提出值很大则认为H0不成立。为了更好地度量了理论分布与总体经验分布之间的偏差,
(ni-npi)22
,了χ统计量:χ=∑并且证明K.Pearson定理:当H0为真时,χ检验统计量的极限分布为自由
i=1npi
2
2
k
2[8]
度为k-1或k-r-1的χ分布。证明参考。
222222
(4)计算拒绝域。对于给定的显著性水平α,计算拒绝域R={χ|χ>χ1-α(k-1)}或R={χ|χ>χ1-α
(k-r-1)},其中r表示未知参数的个数。
(5)决策。若检验统计量的观察值没有落入拒绝域,则总体分布与假设的分布差异不显著,因此在此显
否则它不服从。著性水平下总体服从假设的分布,
2应用实例
2
本文应用χ拟合优度检验法对贺州学院某专业119名学生的概率论与数理统计考试成绩进行假设检[9]
验,并给出它的Matlab实现。贺州学院某专业119名学生的概率论与数理统计考试成绩见表1。
(1)判断总体分布的类型,建立成原假设。作学生考试成绩的频率直方图,如图1所示
:
图1学生考试成绩的频率直方图
MN]=ecdf(score_Stu);其主要程序为:[
ecdfhist(M,N,Cen_Inter);
观察频率直方图发现,它两头低中间比较高,与正态分布的概率密度函数的图形接近,因此假设总体服
222从的是正态分布N(μ,σ)。建立复合假设H0:F=N(μ,σ),其中μ和σ的极大似然估计分别为:mean_
Stu=sum(score_Stu)/num_Stu;
var_Stu=sum(score_Stu)/num_Stu-mean_Stu^2;
表1
8384658556
8274646177
8272876373
7463848080
8587797078
贺州学院某专业119名学生的概率论与数理统计考试成绩7279678688
5880765470
8082667984
8381719188
4664705666
7674728985
7577928682
7677876390
8374987690
7574798791
7674817684
9086837994
6784668484
7683679080
84748285
(2)将考试成绩分区间并整理区间。根据考试成绩,将考试成绩分成11个区间,整理分区,使得每个区间的理论频数npi?5,结果见表1,主要程序为:
whilei<=
j
%根据正态分布的特点,从区间左右两边交替地进行合并。
s=0;%先从左边开始
ifexpectnum(i)<5&&i<=ceil(1/2*length(expectnum))
matlab假设检验 卡方拟合优度检验在教学中的应用及Matlab实现_刘泽显
第4期刘泽显,等:χ拟合优度检验在教学中的应用及Matlab实现
2
421
s=expectnum(i);
whiles<5&&i<=ceil(1/2*length(expectnum))
i=i+1;
end
indexl=[indexl,i];i=i+1;
elseifi<=ceil(1/2*length(expectnum))
indexl=[indexl,i];i=i+1;
end
ifexpectnum(j)<5&&j>
s=expectnum(j);
whiles<5&&j>1/2*length(expectnum)
j=j-1;
end
indexr=[j,indexr];
elseifendend
indexr=indexr(2:end)-1;index=[indexl,indexr];(3)计算其检验统计量的观察值,主要程序如下:
val_Chi=sum((actnum-num_Stu.*expectpro结果为:val_Chi=8.4133(4)计算拒绝域,主要程序如下:
va_Cri=chi2inv(1-alpha,length(inter)-1-2-1);
22
结果为:va_Cri=13.2767;因此拒绝域为:R={χ|χ>13.2767};(5)决策。(www.61k.com)通过比较发现检验统计量的观察值没有落入拒绝域,因此接受原假设,即在显著性水平0.
s=s+expectnum(i);
1/2*length(expectnum)%然后马上从右边开始
s=s+expectnum(j);
j=j-1;j=j-1;
j>1/2*length(expectnum)
indexr=[j,indexr];
).^2./(num_Stu.*expectpro));
9.15032)。01下总体服从正态分布N(77.1261,
表2
区间(-∞,50)[50,55)[55,60)[60,65)[65,70)[70,80)[80,85)[85,90)[90,95)[95,+∞)
频数12371426271551
频率0.00840.01680.02520.05880.11760.21850.22690.12610.04200.0084
分区的结果和整理后分区的结果概率0.00220.00780.02590.06530.12570.20720.17740.11590.05780.0301
理论频数0.25830.93113.07897.768214.957324.656121.110513.79626.88133.5811
[65,70)[75,80)[80,85)[85,90)[90,+∞)
14.957324.656121.110513.796210.4624
[-∞,65)
12.0365
整理后的区间
整理后的理论频数
3结语
通过以上讨论可知,此专业119名学生的概率论与数理统计考试成绩服从正态分布N(77.1261,9.15032)。根据正态分布的特点可知,此专业大部分学生处于平均水平附近,只有少数学生成绩特别优秀或
matlab假设检验 卡方拟合优度检验在教学中的应用及Matlab实现_刘泽显
422长春大学学报第22卷者比较差。[www.61k.com)结合平均分77.1261得到,此专业大部分学生能比较好地掌握所学的知识,少数学生能掌握得特
这在教学中属于正常现象。同时也可知,这些考试试题难度适中,能较大程度反映了学生掌别好或特别差,
2握知识的情况。而结合方差9.1503得,此专业学生的成绩相差在一定范围内的差异比较大,即学生的所学
至于什么原因,还有待进一步调查研究,在教学中要重视这个问题。知识掌握程度有比较大的差异,
参考文献:
[1]杨振海,.北京:科学出版社,2011.程维虎,张军舰.拟合优度检验[M]
[2]R.LymanOtt,MichealT.Longnecker.AnIntroductiontoStatisticalMethodsAndDataAnalysis6th[M].Stamford,Connecticut:CengageLearn-
ing,2010.
[3]费鹤良.分布拟合优度检验方法综述[J].上海师范学院学报(自然科学版),1982(2):129-142.
[4]Durbin,J.Weakconvergenceofthesampledistributionfunctionwhenparametersareestimated[J].Ann.Statist,1973,1(2):279-290.
[5]MichaelGenz, www.61k.com [J].JournalofComputationalandApplied
Mathematics,2006,186(1):191-216.
[6]Wolfowitz,J.Theminimumdistancemethod[J].TheAnnalsofMathematicalStatistics,1957,28(1):75-88.
[7]MichaelD.Weber,LawrenceM.Leemis,RexK.Kincaid.MinimumKolmogorov-Smirnovteststatisticparameterestimates[J].JournalofStatistical
ComputationandSimulation,2006,76(3):195-206.
[8]陈希孺.数理统计引论[M].北京:科学出版社,1981.
[9]张德丰,M].北京:机械工业出版社,2010.等.MATLAB概率与数理统计分析[
责任编辑:程艳艳
Applicationofχ2GoodnessofFitTestinTeachingandMatlabImplementation
LIUZe-xian1,MODa-long1,FENGZu-zhen2
(1.DepartmentofMathematics,HezhouUniversity,Hezhou542800,China)
(2.CollegeofMathematics,HongheUniversity,Mengzi661100,China)
Abstract:χ2goodnessoffittestisusedtodoahypothesisteston119students’examinationscores,showingthatitobeysthenormaldistributionunderthesignificancelevelof0.01.Basedonthis,itprovidessomesuggestionsonteaching.
Keywords:χ2goodnessoffittest;maximumlikelihoodestimation;normaldistribution
(上接第418页)
ExistenceofSolutionforaClassofTwo-PointBoundaryValue
ProblemofSecondOrderIntegal-differentialEquations
NIJin-bo,GAOJuan
(CollegeofScience,AnhuiUniversityofScienceandTechnology,Huainan232001,China)
Abstract:Thispaperdiscussestheexistenceofsolutionforaclassoftwo-pointboundaryvalueproblemofsecondorderintegral-differ-entialequations.ByusingloweranduppersolutionsmethodandSchauderfixedpointtheorem,itobtainsthesufficientconditionsfortheexistenceofsolutionunderweakerconditions.
Keywords:integral-differentialequation;two-pointboundaryvalue;upperandlowersolutions;Schauderfixed-pointtheorem
三 : 卡方-拟合优度检验
四 : 拟合优度:拟合优度-概念,拟合优度-拟合优度检验
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R^2。R^2的取值范围是[0,1]。R^2的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R^2的值越接近0,说明回归直线对观测值的拟合程度越差。
拟合优度_拟合优度 -概念
R衡量的是回归方程整体的拟合度,是表达因变量与所有自变量之间的总体关系。R等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。实际值与平均值的总误差中,回归误差与剩余误差是此消彼长的关系。因而回归误差从正面测定线性模型的拟合优度,剩余误差则从反面来判定线性模型的拟合优度。
拟合优度曲线图统计上定义剩余误差除以自由度n – 2所得之商的平方根为估计标准误。为回归模型拟合优度的判断和评价指标,估计标准误显然不如判定系数R。R 是无量纲系数,有确定的取值范围 (0—1),便于对不同资料回归模型拟合优度进行比较;而估计标准误差是有计量单位的,又没有确定的取值范围,不便于对不同资料回归模型拟合优度进行比较。
金融的应用和解释:
拟合优度是1个统计术语,是衡量金融模型的预期值和现实所得的实际值的差距。
它是1种统计方法应用于金融等领域,基于所得观测值的基础上作出的预测。换句话说,它是衡量如何将实际观测的数值进行模拟的相关预测。
拟合优度_拟合优度 -拟合优度检验
主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。
假定1个总体可分为r类,现从该总体获得了1个样本——这是一批分类数据,现在需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一颗骰子是否是均匀的,那么可以将该骰子抛掷若干次,记录每一面出现的次数,从这些数据出发去检验各面出现的概率是否都是1/6, 拟合优度检验就是用来检验一批分类数据所来自的总体的分布是否与某种理论分布相一致。
拟合优度_拟合优度 -其他相关领域
文化 科技 人文 烹饪 钓鱼 休闲 娱乐
本文标题:拟合优度检验-拟合优度检验61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1