सबूत है कि एफ-सांख्यिकीय एफ-वितरण का अनुसरण करता है


20

इस सवाल के प्रकाश में: सबूत है कि एक OLS मॉडल में गुणांक स्वतंत्रता के डिग्री (nk) के साथ एक टी-वितरण का पालन करते हैं

मुझे समझना अच्छा लगेगा कि क्यों

F=(TSSRSS)/(p1)RSS/(np),

जहाँ p मॉडल मापदंडों की संख्या है और n टिप्पणियों की संख्या और TSS कुल विचरण, RSS अवशिष्ट विचरण है, एक Fp1,np वितरण का अनुसरण करता है ।

मुझे मानना ​​होगा कि मैंने इसे साबित करने का प्रयास भी नहीं किया है क्योंकि मुझे नहीं पता कि कहां से शुरू करना है।


क्रिस्टोफ़ हैनक और फ्रांसिस ने पहले से ही बहुत अच्छा जवाब दिया है। यदि आपको अभी भी रैखिक प्रतिगमन के लिए एफ परीक्षण के प्रमाण को समझने में कठिनाइयाँ हैं, तो teamdable.github.io/techblog/… चेकआउट करने का प्रयास करें । मैंने रेखीय प्रतिगमन के लिए ftest के प्रमाण के बारे में ब्लॉग पोस्ट लिखा था। यह कोरियाई में लिखा गया है, लेकिन यह एक समस्या नहीं हो सकती है क्योंकि यह लगभग सभी गणित का फार्मूला है। मुझे आशा है कि यह मदद करेगा यदि आपको अभी भी रैखिक प्रतिगमन के लिए एफ परीक्षण के प्रमाण को समझने में कठिनाई हो।
तेहो ओह

हालांकि यह लिंक प्रश्न का उत्तर दे सकता है, लेकिन उत्तर के आवश्यक भागों को शामिल करना और संदर्भ के लिए लिंक प्रदान करना बेहतर है। लिंक-केवल उत्तर अमान्य हो सकते हैं यदि लिंक किए गए पृष्ठ बदल जाते हैं। - समीक्षा से
mkt -

जवाबों:


19

आइए हम उस सामान्य मामले का परिणाम दिखाएं जिसके लिए आपके परीक्षण सूत्र के लिए सूत्र एक विशेष मामला है। सामान्य तौर पर, हम सत्यापित करने के लिए आंकड़ा हो सकता है, के अनुसार की जरूरत के लक्षण वर्णन F वितरण स्वतंत्र के अनुपात के रूप में लिखा जा, χ2 स्वतंत्रता की उनकी डिग्री से विभाजित RVs।

आज्ञा दें H0:Rβ=r साथ R और r ज्ञात, अरेखीय और R:k×q में पूर्ण स्तंभ रैंक q । यह प्रतिनिधित्व करता q (विपरीत ऑप्स अंकन में) के लिए रैखिक प्रतिबंध k निरंतर अवधि सहित regressors। तो, @ user1627466 के उदाहरण में, p1q=k1 मेल खाता है, सभी ढलान गुणांक को शून्य पर सेट करने का प्रतिबंध है।

को ध्यान में रखते Var(β^ols)=σ2(XX)1 , हम

R(β^olsβ)N(0,σ2R(XX)1R),
ताकि (साथ B1/2={R(XX)1R}1/2 के एक "मैट्रिक्स वर्गमूल" होनेB1={R(XX)1R}1 , के माध्यम से, उदाहरण के लिए, एक Cholesky अपघटन)
n:=B1/2σR(β^olsβ)N(0,Iq),
के रूप में
Var(n)=B1/2σRVar(β^ols)RB1/2σ=B1/2σσ2BB1/2σ=I
जहां दूसरी पंक्ति ओएलएसई के विचरण का उपयोग करता है।

यह, के रूप में में दिखाया गया जवाब है कि आप लिंक (यह भी देखें यहाँ ), से स्वतंत्र है

d:=(nk)σ^2σ2χnk2,
जहां σ 2=y'एमएक्सy/(एन-कश्मीर)हमेशा की तरह निष्पक्ष त्रुटि विचरण अनुमान है, साथ हैएमएक्स=मैं-एक्स(एक्स'एक्स)-1एक्स'हैएक्सपर पुनः प्राप्त करने से "अवशिष्ट निर्माता मैट्रिक्स"।σ^2=yMXy/(nk)MX=IX(XX)1XX

तो, के रूप में nn normals में एक द्विघात रूप

nnχq2/qd/(nk)=(β^olsβ)R{R(XX)1R}1R(β^olsβ)/qσ^2Fq,nk.
विशेष रूप से, के तहतH0:Rβ=r, इस आंकड़े को कम कर देता है
F=(Rβ^olsr){R(XX)1R}1(Rβ^olsr)/qσ^2Fq,nk.

उदाहरण के लिए, विशेष मामले पर विचार R=I , r=0 , q=2 , σ 2 = 1 और एक्स ' एक्स = मैं । फिर, एफ = β ' OLS β OLS / 2 = β 2 OLS , 1 + β 2 OLS , 2σ^2=1XX=I

F=β^olsβ^ols/2=β^ols,12+β^ols,222,
OLS के वर्ग इयूक्लिडियन दूरी मूल तत्वों की संख्या द्वारा मानकीकृत से अनुमान है - कि प्रकाश डाला, क्योंकिβ2OLS,2मानक normals चुकता कर रहे हैं और इसलिएχ21,एफवितरण "औसत एक के रूप में देखा जा सकता हैχ2वितरण।β^ols,22χ12Fχ2

मामले में आप थोड़ा अनुकरण पसंद करते हैं (जो निश्चित रूप से एक प्रमाण नहीं है!), जिसमें नल का परीक्षण किया जाता है कि कोई भी k regressors कोई भी बात नहीं करता है - जो कि वे वास्तव में नहीं करते हैं, ताकि हम शून्य वितरण का अनुकरण करें।

यहां छवि विवरण दर्ज करें

हम मोंटे कार्लो परीक्षण के आँकड़ों के सैद्धांतिक घनत्व और हिस्टोग्राम के बीच बहुत अच्छा समझौता देखते हैं।

library(lmtest)
n <- 100
reps <- 20000
sloperegs <- 5 # number of slope regressors, q or k-1 (minus the constant) in the above notation
critical.value <- qf(p = .95, df1 = sloperegs, df2 = n-sloperegs-1) 
# for the null that none of the slope regrssors matter

Fstat <- rep(NA,reps)
for (i in 1:reps){
  y <- rnorm(n)
  X <- matrix(rnorm(n*sloperegs), ncol=sloperegs)
  reg <- lm(y~X)
  Fstat[i] <- waldtest(reg, test="F")$F[2] 
}

mean(Fstat>critical.value) # very close to 0.05

hist(Fstat, breaks = 60, col="lightblue", freq = F, xlim=c(0,4))
x <- seq(0,6,by=.1)
lines(x, df(x, df1 = sloperegs, df2 = n-sloperegs-1), lwd=2, col="purple")

कि सवाल-जवाब में परीक्षण के आंकड़े के संस्करण वास्तव में बराबर है, ध्यान दें कि प्रतिबंध के अशक्त मेल खाती हैं देखने के लिए R=[0I] औरr=0

चलो X=[X1X2] का विभाजन किया जाना चाहिए जिसके अनुसार गुणांक शून्य के तहत शून्य होना प्रतिबंधित है (आपके मामले में, सभी लेकिन स्थिर, लेकिन पालन करने की व्युत्पत्ति सामान्य है)। इसके अलावा, चलो β OLS = ( β ' OLS , 1 , β ' OLS , 2 ) ' होना उपयुक्त रूप से विभाजित OLS का अनुमान है।β^ols=(β^ols,1,β^ols,2)

Rβ^ols=β^ols,2
आर ' β OLS = β OLS , 2 और
R(XX)1RD~,
के निचले दाएँ ब्लॉक
(XTX)1=(X1X1X1X2X2X1X2X2)1(A~B~C~D~)
अब, उपयोगविभाजित प्रतिलोम के लिए परिणामप्राप्त करने के लिए
D~=(X2X2X2X1(X1X1)1X1X2)1=(X2MX1X2)1
जहांMX1=IX1(X1X1)1X1

इस प्रकार, का अंश F आंकड़ा (द्वारा विभाजन के बिना हो जाता है q )

Fnum=β^ols,2(X2MX1X2)β^ols,2
इसके बाद, याद है कि द्वारा Frisch- वॉ-लोवेल प्रमेय हम लिख सकते हैं β OLS , 2 = ( एक्स ' 2 एम एक्स 1 एक्स 2 ) -
β^ols,2=(X2MX1X2)1X2MX1y
ताकि
Fnum=yMX1X2(X2MX1X2)1(X2MX1X2)(X2MX1X2)1X2MX1y=yMX1X2(X2MX1X2)1X2MX1y

USSRRSSR

RSSR=yMX1y
yX1H0TSS=i(yiy¯)2

एफडब्ल्यूएल का उपयोग करने के बाद (जो यह भी दर्शाता है कि दो दृष्टिकोणों के अवशेष समान हैं), हम लिख सकते हैंUSSR

MX1yonMX1X2

USSR=yMX1MMX1X2MX1y=yMX1(IPMX1X2)MX1y=yMX1yyMX1MX1X2((MX1X2)MX1X2)1(MX1X2)MX1y=yMX1yyMX1X2(X2MX1X2)1X2MX1y

इस प्रकार,

RSSRUSSR=yMX1y(yMX1yyMX1X2(X2MX1X2)1X2MX1y)=yMX1X2(X2MX1X2)1X2MX1y


धन्यवाद। मुझे नहीं पता कि यह इस बिंदु पर हाथ पकड़े हुए माना जाता है, लेकिन आप अपने वर्ग के योग से एक अभिव्यक्ति तक कैसे जाते हैं जिसमें वर्गों का योग है?
user1627466

1
@ user1627466, मैंने दो सूत्रों के समतुल्य की व्युत्पत्ति जोड़ी।
बजे क्रिस्टोफ़ हनक

4

@ChristophHanck ने बहुत व्यापक उत्तर प्रदान किया है, यहाँ मैं ओपी द्वारा बताए गए विशेष मामले पर प्रमाण के एक स्केच को जोड़ूंगा। उम्मीद है कि शुरुआती लोगों के लिए भी इसका पालन करना आसान है।

YFd1,d2

Y=X1/d1X2/d2,
X1χd12X2χd22FFcESSχp12cRSSχnp2c

y=Xβ+ε,
Xn×pεNn(0,σ2I)H=X(XTX)1XTy^=HyM=IHHMtr(H)=pHX=X

J

TSS=yT(I1nJ)y,RSS=yTMy,ESS=yT(H1nJ)y.
M+(HJ/n)+J/n=IJ/nrank(M)+rank(HJ/n)+rank(J/n)=nHJ/nM(HJ/n)=0

FF

  1. xNn(μ,Σ)ArAΣxTAxχr2(μTAμ/2)χ2rμTAμ/2, एक प्रमाण भी यहाँ मिल सकता है
  2. xNn(μ,Σ)AΣB=0xTAxxTBx

yNn(Xβ,σ2I)

ESSσ2=(yσ)T(H1nJ)yσχp12((Xβ)T(HJn)Xβ).
β=0ESS/σ2χp12yTMy=εTMεHX=XRSS/σ2χnp2M(HJ/n)=0ESS/σ2RSS/σ2
F=(TSSRSS)/(p1)RSS/(np)=ESSσ2/(p1)RSSσ2/(np)Fp1,np.
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.