आर-वर्ग की सशर्त अपेक्षा


18

सरल रैखिक मॉडल पर विचार करें:

yy=Xββ+ϵ

जहां ϵii.i.d.N(0,σ2) और XRn×p ,औरस्थिरांक की एक कॉलम होता है।p2X

मेरा प्रश्न दिया जाता है, E(XX) , β और σ , वहाँ एक गैर तुच्छ ऊपरी पर बाध्य करने का फार्मूला है E(R2) *? (मान लिया गया कि मॉडल OLS द्वारा अनुमानित किया गया था)।

* मैंने मान लिया, यह लिखते हुए, कि E(R2) को प्राप्त करना स्वयं संभव नहीं होगा।

EDIT1

स्टीफन लॉरेंट (नीचे देखें) द्वारा प्राप्त समाधान का उपयोग करके हम पर एक गैर तुच्छ ऊपरी सीमा प्राप्त कर सकते हैं E(R2)। कुछ संख्यात्मक सिमुलेशन (नीचे) बताते हैं कि यह बाध्य वास्तव में बहुत तंग है।

स्टीफन लौरेंत व्युत्पन्न निम्नलिखित: R2B(p1,np,λ) जहां B(p1,np,λ) गैर केन्द्रीयता पैरामीटर के साथ एक गैर केंद्रीय बीटा वितरण है λ के साथ

λ=||XβE(X)β1n||2σ2

इसलिए

E(R2)=E(χp12(λ)χp12(λ)+χnp2)E(χp12(λ))E(χp12(λ))+E(χnp2)

जहां एक गैर केंद्रीय है χ 2 पैरामीटर के साथ λ और कश्मीर स्वतंत्रता की डिग्री। तो E ( R 2 ) के लिए एक गैर-तुच्छ ऊपरी सीमा हैχk2(λ)χ2λkE(R2)

λ+p1λ+n1

यह बहुत तंग है (जितना मैंने उम्मीद की थी उससे कहीं अधिक तंग होगा):

उदाहरण के लिए, का उपयोग कर:

rho<-0.75
p<-10
n<-25*p
Su<-matrix(rho,p-1,p-1)
diag(Su)<-1
su<-1
set.seed(123)
bet<-runif(p)

1000 सिमुलेशन पर का मतलब है । ऊपर दी गई सैद्धांतिक ऊपरी सीमा देता है । आर 2 के कई मूल्यों के लिए बाध्य समान रूप से सटीक प्रतीत होता है । सचमुच अचरज!R20.9608190.9609081R2

EDIT2:

आगे के शोध के बाद, यह प्रतीत होता है कि के लिए ऊपरी बाध्य सन्निकटन की गुणवत्ता बेहतर होगी क्योंकि λ + p बढ़ता है (और बाकी सभी समान, λ n के साथ बढ़ता है )।E(R2)λ+pλn


में केवल एन और पी के आधार पर मापदंडों के साथ एक बीटा वितरण है। नहीं ? R2np
स्टीफन लॉरेंट

1
ओहूप्स क्षमा करें, मेरा पिछला दावा केवल "अशक्त मॉडल" (केवल अवरोधन) की परिकल्पना के तहत सच है। अन्यथा का वितरण एक गैर-केंद्रीय बीटा वितरण की तरह होना चाहिए, जिसमें गैर-पैरामीलिटी पैरामीटर अज्ञात मापदंडों को शामिल करता है। R2
स्टीफन लॉरेंट

@ स्टेफेनलौरेंट: धन्यवाद। क्या आप अज्ञात मापदंडों और बीटा के मापदंडों के बीच संबंध के बारे में अधिक जान पाएंगे? मैं फंस गया हूं, इसलिए किसी भी पॉइंटर का स्वागत किया जाएगा ...
user603

क्या आपको से निपटने की आवश्यकता है ? शायद E [ R 2 / ( 1 - R 2 ) ] के लिए एक सरल सटीक सूत्र है । E[R2]E[R2/(1R2)]
स्टीफन लॉरेंट

1
मेरा उत्तर के अंकन के साथ, कुछ अदिश के लिए कश्मीर और noncentral के पहले पल एफ -distribution सरल है। R2/(1R2)=kFkF
स्टीफन लॉरेंट

जवाबों:


13

किसी भी रेखीय मॉडल लिखा जा सकता है जहां जी पर मानक सामान्य बंटन है आर एन और μ एक रेखीय उपस्पेस से संबंधित माना जाता है डब्ल्यू के आर एन । आपके मामले में W = Im ( X )Y=μ+σGGRnμWRnW=Im(X)

चलो एक आयामी रैखिक उपस्पेस वेक्टर द्वारा उत्पन्न हो ( 1 , 1 , ... , 1 ) । लेते हुए यू = [ 1 ] नीचे, आर 2 अत्यधिक शास्त्रीय फिशर आँकड़ों से संबंधित है एफ = पी जेड वाई 2 / ( मीटर - )[1]W(1,1,,1)U=[1]R2 की परिकल्पना परीक्षण के लिएएच0:{μयू}जहांयूडब्ल्यूहै एक रेखीय उपस्पेस, और द्वारा संकेतित करते जेड=यूडब्ल्यूके orthogonal पूरकयूमेंडब्ल्यू, और दर्शानेमीटर=मंद(डब्ल्यू)और=मंद(यू)

F=PZY2/(m)PWY2/(nm),
H0:{μU}UWZ=UWUWm=dim(W)=dim(U)(तब और = 1 अपनी स्थिति में)।m=p=1

दरअसल, क्योंकि की परिभाषाआर2है आर2=पी जेड वाई 2

PZY2PWY2=R21R2
R2
R2=PZY2PUY2=1PWY2PUY2.

जाहिर है और पी डब्ल्यू वाई = σ पी डब्ल्यू जीPZY=PZμ+σPZGPWY=σPWG

जब है सचH0:{μU} तो और इसलिए एफ = पी जेड जी 2 / ( मीटर - )PZμ=0 फिशर हैएफएम-,एन-मीटरवितरण। नतीजतन, फिशर वितरण और बीटा वितरण, के बीच शास्त्रीय संबंध सेआर2~बी(मीटर-,एन-मीटर)

F=PZG2/(m)PWG2/(nm)Fm,nm
Fm,nmR2B(m,nm)

In the general situation we have to deal with PZY=PZμ+σPZG when PZμ0. In this general case one has PZY2σ2χm2(λ), the noncentral χ2 distribution with m degrees of freedom and noncentrality parameter λ=PZμ2σ2, and then FFm,nm(λ) (noncentral Fisher distribution). This is the classical result used to compute power of F-tests.

The classical relation between the Fisher distribution and the Beta distribution hold in the noncentral situation too. Finally R2 has the noncentral beta distribution with "shape parameters" m and nm and noncentrality parameter λ. I think the moments are available in the literature but they possibly are highly complicated.

Finally let us write down PZμ. Note that PZ=PWPU. One has PUμ=μ¯1 when U=[1], and PWμ=μ. Hence PZμ=μμ¯1 where here μ=Xβ for the unknown parameters vector β.


1
PZx is the orthogoanl projection of x on the linear subspace Z. And P denotes projection on the orthogonal.
Stéphane Laurent

1
Beware of PxPx2. I'm going to edit my post to write the formulas.
Stéphane Laurent

1
Done - do you see any simplification ?
Stéphane Laurent

1
μ¯=1nμi
Stéphane Laurent

1
Type I, obviously: type II are distributed on (0,). Actually R2/(1R2) has the type II distribution. I have done the last corrections for today.
Stéphane Laurent
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.