प्रतिगमन गुणांक के लिए यह पूर्वाग्रह-भिन्नता व्यापार क्या है और इसे कैसे प्राप्त किया जाए?


9

में इस पत्र , ( विचरण अवयव के लिए बायेसियन निष्कर्ष केवल का उपयोग करते हुए विरोधाभासों में त्रुटि , Harville, 1974), लेखक का दावा है एक "प्रसिद्ध" बनने के लिए संबंध ", एक रैखिक प्रतिगमन जहां

(yXβ)H1(yXβ)=(yXβ^)H1(yXβ^)+(ββ^)(XH1X)(ββ^)
y=Xβ+ϵ,
ϵN(0,H).

यह सर्वविदित कैसे है? इसे साबित करने का सबसे सरल तरीका क्या है?


1
यह विकिपीडिया पर है , वहां 'व्युत्पत्ति' देखें।
user603

@ user603 क्या आप लिंक को स्पष्ट करने का मन रखते हैं? धन्यवाद!
सिलबस जुआ

@ user603 क्षमा करें मैं वास्तव में यह नहीं देख सकता कि लिंक समस्या का समाधान कैसे करता है। मेरे लिए, मेरे मामले में, समीकरण वार (y) = पूर्वाग्रह + है ... क्या आप विस्तृत कर सकते हैं?
सिब्बल जुआना

4
@ SibbsGambling ध्यान दें कि आपके समीकरण में भारित रैखिक प्रतिगमन के इस सूत्रीकरण में दो प्रसरण-संबंधित शब्द हैं । बाईं ओर का शब्द सच्चे मॉडल (सटीक मैट्रिक्स द्वारा भारित) के आसपास विचरण से संबंधित है । दाईं ओर पहला शब्द फिटेड मॉडल के आसपास विचरण से संबंधित है। दाईं ओर का दूसरा शब्द पूर्वाग्रह के वर्ग से संबंधित है । यह विचरण-पूर्वाग्रह व्यापार है। H1
ईडीएम

जवाबों:


6

समीकरण में अंतिम शब्द के रूप में लिखा जा सकता है

(एक्सβ-एक्सβ^)'एच-1(एक्सβ-एक्सβ^)

इस रूप में समीकरण कुछ दिलचस्प कह रहा है। यह मानते हुएएचसकारात्मक निश्चित और सममित है, इसलिए इसका उलटा है। इसलिए, हम एक आंतरिक उत्पाद को परिभाषित कर सकते हैं<एक्स,y>एच-1=एक्स'एच-1y, हमें ज्यामिति दे रहा है। फिर उपरोक्त समानता अनिवार्य रूप से कह रही है कि,

(एक्सβ-एक्सβ^)(y-एक्सβ^)

मैं आपको यह अंतर्ज्ञान देना चाहता था क्योंकि एक टिप्पणीकार ने पहले ही व्युत्पत्ति की एक कड़ी छोड़ दी है।

संपादित करें: पश्चाताप के लिए

एलएचएस:

(y-एक्सβ)'एच-1(y-एक्सβ)=y'एच-1y-2y'एच-1एक्सβ+β'एक्स'एच-1एक्सβ=()-(बी)+(सी)

आरएचएस:

(y-एक्सβ^)'एच-1(y-एक्सβ^)+(β-β^)'(एक्स'एच-1एक्स)(β-β^)
=y'एच-1y-2y'एच-1एक्सβ^+β^'एक्स'एच-1एक्सβ^+βएक्स'एच-1एक्सβ-2β^एक्स'एच-1एक्सβ+β^'एक्स'एच-1एक्सβ^=()-(डी)+()+(सी)-(एफ)+()

रिश्ता:

β^=(एक्स'एच-1एक्स)-1एक्स'एच-1y

संबंध में प्लग करके आप यह दिखा सकते हैं कि (B) = (F), और वह 2 (E) = (D)। सब कुछ कर दिया।


क्षमा करें, मैं वास्तव में नहीं देख सकता कि लिंक समस्या को कैसे हल करता है। मेरे लिए, मेरे मामले में, समीकरण वार (y) = पूर्वाग्रह + है ... क्या आप विस्तृत कर सकते हैं?
सिब्बल जुआना

@SibbsGambling edited my answer including derivation.
jlimahaverford

@jlimahaverford आप भूल नहीं रहे हैं y सूत्र के अंत में β^?
ग्यूमो

7

वे इस पहचान को एक तकनीक द्वारा पूरा करते हैं जिसे स्क्वायर पूरा करना कहा जाता है। बाएं हाथ की तरफ एक द्विघात रूप में है, इसलिए इसे बाहर गुणा करके शुरू करें

(y-एक्सβ)'एच-1(y-एक्सβ)=y'एच-1y-2y'एच-1एक्सβ+β'एक्स'एच-1एक्सβ

जारी रखें और फिर के संदर्भ में फिर से लिखें β^=(एक्स'एच-1एक्स)-1एक्स'एच-1y। बीजगणित एक प्रकार का लंबा है, लेकिन बायेसियन प्रतिगमन में वर्ग को पूरा करने वाला गुग्लिंग है और आप बहुत सारे संकेत पा सकते हैं। उदाहरण के लिए, बायसायन रेखीय प्रतिगमन पर विकिपीडिया देखें , और स्क्वायर को पूरा करने के बारे में अन्य क्रॉसवैलिड उत्तर यहां की तरह ।


2

यदि आप अपने मैट्रिक्स बीजगणित को जानते हैं, तो यह सब कुछ को गुणा करके और यह सत्यापित करते हुए होना चाहिए कि आपके पास वास्तव में दोनों तरफ समान हैं। यह वही है जो जलीमहाफोर्ड ने प्रदर्शित किया है।

ऐसा करने में सक्षम होने के लिए आपको अनुमान के लिए सूत्र की आवश्यकता है β^। जब हम असम्बद्ध त्रुटि शब्द रखते हैं, तो हम सूत्र को उसी तरह से प्राप्त कर सकते हैं जैसे कि रैखिक प्रतिगमन के लिए। चाल को मानकीकृत करना है।

यहाँ एक आरवी को मानकीकृत करने के बारे में कुछ जानकारी दी गई है जो एक बहुभिन्नरूपी सामान्य वितरण से आती है। मान लेते हैं कि आपके पास है

एक्स~एन(μ,Σ)
Σ सकारात्मक निश्चित है, इसलिए आप इसे कारक बना सकते हैं Σ=पीपीटी। अब यादृच्छिक चर
Y=पी-1(एक्स-μ)
वितरण से आता है एन(0,मैं)। अब हम इस ट्रिक का उपयोग अपनी समस्या को खोजने के लिए कर सकते हैंβ^। चलो फ़ैक्टर करते हैंएच=पीपीटी। हमारे पास है
y=एक्सβ+εपी-1y=पी-1एक्सβ+पी-1ε
अभी ε मानकीकृत किया गया है, ऐसे cov(पी-1ε)=मैं, तो हम अब इसे एक सरल एकाधिक रैखिक प्रतिगमन मॉडल के रूप में मान सकते हैं:
एक्स~=पी-1एक्स,y~=पी-1yतथाε~=पी-1ε
इसलिए हमें प्रतिगमन समस्या है:
y~=एक्स~β+ε~
के लिए सूत्र β^ है
β^=(एक्स~टीएक्स~)-1एक्स~टीy~=((पी-1एक्स)टीपी-1एक्स)-1(पी-1एक्स)टीपी-1y=(एक्सटी(पीपीटी)-1एक्स)-1एक्स(पीपीटी)-1y=(एक्सटीएच-1एक्स)-1एक्सएच-1y
यह ऐसा करने के लिए महत्वपूर्ण है, बाकी है, बीजगणित हेरफेर जलिमाहावरफोर्ड द्वारा समाधान में दिखाया गया है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.