एकाधिक प्रतिगमन गुणांक के लिए मानक त्रुटियां?


18

मुझे एहसास है कि यह एक बहुत ही बुनियादी सवाल है, लेकिन मुझे कहीं भी जवाब नहीं मिल रहा है।

मैं सामान्य समीकरणों या क्यूआर अपघटन का उपयोग करके प्रतिगमन गुणांक की गणना कर रहा हूं। मैं प्रत्येक गुणांक के लिए मानक त्रुटियों की गणना कैसे कर सकता हूं? मैं आमतौर पर निम्न के रूप में मानक त्रुटियों के बारे में सोचता हूं:

SEx¯ =σx¯n

प्रत्येक गुणांक के लिए क्या है ? ओएलएस के संदर्भ में इसकी गणना करने का सबसे कारगर तरीका क्या है?σx¯

जवाबों:


19

कम से कम वर्गों का आकलन करते समय (सामान्य यादृच्छिक घटक मानकर) प्रतिगमन पैरामीटर का अनुमान सामान्य रूप से सही प्रतिगमन पैरामीटर और सहसंयोजक मैट्रिक्स समान माध्य के साथ वितरित किया जाता है जहां अवशिष्ट विचरण है और डिजाइन मैट्रिक्स है। की पक्षांतरित है और मॉडल समीकरण द्वारा परिभाषित किया गया है साथ प्रतिगमन मापदंडों और त्रुटि शब्द है। एक बीटा पैरामीटर का अनुमानित मानक विचलन में संबंधित शब्द लेने से प्राप्त होता है रों 2 एक्स टी एक्स एक्स टी एक्स एक्स वाई = एक्स बीटा + ε बीटा ε ( एक्स टी एक्स ) - 1Σ=s2(XTX)1s2XTXXTXXY=Xβ+ϵβϵ(XTX)1अवशिष्ट विचरण के नमूना अनुमान से इसे गुणा करना और फिर वर्गमूल लेना। यह बहुत सरल गणना नहीं है, लेकिन कोई भी सॉफ्टवेयर पैकेज आपके लिए इसकी गणना करेगा और इसे आउटपुट में प्रदान करेगा।

उदाहरण

ड्रेपर और स्मिथ (मेरी टिप्पणी में संदर्भित) के पृष्ठ 134 पर, वे कम से कम वर्गों द्वारा फिटिंग के लिए निम्न डेटा प्रदान करते हैं एक मॉडल जहां ।ε ~ एन ( 0 , मैं σ 2 )Y=β0+β1X+εεN(0,Iσ2)

                      X                      Y                    XY
                      0                     -2                     0
                      2                      0                     0
                      2                      2                     4
                      5                      1                     5
                      5                      3                    15
                      9                      1                     9
                      9                      0                     0
                      9                      0                     0
                      9                      1                     9
                     10                     -1                   -10
                    ---                     --                   ---
Sum                  60                      5                    32
Sum of  Squares     482                     21                   528

एक उदाहरण की तरह दिखता है जहां ढलान 0 के करीब होना चाहिए।

Xt=(111111111102255999910).

इसलिए

XtX=(nXiXiXi2)=(106060482)

तथा

(XtX)1=(Xi2n(XiX¯)2X¯(XiX¯)2X¯(XiX¯)21(XiX¯)2)=(48210(122)612261221122)=(0.3950.0490.0490.008)

जहाँ ।X¯=Xi/n=60/10=6

अनुमान के लिए = (B0) = (Yb-बी 1 Xb) SXY / SXX बी 1β=(XTX)1XTY

b1 = 1/61 = 0.0163 और b0 = 0.5- 0.0163 (6) = 0.402

से Sb1 = Se (0.008) और Sb0 = Se (0.395) से ऊपर जहां Se त्रुटि अवधि के लिए अनुमानित मानक विचलन है। से = √2.3085।(XTX)1

क्षमा करें कि जब मैंने उन्हें काटा और पेस्ट किया तो समीकरण सबस्क्रिप्टिंग और सुपरस्क्रिप्ट नहीं हुए। तालिका ने अच्छी तरह से पुन: पेश नहीं किया क्योंकि रिक्त स्थान को अनदेखा कर दिया गया था। 3 नंबरों की पहली स्ट्रिंग XY और XY के पहले मानों के अनुरूप है और तीन के अनुवर्ती तंत्र के लिए समान है। सम के बाद क्रमशः XY और XY के लिए योग आते हैं और फिर XY और XY के लिए वर्गों का योग क्रमशः होता है। 2x2 के मैट्रिस भी गड़बड़ हो गए। कोष्ठक के बाद के मान बाईं ओर की संख्या के नीचे वाले कोष्ठक में होने चाहिए।


2
मेरी पुस्तक के लिए प्लग के रूप में इसका मतलब नहीं है, लेकिन मैं सरल रेखीय प्रतिगमन (Y = aX + b) में कम से कम वर्गों के समाधान की गणना के माध्यम से जाता हूं और a, b, pp.101-103, Biostatistics की अनिवार्य त्रुटियों के लिए मानक त्रुटियों की गणना करता हूं। चिकित्सकों, नर्सों, और चिकित्सकों, विली 2011 के लिए। अधिक विस्तृत विवरण ड्रेपर और स्मिथ एप्लाइड रिग्रेशन एनालिसिस 3 डी संस्करण, विली न्यू यॉर्क 1998 पृष्ठ 126-127 में पाया जा सकता है। मेरे जवाब में, मैं ड्रेपर और स्मिथ से एक उदाहरण लूंगा।
माइकल आर। चर्निक

8
जब मैंने इस साइट, माइकल के साथ बातचीत शुरू की, तो मेरी भी ऐसी ही भावनाएँ थीं। अनुभव के साथ, वे बदल गए हैं। यह कुछ जानने के लायक है और एक बार जब आप ऐसा करते हैं, तो यह लगभग (लगभग) इसे टाइप करने के लिए उतना ही तेज है जितना कि अंग्रेजी में कुछ भी लिखना है। मैंने यह भी सीखा, अनुकरणीय पदों का अध्ययन करके (जैसे @chl, कार्डिनल और अन्य उच्च-प्रति-पोस्ट उपयोगकर्ताओं द्वारा कई उत्तर), जो संदर्भ, स्पष्ट चित्र और सुविचारित समीकरण प्रदान करते हैं , आमतौर पर बहुत सराहना की जाती है और अच्छी तरह से प्राप्त किया। उच्च गुणवत्ता एक बात है जो इस साइट को अन्य लोगों से अलग करती है। TEX
whuber

2
यह सब अच्छा बिल है और यह अच्छा है कि इतने सारे लोग उन उच्च गुणवत्ता वाले पदों को देने के लिए समर्पित हैं। मैं अन्य प्रयोजनों के लिए लेटेक्स का उपयोग कर सकता हूं, जैसे कि प्रकाशन पत्र। लेकिन मेरे पास वह समय नहीं है कि मैं इस साइट पर उन सभी प्रयासों में जाऊँ जो लोग मुझसे उम्मीद करते हैं। मैं इस साइट पर केवल सेवा प्रदान करने के लिए समय का निवेश नहीं करने जा रहा हूं।
माइकल आर। चेरिक

4
मुझे लगता है कि डिस्कनेक्ट यहां है: "यह इस साइट के बारे में कई चीजों में से एक है जिसे अतिरिक्त समय और प्रयास में डालने के लिए उन पोस्टिंग की आवश्यकता होती है " - @whuber और मैं दोनों कह रहे हैं कि यह वास्तव में, अतिरिक्त समय नहीं लेता है अगर आप जानते हैं कि यह कैसे करना है। हम नहीं सीखतेTEXTEX

3
यहां के कई लोगों की तरह, हां, मैं एक सांख्यिकीविद् के रूप में काम करता हूं, लेकिन मुझे यह मजेदार लगने के लिए भी होता है - यह साइट मेरे लिए मनोरंजक है और यह एक अच्छा बोनस है कि दूसरों को मेरे कुछ पोस्ट उपयोगी लगते हैं। यदि आप साथ अपने समीकरणों को चिह्नित करते हैंTEX
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.