शीर्षक "चर में त्रुटियां" और प्रश्न की सामग्री अलग-अलग लगती है, क्योंकि यह इस बारे में पूछता है कि हम सशर्त प्रतिक्रिया को मॉडलिंग करते समय एक्स में भिन्नता को ध्यान में नहीं रखते हैं , अर्थात् प्रतिगमन मापदंडों के लिए निष्कर्ष। वे दो पूर्वाग्रह मुझे रूढ़िवादी लगते हैं, इसलिए यहां मैं सामग्री पर प्रतिक्रिया देता हूं।
मैंने पहले भी इसी तरह के सवाल का जवाब दिया है, रजिस्टरों पर कंडीशनिंग के बीच क्या अंतर है? , इसलिए यहां मैं अपने उत्तर के भाग की प्रतिलिपि बनाऊंगा:
मैं कुछ हद तक औपचारिक रूप से regressors पर कंडीशनिंग के लिए एक तर्क को मांस देने की कोशिश करूंगा। आज्ञा देना ( य, एक्स) एक यादृच्छिक वेक्टर है, और ब्याज एक्स पर प्रतिगमन Y है , जहां प्रतिगमन का मतलब एक्स पर वाई की सशर्त अपेक्षा से लिया जाता है । एक बहुपक्षीय मान्यताओं के तहत जो एक रैखिक कार्य होगा, लेकिन हमारे तर्क उस पर निर्भर नहीं होते हैं। हम हमेशा की तरह संयुक्त घनत्व बाँटे के साथ शुरू
च ( y , x ) = च ( y | x ) च ( एक्स )एक्सYएक्सच( y, x ) = एफ( y| X ) च( x )
लेकिन उन कार्यों ज्ञात नहीं हैं तो हम एक पैरामिट्रीकृत मॉडल का उपयोग
च( y, x ; θ , ψ ) = चθ( y| X ) चψ( x )
जहां θ सशर्त वितरण parameterizes और ψ के सीमांत वितरण एक्स । सामान्य रेखीय मॉडल में हम कर सकते हैं θ = ( β, σ2) लेकिन वह नहीं माना जाता है। से भरा पैरामीटर अंतरिक्ष ( Θ , ψ ) हैΘ × Ψ , एक कार्तीय उत्पाद, और दो पैरामीटर आम में कोई हिस्सा नहीं है।
इसे सांख्यिकीय प्रयोग के एक कारक के रूप में समझा जा सकता है, (या डेटा निर्माण प्रक्रिया, DGP), पहले एक्स को चψ( x ) अनुसार उत्पन्न किया जाता है , और दूसरे चरण के रूप में, Y , सशर्त घनत्व चθ( y∣ एक्स= x ) अनुसार उत्पन्न होता है। θ ( y | एक्स = एक्स ) । ध्यान दें कि पहले कदम के बारे में कोई जानकारी का उपयोग नहीं करता θ , कि केवल दूसरे चरण में प्रवेश करती है। आँकड़ों एक्स के लिए सहायक है θ , देख https://en.wikipedia.org/wiki/Ancillary_statistic ।
लेकिन, पहले कदम के परिणामों पर निर्भर करता है, दूसरे चरण के बारे में और अधिक या कम जानकारी हो सकता है θ । वितरण के द्वारा दिए गए हैं चψ( x ) बहुत कम विचरण है, कहते हैं, जिसके तहत अवलोकन एक्स के एक छोटे से क्षेत्र में, केंद्रित किया जाएगा, ताकि यह अनुमान लगाने के लिए और अधिक कठिन हो जाएगा θ । तो, यह दो कदम प्रयोग के पहले भाग परिशुद्धता जिसके साथ निर्धारित करता है θ अनुमान लगाया जा सकता। इसलिए प्रतिगमन मापदंडों के बारे में अनुमान में एक्स= एक्स पर स्थिति होना स्वाभाविक है । यह सशर्त तर्क है, और उपरोक्त रूपरेखा इसकी धारणाओं को स्पष्ट करती है।
डिज़ाइन किए गए प्रयोगों में इसकी धारणा ज्यादातर धारण करेगी, अक्सर अवलोकन डेटा के साथ नहीं। समस्याओं के कुछ उदाहरण होंगे: भविष्यवाणियों के रूप में सुस्त प्रतिक्रियाओं के साथ प्रतिगमन। इस मामले में भविष्यवाणियों पर शर्त प्रतिक्रिया पर भी शर्त होगी! (मैं और उदाहरण जोड़ूंगा)।
§ 4.3
θएक्सθएक्सθ
यह पृथक्करण तर्क सहायक भी है क्योंकि यह उन मामलों की ओर इशारा करता है जहाँ इसका उपयोग नहीं किया जा सकता है, उदाहरण के लिए प्रतिगामी के रूप में पिछड़ी हुई प्रतिक्रियाओं के साथ प्रतिगमन।