'Y को सामान्य रूप से वितरित किया जाना चाहिए'
जरूर?
जिन मामलों में आप इसका उल्लेख करते हैं, वे मैला भाषा होते हैं (संक्षिप्त रूप में 'वाई में त्रुटि सामान्य रूप से वितरित की जानी चाहिए' ), लेकिन वे वास्तव में (दृढ़ता से) यह नहीं कहते हैं कि प्रतिक्रिया सामान्य रूप से वितरित की जानी चाहिए, या कम से कम यह प्रतीत नहीं होता है मुझे लगता है कि उनके शब्दों की तरह इरादा था।
पेन स्टेट कोर्स सामग्री
YYiE(Yi)=β0+β1xi
Yi
Yi∼N(β0+β1xi,σ2)
YYi
YiY
सांख्यिकी वेबपेज
अत्यंत संक्षिप्त, सरलीकृत, सरलीकृत विवरण है। मुझे यकीन नहीं है कि आपको इसे गंभीरता से लेना चाहिए। उदाहरण के लिए, यह बोलता है
.. सभी चर को सामान्य करने के लिए बहुभिन्नरूपी होना चाहिए ...
इतना है कि सिर्फ प्रतिक्रिया चर नहीं है,
और 'बहुभिन्नरूपी' वर्णनकर्ता भी अस्पष्ट है। मुझे यकीन नहीं है कि उस व्याख्या को कैसे प्राप्त किया जाए।
विकिपीडिया लेख
कोष्ठक में समझाया गया एक अतिरिक्त संदर्भ है:
साधारण रेखीय प्रतिगमन किसी दिए गए अज्ञात मात्रा (प्रतिक्रिया चर, एक यादृच्छिक चर) के अपेक्षित मान को प्रेक्षित मानों (भविष्यवक्ताओं) के सेट के रैखिक संयोजन के रूप में भविष्यवाणी करता है । इसका तात्पर्य यह है कि पूर्वसूचक में लगातार परिवर्तन से प्रतिक्रिया चर (यानी रैखिक-प्रतिक्रिया मॉडल) में निरंतर परिवर्तन होता है। यह उचित है जब प्रतिक्रिया चर का सामान्य वितरण होता है (सहजता से, जब एक प्रतिक्रिया चर अनिवार्य रूप से अनिश्चित काल तक किसी भी निश्चित "शून्य मान" के साथ किसी भी दिशा में अलग-अलग हो सकता है या अधिक मात्रा में किसी भी मात्रा के लिए हो सकता है, जो केवल अपेक्षाकृत कम राशि से भिन्न होता है, जैसे मानव। ऊंचाइयों)।
y+ϵϵ∼N(0,σ)
8 मार्च 2012 को विशेष लाइन को जोड़ा गया है , लेकिन ध्यान दें कि विकिपीडिया लेख की पहली पंक्ति अभी भी "साधारण रैखिक प्रतिगमन के लचीले सामान्यीकरण को पढ़ती है जो प्रतिक्रिया चर के लिए अनुमति देता है जिसमें सामान्य वितरण के अलावा त्रुटि वितरण मॉडल हैं " और नहीं है इतना (हर जगह नहीं) गलत।
निष्कर्ष
इसलिए, इन तीन उदाहरणों के आधार पर (जो वास्तव में गलतफहमी पैदा कर सकता है , या कम से कम गलत समझा जा सकता है) मैं यह नहीं कहूंगा कि "यह गलत धारणा फैल गई है" । या कम से कम यह मुझे नहीं लगता है कि उन तीन उदाहरणों का उद्देश्य यह तर्क देना है कि वाई को सामान्य रूप से वितरित किया जाना चाहिए (हालांकि मुझे याद है कि यह मुद्दा स्टैटेक्सचेंज पर यहां पहले उत्पन्न हुआ है, सामान्य रूप से वितरित त्रुटियों और सामान्य रूप से वितरित प्रतिक्रिया चर के बीच स्वैप बनाने में आसान है)।
इसलिए, यह धारणा कि 'वाई को सामान्य रूप से वितरित किया जाना चाहिए' मुझे ऐसा लगता है कि व्यापक विश्वास / गलत धारणा (जैसा कि लाल हेरिंग की तरह फैलता है) में ऐसा नहीं है, लेकिन अधिक सामान्य त्रुटि की तरह है (जो फैल नहीं है लेकिन स्वतंत्र रूप से हर बार बनाया जाता है। )।
अतिरिक्त टिप्पणी
इस वेबसाइट पर गलती का एक उदाहरण निम्नलिखित प्रश्न में है
क्या होगा यदि अवशेषों को सामान्य रूप से वितरित किया जाता है, लेकिन y नहीं है?
मैं इसे एक शुरुआती प्रश्न मानूंगा। यह पेन स्टेट कोर्स सामग्री, विकिपीडिया वेबसाइट जैसी सामग्रियों में मौजूद नहीं है, और हाल ही में 'आर के साथ रैखिक प्रतिगमन का विस्तार' पुस्तक की टिप्पणियों में उल्लेख किया गया है।
उन कार्यों के लेखक सामग्री को सही ढंग से समझते हैं। दरअसल, वे ऐसे वाक्यांशों का उपयोग करते हैं, जैसे 'वाई को सामान्य रूप से वितरित किया जाना चाहिए', लेकिन संदर्भ और उपयोग किए गए फॉर्मूले के आधार पर आप देख सकते हैं कि वे सभी का अर्थ 'वाई, एक्स पर सशर्त, सामान्य रूप से वितरित किया जाना चाहिए' और नहीं 'सीमांत वाई' होना चाहिए आम तौर पर वितरित किया जाता है '। वे स्वयं इस विचार को गलत नहीं ठहरा रहे हैं, और कम से कम यह विचार सांख्यिकीविदों और लोगों के बीच व्यापक नहीं है जो किताबें और अन्य पाठ्यक्रम सामग्री लिखते हैं। लेकिन उनके अस्पष्ट शब्दों को गलत तरीके से फैलाने से गलत धारणा पैदा हो सकती है।