इसलिए जब मैं यह मानता हूं कि त्रुटि की शर्तें आम तौर पर एक रेखीय प्रतिगमन में वितरित की जाती हैं, तो प्रतिक्रिया चर, लिए इसका क्या मतलब है ?
इसलिए जब मैं यह मानता हूं कि त्रुटि की शर्तें आम तौर पर एक रेखीय प्रतिगमन में वितरित की जाती हैं, तो प्रतिक्रिया चर, लिए इसका क्या मतलब है ?
जवाबों:
शायद मैं बंद कर रहा हूँ, लेकिन मुझे लगता है कि हम के बारे में सोच किया जाना चाहिए , जिसके कारण मैं ओपी पढ़ें। रेखीय प्रतीपगमन की बहुत सबसे सामान्य स्थिति में यदि आपके मॉडल है y = एक्स β + ε त्रुटि अवधि फिर अपने मॉडल में केवल स्टोकेस्टिक घटक है। जैसे कि यह y के नमूने वितरण को निर्धारित करता है । यदि ε ~ एन ( 0 , σ 2 मैं ) तो y | एक्स , β ~ एन ( एक्स β , । क्या @Aniko का कहना है की निश्चित रूप से सच है च ( y ) (मामूली से अधिक एक्स , β हालांकि),। इसलिए जैसा कि यह खड़ा है सवाल थोड़ा अस्पष्ट है।
संक्षिप्त उत्तर यह है कि आप के वितरण के बारे में कुछ भी निष्कर्ष नहीं निकाल सकते , क्योंकि यह x के वितरण और संबंध की मजबूती और आकार पर निर्भर करता है । औपचारिक रूप से, y में "मानदंडों का मिश्रण" वितरण होगा, जो व्यवहार में बहुत कुछ भी हो सकता है।
इसका वर्णन करने के लिए यहां दो चरम उदाहरण हैं:
वास्तव में, चूंकि प्रत्येक वितरण को मानदंडों के मिश्रण के साथ मनमाने ढंग से अच्छी तरह से लगाया जा सकता है, आप वास्तव में लिए कोई भी वितरण प्राप्त कर सकते हैं ।
हम वास्तविक डेटा पर एक काल्पनिक मॉडल लगाकर त्रुटि शब्द का आविष्कार करते हैं; त्रुटि शब्द का वितरण प्रतिक्रिया के वितरण को प्रभावित नहीं करता है।
हम अक्सर यह मान लेते हैं कि त्रुटि सामान्य रूप से वितरित की जाती है और इस प्रकार मॉडल का निर्माण करने का प्रयास करते हैं ताकि हमारे अनुमानित अवशेष सामान्य रूप से वितरित हो सकें। यह कुछ वितरण के लिए मुश्किल हो सकता है । इन मामलों में, मुझे लगता है कि आप कह सकते हैं कि प्रतिक्रिया का वितरण त्रुटि अवधि को प्रभावित करता है।
यदि आप प्रतिक्रिया को रूप में लिखते हैं जहां m "मॉडल" ( y के लिए भविष्यवाणी ) और e "त्रुटियां" है, तो यह y - m = e को इंगित करने के लिए फिर से व्यवस्थित किया जा सकता है । इसलिए त्रुटियों के लिए एक वितरण असाइन करना वही तरीका है जो आपके मॉडल के अधूरे होने के तरीकों को इंगित करता है। इसे दूसरे तरीके से रखने के लिए यह इंगित करता है कि आप किस हद तक नहीं जानते हैं कि क्यों मनाया प्रतिक्रिया का मूल्य था कि यह वास्तव में था, और न कि मॉडल ने क्या भविष्यवाणी की थी। यदि आपको पता था कि आपका मॉडल सही था, तो आप त्रुटियों के लिए शून्य पर इसके सभी द्रव्यमान के साथ एक संभाव्यता वितरण असाइन करेंगे। एक एन असाइन करना (
एक अर्थ में त्रुटि वितरण प्रतिक्रिया की तुलना में मॉडल से अधिक निकटता से जुड़ा हुआ है। यह उपरोक्त समीकरण के गैर identifiability से देखा जा सकता है, अगर दोनों के लिए और ई अज्ञात हैं तो करने के लिए एक मनमाना वेक्टर जोड़ने मीटर और इसे से घटाकर ई सुराग का एक ही मूल्य के लिए y , y = मीटर + ई = ( मीटर + ख ) + ( ई - ख ) = मीटर ' + ई '। एक त्रुटि वितरण और एक मॉडल समीकरण का काम मूल रूप से कहता है कि कौन से मनमानी वैक्टर दूसरों की तुलना में अधिक प्रशंसनीय हैं।