मैं थोड़ा भ्रमित हूँ अगर एक सांख्यिकीय मॉडल में एक स्वतंत्र चर (जिसे भविष्यवक्ता या सुविधा भी कहा जाता है), उदाहरण के लिए, रैखिक प्रतिगमन में , एक यादृच्छिक चर है?
मैं थोड़ा भ्रमित हूँ अगर एक सांख्यिकीय मॉडल में एक स्वतंत्र चर (जिसे भविष्यवक्ता या सुविधा भी कहा जाता है), उदाहरण के लिए, रैखिक प्रतिगमन में , एक यादृच्छिक चर है?
जवाबों:
रैखिक प्रतिगमन के दो सामान्य सूत्र हैं। अवधारणाओं पर ध्यान केंद्रित करने के लिए, मैं उन्हें कुछ हद तक सार करूंगा। गणितीय विवरण अंग्रेजी विवरण की तुलना में थोड़ा अधिक शामिल है, तो चलिए बाद के साथ शुरू करते हैं:
रेखीय प्रतिगमन एक मॉडल है जिसमें एक प्रतिक्रिया को एक रेखीय मैप माध्यम से रजिस्टरों द्वारा निर्धारित वितरण के साथ यादृच्छिक रूप से माना जाता है और, संभवतः, अन्य मापदंडों ।
अधिकांश मामलों में संभावित वितरण का सेट पैरामीटर और साथ एक स्थान परिवार है और पैरामीटर देता है । चापलूसी का उदाहरण साधारण प्रतिगमन है जिसमें वितरण का सेट सामान्य परिवार और रजिस्टरों का एक रैखिक कार्य है।एन ( μ , σ ) μ = बीटा ( एक्स )
क्योंकि मैंने अभी तक इसे गणितीय रूप से वर्णित नहीं किया है, यह अभी भी एक खुला प्रश्न है कि किस प्रकार की गणितीय वस्तुएं , , और उल्लेख है - और मेरा मानना है कि इस धागे में मुख्य मुद्दा है। यद्यपि कोई भी विभिन्न (समतुल्य) विकल्प बना सकता है, अधिकांश निम्नलिखित विवरण के बराबर या विशेष मामलों के बराबर होगा।
फिक्स्ड रेजिस्टर। Regressors असली वैक्टर के रूप में प्रतिनिधित्व कर रहे हैं । प्रतिक्रिया एक यादृच्छिक चर रहा है (जहां एक सिग्मा क्षेत्र और संभावना के साथ संपन्न है)। मॉडल एक समारोह है (या, आप की तरह है, कार्यों का एक सेट द्वारा parameterized )। आयाम के एक परिमित आयामी संस्थानिक (आमतौर पर दूसरे विभेदक) submanifold (या submanifold-साथ सीमा) है संभाव्यता वितरण के स्थान की। वाई : Ω → आर Ω च : आर × Θ → एम डी आर → एम डी Θ एम डी घ च Θ ⊂ आर डी - 1 Y च ( बीटा ( एक्स ) , θ ) बीटा ∈ आर पी * θ ∈ θ Y ~ च ( β ( एक्स ) , θआमतौर पर निरंतर (या पर्याप्त रूप से भिन्न) होने के लिए लिया जाता है। "उपद्रव पैरामीटर" हैं। यह माना जाता है कि का वितरण कुछ अज्ञात दोहरे वेक्टर ("प्रतिगमन गुणांक") और अज्ञात लिए । हम इसे लिख सकते हैं
रैंडम रिग्रेसर्स। Regressors और response एक आयामी वेक्टर-वैल्यू रैंडम वेरिएबल । मॉडल पहले की तरह ही वस्तु है, लेकिन अब यह सशर्त संभाव्यता theY | एक्स ~ च ( β ( एक्स ) , θ ) ।
गणितीय विवरण कुछ नुस्खे के बिना बेकार है, यह बताता है कि इसे डेटा पर कैसे लागू किया जाना है। निश्चित प्रतिगामी मामले में हम को गर्भ धारण करने वाले के रूप में निर्दिष्ट करते हैं। इस प्रकार यह देखने के लिए मदद कर सकता है एक उत्पाद के रूप एक उत्पाद सिग्मा बीजगणित के साथ संपन्न। प्रयोग करने वाला और प्रकृति निर्धारित करता है (कुछ अज्ञात, अमूर्त) । यादृच्छिक regressor मामले में, प्रकृति को निर्धारित करता है , यादृच्छिक चर के घटक निर्धारित करता है(जो "मनाया गया" है), और हमारे पास अब एक ऑर्डर की गई जोड़ी ।
एकाधिक रैखिक प्रतिगमन (जो मैं इस सामान्य से अधिक के बजाय वस्तुओं के लिए मानक संकेतन का उपयोग करके व्यक्त करूँगा) का आर्कषक उदाहरण है कि कुछ स्थिर । जैसा कि पूरे भिन्न होता है , इसकी छवि एक आयामी उपसमुच्चय को अलग करती है - एक वक्र - जो सामान्य वितरण के दो-आयामी कई गुना है।
जब - किसी भी फैशन whatsoever-- में के रूप में अनुमान लगाया गया है और के रूप में , का मान है भविष्यवाणी मूल्य के के साथ जुड़े --whether प्रयोगकर्ता (केस 1) द्वारा नियंत्रित किया जाता है या केवल मनाया जाता है (केस 2)। हम या तो एक मूल्य (मामले 1) सेट या प्राप्ति (मामले 2) दिखाई देती है तो का , तो प्रतिक्रिया कि के साथ जुड़े एक यादृच्छिक चर जिसका वितरण है , जो अज्ञात है लेकिनबीटा σ σ बीटा ( एक्स ) वाई एक्स एक्स एक्स एक्स वाई एक्स एन ( बीटा ( एक्स ) , σ ) एन ( बीटा ( एक्स ) , σ ) अनुमान लगाया जा करने के लिए ।
सबसे पहले, @whuber ने एक उत्कृष्ट उत्तर दिया। मैं इसे एक अलग तरह से लेता हूँ, शायद कुछ अर्थों में सरल, एक पाठ के संदर्भ में भी।
प्रतिगमन सूत्रीकरण में को यादृच्छिक या निश्चित किया जा सकता है। यह आपकी समस्या पर निर्भर करता है। तथाकथित अवलोकन संबंधी अध्ययनों के लिए इसे यादृच्छिक होना पड़ता है, और प्रयोगों के लिए इसे आमतौर पर तय किया जाता है।
उदाहरण एक। मैं धातु के हिस्से की कठोरता पर इलेक्ट्रॉन विकिरण के संपर्क के प्रभाव का अध्ययन कर रहा हूं। इसलिए, मैं धातु के हिस्से के कुछ नमूने लेता हूं और विकिरण के विभिन्न स्तरों को उजागर करता हूं। मेरा एक्सपोज़र स्तर एक्स है, और यह तय है , क्योंकि मैंने उन स्तरों पर सेट किया है जिन्हें मैंने चुना था। मैं प्रयोग की शर्तों को पूरी तरह से नियंत्रित करता हूं, या कम से कम करने की कोशिश करता हूं। मैं तापमान और आर्द्रता जैसे अन्य मापदंडों के साथ भी ऐसा कर सकता हूं।
उदाहरण दो। आप क्रेडिट कार्ड अनुप्रयोगों में धोखाधड़ी की घटनाओं की आवृत्ति पर अर्थव्यवस्था के प्रभाव का अध्ययन कर रहे हैं। तो, आप जीडीपी पर धोखाधड़ी की घटना को फिर से दर्ज करते हैं। आप जीडीपी को नियंत्रित नहीं करते हैं, आप एक वांछित स्तर पर सेट नहीं कर सकते हैं। इसके अलावा, आप शायद बहुभिन्नरूपी प्रतिगमन को देखना चाहते हैं, इसलिए आपके पास बेरोजगारी जैसे अन्य चर हैं, और अब आपके पास एक्स में मूल्यों का एक संयोजन है, जिसे आप देखते हैं , लेकिन नियंत्रण नहीं करते हैं। इस स्थिति में X यादृच्छिक है ।
उदाहरण तीन। आप क्षेत्र में नए कीटनाशक की प्रभावकारिता का अध्ययन कर रहे हैं, अर्थात प्रयोगशाला स्थितियों में नहीं, बल्कि वास्तविक प्रायोगिक खेत में। इस मामले में आप कुछ नियंत्रित कर सकते हैं, उदाहरण के लिए आप कीटनाशक की मात्रा को नियंत्रित कर सकते हैं। हालाँकि, आप सब कुछ नियंत्रित नहीं करते हैं, जैसे मौसम या मिट्टी की स्थिति। ठीक है, आप कुछ हद तक मिट्टी को नियंत्रित कर सकते हैं, लेकिन पूरी तरह से नहीं। यह एक बीच का मामला है, जहां कुछ शर्तों का पालन किया जाता है और कुछ शर्तों को नियंत्रित किया जाता है । अध्ययन के इस पूरे क्षेत्र को प्रयोगात्मक डिजाइन कहा जाता है जो वास्तव में इस तीसरे मामले पर केंद्रित है, जहां कृषि अनुसंधान इसके सबसे बड़े अनुप्रयोगों में से एक है।
यहाँ एक उत्तर का गणितीय भाग मिलता है। आम तौर पर रैखिक प्रतिगमन का अध्ययन करते समय प्रस्तुत की जाने वाली मान्यताओं का एक समूह है, जिसे गॉस-मार्कोव स्थितियां कहा जाता है। वे बहुत सैद्धांतिक हैं और कोई भी साबित करने के लिए परेशान नहीं करता है कि वे किसी भी व्यावहारिक सेट में पकड़ रखते हैं। हालांकि, वे सामान्य न्यूनतम वर्गों (ओएलएस) विधि की सीमाओं को समझने में बहुत उपयोगी हैं।
तो, मान्यताओं का सेट यादृच्छिक और निश्चित एक्स के लिए अलग है, जो मोटे तौर पर अवलोकन बनाम प्रयोगात्मक अध्ययन के अनुरूप है। मोटे तौर पर, क्योंकि जैसा कि मैंने तीसरे उदाहरण में दिखाया है, कभी-कभी हम वास्तव में चरम सीमाओं के बीच में होते हैं। मैंने पाया कि "गॉस-मार्कोव" प्रमेय खंड इनसाइक्लोपीडिया ऑफ रिसर्च डिज़ाइन इन सल्किंड, शुरू करने के लिए एक अच्छी जगह है, यह Google पुस्तकों में उपलब्ध है।
निश्चित डिज़ाइन की भिन्न धारणाएँ सामान्य प्रतिगमन मॉडल निम्न हैं:
बनाम यादृच्छिक डिजाइन में समान धारणाएं:
जैसा कि आप देख सकते हैं कि अंतर यादृच्छिक डिजाइन के लिए डिज़ाइन मैट्रिक्स पर मान्यताओं को कंडीशनिंग में है। कंडीशनिंग इन मजबूत धारणाओं को बनाता है। उदाहरण के लिए, हम केवल निश्चित डिजाइन की तरह नहीं कह रहे हैं कि त्रुटियों का शून्य मतलब है; यादृच्छिक डिजाइन में हम यह भी कहते हैं कि वे एक्स, कोवरिएट पर निर्भर नहीं हैं।
आँकड़ों में एक यादृच्छिक चर वह मात्रा है जो किसी न किसी तरह से यादृच्छिक रूप से भिन्न होती है। आप इस उत्कृष्ट सीवी धागे में एक अच्छी चर्चा पा सकते हैं: "यादृच्छिक चर" से क्या मतलब है?
एक प्रतिगमन मॉडल में, भविष्यवक्ता चर (एक्स-चर, व्याख्यात्मक चर, सहसंयोजक, आदि) को निश्चित और ज्ञात माना जाता है । उन्हें यादृच्छिक नहीं माना जाता है। मॉडल में सभी यादृच्छिकता को त्रुटि शब्द में माना जाता है। मानक रूप में तैयार किए गए एक साधारण रैखिक प्रतिगमन मॉडल पर विचार करें:
त्रुटि शब्द, , एक यादृच्छिक चर है और मॉडल में यादृच्छिकता का स्रोत है। त्रुटि शब्द के परिणामस्वरूप, एक यादृच्छिक चर भी है। लेकिन को एक यादृच्छिक चर नहीं माना जाता है। (बेशक, यह वास्तविकता में एक यादृच्छिक चर हो सकता है
सुनिश्चित नहीं है कि अगर मैं प्रश्न को समझता हूं, लेकिन यदि आप केवल पूछ रहे हैं, "एक स्वतंत्र चर हमेशा एक यादृच्छिक चर होना चाहिए", तो उत्तर नहीं है।
एक स्वतंत्र चर एक चर है जो आश्रित चर के साथ सहसंबद्ध होने के लिए परिकल्पित है। आप तब परीक्षण करते हैं कि क्या यह मॉडलिंग के माध्यम से मामला है (संभवतः प्रतिगमन विश्लेषण)।
यहाँ बहुत सारी जटिलताएँ हैं और "ifs, buts and maybes" हैं, इसलिए मैं सुझाव दूंगा कि एक बुनियादी अर्थमिति या सांख्यिकी पुस्तक की एक प्रति प्राप्त करें जो प्रतिगमन विश्लेषण को कवर करे और इसे अच्छी तरह से पढ़े, या फिर एक बुनियादी आँकड़े / अर्थशास्त्र से कक्षा के नोट्स प्राप्त करें। यदि संभव हो तो ऑनलाइन पाठ्यक्रम।