स्वतंत्र चर = यादृच्छिक चर?


25

मैं थोड़ा भ्रमित हूँ अगर एक सांख्यिकीय मॉडल में एक स्वतंत्र चर (जिसे भविष्यवक्ता या सुविधा भी कहा जाता है), उदाहरण के लिए, रैखिक प्रतिगमन में , एक यादृच्छिक चर है?XY=β0+β1X


12
रैखिक मॉडल पर सशर्त है , इसलिए यह यादृच्छिक है या नहीं, इससे कोई फर्क नहीं पड़ता। X
शीआन

4
इसकी जाँच करें । अच्छा सवाल, बीटीडब्लू।
एंटनी परेलाडा

@ शीआन, निश्चित डिजाइन में पर रैखिक मॉडल मान्यताओं को वातानुकूलित नहीं किया गया है , मेरा जवाब देखें। तो, यह बहुत मायने रखता है। यही कारण है कि पर्यवेक्षणीय अध्ययन के परिणामों की तुलना में प्रयोगों की व्याख्या करना बहुत आसान हैX
अक्षल

जवाबों:


19

रैखिक प्रतिगमन के दो सामान्य सूत्र हैं। अवधारणाओं पर ध्यान केंद्रित करने के लिए, मैं उन्हें कुछ हद तक सार करूंगा। गणितीय विवरण अंग्रेजी विवरण की तुलना में थोड़ा अधिक शामिल है, तो चलिए बाद के साथ शुरू करते हैं:

रेखीय प्रतिगमन एक मॉडल है जिसमें एक प्रतिक्रिया को एक रेखीय मैप माध्यम से रजिस्टरों द्वारा निर्धारित वितरण के साथ यादृच्छिक रूप से माना जाता है और, संभवतः, अन्य मापदंडों ।YXβ(X)θ

अधिकांश मामलों में संभावित वितरण का सेट पैरामीटर और साथ एक स्थान परिवार है और पैरामीटर देता है । चापलूसी का उदाहरण साधारण प्रतिगमन है जिसमें वितरण का सेट सामान्य परिवार और रजिस्टरों का एक रैखिक कार्य है।αθβ(X)αएन ( μ , σ ) μ = बीटा ( एक्स )N(μ,σ)μ=β(X)

क्योंकि मैंने अभी तक इसे गणितीय रूप से वर्णित नहीं किया है, यह अभी भी एक खुला प्रश्न है कि किस प्रकार की गणितीय वस्तुएं , , और उल्लेख है - और मेरा मानना ​​है कि इस धागे में मुख्य मुद्दा है। यद्यपि कोई भी विभिन्न (समतुल्य) विकल्प बना सकता है, अधिकांश निम्नलिखित विवरण के बराबर या विशेष मामलों के बराबर होगा।XYβθ


  1. फिक्स्ड रेजिस्टर। Regressors असली वैक्टर के रूप में प्रतिनिधित्व कर रहे हैं । प्रतिक्रिया एक यादृच्छिक चर रहा है (जहां एक सिग्मा क्षेत्र और संभावना के साथ संपन्न है)। मॉडल एक समारोह है (या, आप की तरह है, कार्यों का एक सेट द्वारा parameterized )। आयाम के एक परिमित आयामी संस्थानिक (आमतौर पर दूसरे विभेदक) submanifold (या submanifold-साथ सीमा) है संभाव्यता वितरण के स्थान की। XRp वाई : Ω आर Ω : आर × Θ एम डी आरएम डी Θ एम डीΘ आर डी - 1 Y ( बीटा ( एक्स ) , θ ) बीटा आर पी * θ θ Y ~ ( β ( एक्स ) , θY:ΩRΩf:R×ΘMdRMdΘMddfआमतौर पर निरंतर (या पर्याप्त रूप से भिन्न) होने के लिए लिया जाता है। "उपद्रव पैरामीटर" हैं। यह माना जाता है कि का वितरण कुछ अज्ञात दोहरे वेक्टर ("प्रतिगमन गुणांक") और अज्ञात लिए । हम इसे लिख सकते हैंΘRd1Yf(β(X),θ)βRpθΘ

    Yf(β(X),θ).

  2. रैंडम रिग्रेसर्स। Regressors और response एक आयामी वेक्टर-वैल्यू रैंडम वेरिएबल । मॉडल पहले की तरह ही वस्तु है, लेकिन अब यह सशर्त संभाव्यता thep+1Z=(X,Y):ΩRp×RfY | एक्स ~ ( β ( एक्स ) , θ )

    Y|Xf(β(X),θ).

गणितीय विवरण कुछ नुस्खे के बिना बेकार है, यह बताता है कि इसे डेटा पर कैसे लागू किया जाना है। निश्चित प्रतिगामी मामले में हम को गर्भ धारण करने वाले के रूप में निर्दिष्ट करते हैं। इस प्रकार यह देखने के लिए मदद कर सकता है एक उत्पाद के रूप एक उत्पाद सिग्मा बीजगणित के साथ संपन्न। प्रयोग करने वाला और प्रकृति निर्धारित करता है (कुछ अज्ञात, अमूर्त) । यादृच्छिक regressor मामले में, प्रकृति को निर्धारित करता है , यादृच्छिक चर के घटक निर्धारित करता हैXΩRp×ΩXωΩωΩXπX(Z(ω))X(जो "मनाया गया" है), और हमारे पास अब एक ऑर्डर की गई जोड़ी ।(X(ω),ω))Ω


एकाधिक रैखिक प्रतिगमन (जो मैं इस सामान्य से अधिक के बजाय वस्तुओं के लिए मानक संकेतन का उपयोग करके व्यक्त करूँगा) का आर्कषक उदाहरण है कि कुछ स्थिर । जैसा कि पूरे भिन्न होता है , इसकी छवि एक आयामी उपसमुच्चय को अलग करती है - एक वक्र - जो सामान्य वितरण के दो-आयामी कई गुना है।

f(β(X),σ)=N(β(x),σ)
σΘ=R+xRp

जब - किसी भी फैशन whatsoever-- में के रूप में अनुमान लगाया गया है और के रूप में , का मान है भविष्यवाणी मूल्य के के साथ जुड़े --whether प्रयोगकर्ता (केस 1) द्वारा नियंत्रित किया जाता है या केवल मनाया जाता है (केस 2)। हम या तो एक मूल्य (मामले 1) सेट या प्राप्ति (मामले 2) दिखाई देती है तो का , तो प्रतिक्रिया कि के साथ जुड़े एक यादृच्छिक चर जिसका वितरण है , जो अज्ञात है लेकिनβबीटा σ σ बीटा ( एक्स ) वाई एक्स एक्स एक्स एक्स वाई एक्स एन ( बीटा ( एक्स ) , σ ) एन ( बीटा ( एक्स ) , σ )β^σσ^β^(x)YxxxX YXN(β(x),σ)अनुमान लगाया जा करने के लिए ।N(β^(x),σ^)


मुझे केवल उल्लेख करना है, कि यह एक शानदार उत्तर है (लेकिन शायद हर किसी के लिए नहीं)।
l7ll7

2
पुनश्च क्या आप किसी पुस्तक के बारे में जानते हैं, जहाँ इन मूलभूत प्रश्न को यहाँ बताया गया है? एक गणितज्ञ के रूप में, मुझे मिली सभी पुस्तकों ने अन्य उत्तरों को यहां पर प्रतिबिंबित किया, जो गणितीय दृष्टिकोण से बहुत कम सटीक हैं। (यह उन्हें बुरा नहीं बनाता है, निश्चित रूप से, यह सिर्फ इतना है कि वे किताबें मेरे लिए नहीं हैं - मुझे ऐसी पुस्तक पसंद आएगी जो इस उत्तर की तरह अधिक सटीक हो।)
l7ll7

अंतिम पैराग्राफ के पहले वाक्य में, लिए अनुमानित मान (यादृच्छिक चर का बोध ) नहीं है, लिए अनुमानित मूल्य नहीं है ? या मैं अपनी भाषा को गलत समझा, और "के लिए भविष्यवाणी की मूल्य का अर्थ है" "भविष्यवाणी मूल्य जब के सेट (मनाया गया) मूल्य है ?" yवाईएक्सएक्सएक्सएक्सβ^(x)yYxxxX
चाड

1
@ धन्यवाद अस्पष्ट भाषा को इंगित करने के लिए धन्यवाद। मैंने अर्थ को स्पष्ट करने के लिए उस वाक्य को संपादित किया है, जो आपकी समझ के अनुरूप है।
whuber

7

सबसे पहले, @whuber ने एक उत्कृष्ट उत्तर दिया। मैं इसे एक अलग तरह से लेता हूँ, शायद कुछ अर्थों में सरल, एक पाठ के संदर्भ में भी।

प्रेरणा

Xप्रतिगमन सूत्रीकरण में को यादृच्छिक या निश्चित किया जा सकता है। यह आपकी समस्या पर निर्भर करता है। तथाकथित अवलोकन संबंधी अध्ययनों के लिए इसे यादृच्छिक होना पड़ता है, और प्रयोगों के लिए इसे आमतौर पर तय किया जाता है।

उदाहरण एक। मैं धातु के हिस्से की कठोरता पर इलेक्ट्रॉन विकिरण के संपर्क के प्रभाव का अध्ययन कर रहा हूं। इसलिए, मैं धातु के हिस्से के कुछ नमूने लेता हूं और विकिरण के विभिन्न स्तरों को उजागर करता हूं। मेरा एक्सपोज़र स्तर एक्स है, और यह तय है , क्योंकि मैंने उन स्तरों पर सेट किया है जिन्हें मैंने चुना था। मैं प्रयोग की शर्तों को पूरी तरह से नियंत्रित करता हूं, या कम से कम करने की कोशिश करता हूं। मैं तापमान और आर्द्रता जैसे अन्य मापदंडों के साथ भी ऐसा कर सकता हूं।

उदाहरण दो। आप क्रेडिट कार्ड अनुप्रयोगों में धोखाधड़ी की घटनाओं की आवृत्ति पर अर्थव्यवस्था के प्रभाव का अध्ययन कर रहे हैं। तो, आप जीडीपी पर धोखाधड़ी की घटना को फिर से दर्ज करते हैं। आप जीडीपी को नियंत्रित नहीं करते हैं, आप एक वांछित स्तर पर सेट नहीं कर सकते हैं। इसके अलावा, आप शायद बहुभिन्नरूपी प्रतिगमन को देखना चाहते हैं, इसलिए आपके पास बेरोजगारी जैसे अन्य चर हैं, और अब आपके पास एक्स में मूल्यों का एक संयोजन है, जिसे आप देखते हैं , लेकिन नियंत्रण नहीं करते हैं। इस स्थिति में X यादृच्छिक है

उदाहरण तीन। आप क्षेत्र में नए कीटनाशक की प्रभावकारिता का अध्ययन कर रहे हैं, अर्थात प्रयोगशाला स्थितियों में नहीं, बल्कि वास्तविक प्रायोगिक खेत में। इस मामले में आप कुछ नियंत्रित कर सकते हैं, उदाहरण के लिए आप कीटनाशक की मात्रा को नियंत्रित कर सकते हैं। हालाँकि, आप सब कुछ नियंत्रित नहीं करते हैं, जैसे मौसम या मिट्टी की स्थिति। ठीक है, आप कुछ हद तक मिट्टी को नियंत्रित कर सकते हैं, लेकिन पूरी तरह से नहीं। यह एक बीच का मामला है, जहां कुछ शर्तों का पालन ​​किया जाता है और कुछ शर्तों को नियंत्रित किया जाता है । अध्ययन के इस पूरे क्षेत्र को प्रयोगात्मक डिजाइन कहा जाता है जो वास्तव में इस तीसरे मामले पर केंद्रित है, जहां कृषि अनुसंधान इसके सबसे बड़े अनुप्रयोगों में से एक है।

गणित

यहाँ एक उत्तर का गणितीय भाग मिलता है। आम तौर पर रैखिक प्रतिगमन का अध्ययन करते समय प्रस्तुत की जाने वाली मान्यताओं का एक समूह है, जिसे गॉस-मार्कोव स्थितियां कहा जाता है। वे बहुत सैद्धांतिक हैं और कोई भी साबित करने के लिए परेशान नहीं करता है कि वे किसी भी व्यावहारिक सेट में पकड़ रखते हैं। हालांकि, वे सामान्य न्यूनतम वर्गों (ओएलएस) विधि की सीमाओं को समझने में बहुत उपयोगी हैं।

तो, मान्यताओं का सेट यादृच्छिक और निश्चित एक्स के लिए अलग है, जो मोटे तौर पर अवलोकन बनाम प्रयोगात्मक अध्ययन के अनुरूप है। मोटे तौर पर, क्योंकि जैसा कि मैंने तीसरे उदाहरण में दिखाया है, कभी-कभी हम वास्तव में चरम सीमाओं के बीच में होते हैं। मैंने पाया कि "गॉस-मार्कोव" प्रमेय खंड इनसाइक्लोपीडिया ऑफ रिसर्च डिज़ाइन इन सल्किंड, शुरू करने के लिए एक अच्छी जगह है, यह Google पुस्तकों में उपलब्ध है।

निश्चित डिज़ाइन की भिन्न धारणाएँ सामान्य प्रतिगमन मॉडल निम्न हैं:Y=Xβ+ε

  • E[ε]=0
  • समरूपता,E[ε2]=σ2
  • कोई सीरियल सहसंबंध नहीं,E[εi,εj]=0

बनाम यादृच्छिक डिजाइन में समान धारणाएं:

  • E[ε|X]=0
  • समरूपता,E[ε2|X]=σ2
  • कोई सीरियल सहसंबंध नहीं,E[εi,εj|X]=0

जैसा कि आप देख सकते हैं कि अंतर यादृच्छिक डिजाइन के लिए डिज़ाइन मैट्रिक्स पर मान्यताओं को कंडीशनिंग में है। कंडीशनिंग इन मजबूत धारणाओं को बनाता है। उदाहरण के लिए, हम केवल निश्चित डिजाइन की तरह नहीं कह रहे हैं कि त्रुटियों का शून्य मतलब है; यादृच्छिक डिजाइन में हम यह भी कहते हैं कि वे एक्स, कोवरिएट पर निर्भर नहीं हैं।


2

आँकड़ों में एक यादृच्छिक चर वह मात्रा है जो किसी न किसी तरह से यादृच्छिक रूप से भिन्न होती है। आप इस उत्कृष्ट सीवी धागे में एक अच्छी चर्चा पा सकते हैं: "यादृच्छिक चर" से क्या मतलब है?

एक प्रतिगमन मॉडल में, भविष्यवक्ता चर (एक्स-चर, व्याख्यात्मक चर, सहसंयोजक, आदि) को निश्चित और ज्ञात माना जाता है । उन्हें यादृच्छिक नहीं माना जाता है। मॉडल में सभी यादृच्छिकता को त्रुटि शब्द में माना जाता है। मानक रूप में तैयार किए गए एक साधारण रैखिक प्रतिगमन मॉडल पर विचार करें: त्रुटि शब्द, , एक यादृच्छिक चर है और मॉडल में यादृच्छिकता का स्रोत है। त्रुटि शब्द के परिणामस्वरूप, एक यादृच्छिक चर भी है। लेकिन को एक यादृच्छिक चर नहीं माना जाता है। (बेशक, यह वास्तविकता में एक यादृच्छिक चर हो सकता है

Y=β0+β1X+εwhere εN(0,σ2)
εYX, लेकिन यह मॉडल में ग्रहण या प्रतिबिंबित नहीं है।)

तो आपका मतलब है कि एक स्थिरांक है? क्योंकि यह गणितीय दृष्टिकोण से अर्थ करने का एकमात्र तरीका है , क्योंकि एक यादृच्छिक चर है और इसके अलावा केवल दो यादृच्छिक चर के बीच परिभाषित किया जाता है न कि "कुछ और" + यादृच्छिक चर। हालांकि दो यादृच्छिक चर में से एक निरंतर हो सकता है, जो कि मैं जिस मामले का उल्लेख कर रहा हूं। XXε
l7ll7

पी एस मैंने कहा लिंक से सभी स्पष्टीकरणों को देखा और कोई भी बहुत रोशन नहीं है: क्यों? क्योंकि कोई भी यादृच्छिक चर के बीच संबंध नहीं बनाता है क्योंकि संभाव्य लोग इसे समझते हैं कि सांख्यिकीविद् इसे कैसे समझते हैं। तो कुछ जवाब मानक, सटीक संभावना सिद्धांत परिभाषा को बहाल करते हैं, जबकि अन्य लोग (अभी तक मुझे स्पष्ट नहीं) अस्पष्ट सांख्यिकीय परिभाषा को पुनर्स्थापित करते हैं। लेकिन कोई भी वास्तव में इन दो अवधारणाओं के बीच संबंध की व्याख्या नहीं करता है । (एकमात्र अपवाद लंबे टिकट-इन-बॉक्स मॉडल उत्तर है, जो कुछ वादा दिखा सकता है, लेकिन यहां तक ​​कि [...]
l7ll7

यह अंतर स्पष्ट रूप से स्पष्ट रूप से रोशन होने के लिए पर्याप्त रूप से पूरा नहीं किया गया था; मुझे इस विशिष्ट उत्तर पर ध्यान देना होगा कि क्या इसका कोई मूल्य है)
l7ll7

@ user10324, यदि आप चाहें, तो आप को स्थिरांक के एक सेट के रूप में सोच सकते हैं । आप इसे एक गैर-यादृच्छिक चर के रूप में भी सोच सकते हैं। X
गूँग - मोनिका

नहीं, इसके बारे में सोचने का गैर-यादृच्छिक चर तरीका काम नहीं करता है, दो कारणों से: एक, जैसा कि मैंने ऊपर टिप्पणी में तर्क दिया है, गणित में "चर" जैसी कोई चीज नहीं है, और दो, भले ही वह थे , तो उस मामले में इसके अलावा परिभाषित नहीं किया गया है, जैसा कि मैंने ऊपर टिप्पणियों में तर्क दिया था।
l7ll7

1

सुनिश्चित नहीं है कि अगर मैं प्रश्न को समझता हूं, लेकिन यदि आप केवल पूछ रहे हैं, "एक स्वतंत्र चर हमेशा एक यादृच्छिक चर होना चाहिए", तो उत्तर नहीं है।

एक स्वतंत्र चर एक चर है जो आश्रित चर के साथ सहसंबद्ध होने के लिए परिकल्पित है। आप तब परीक्षण करते हैं कि क्या यह मॉडलिंग के माध्यम से मामला है (संभवतः प्रतिगमन विश्लेषण)।

यहाँ बहुत सारी जटिलताएँ हैं और "ifs, buts and maybes" हैं, इसलिए मैं सुझाव दूंगा कि एक बुनियादी अर्थमिति या सांख्यिकी पुस्तक की एक प्रति प्राप्त करें जो प्रतिगमन विश्लेषण को कवर करे और इसे अच्छी तरह से पढ़े, या फिर एक बुनियादी आँकड़े / अर्थशास्त्र से कक्षा के नोट्स प्राप्त करें। यदि संभव हो तो ऑनलाइन पाठ्यक्रम।


ठीक है, लेकिन यह क्या है, अगर यह एक यादृच्छिक चर नहीं है? बस (इसलिए निर्धारक) फ़ंक्शन? मैं ऑब्जेक्ट " " की गणितीय प्रकृति के बारे में उलझन में हूं । दरअसल, मुझे पापुलिस द्वारा एक पाठ्यपुस्तक, संभावना और सांख्यिकी के बीच में पाया गया, जहां पृष्ठ 149 पर वह कहता है "दिए गए दो यादृच्छिक चर और [...]" और फिर समझाता है कि को पर फिर से कैसे लाया जाए । तो वह को एक यादृच्छिक चर के रूप में समझने लगता है ? एक्स वाई एक्स वाई वाई एक्सXXYXYX
l7ll7

PS मैं जोड़ना चाहता हूं कि गणित में "वैरिएबल" जैसी कोई चीज नहीं है जब आप इसे "स्टैंडअलोन" ऑब्जेक्ट्स के रूप में देखते हैं (मेरी पृष्ठभूमि मैथ्स है)। गणित में चर स्टैंडअलोन ऑब्जेक्ट्स (जैसे फ़ंक्शन के तर्क) के कुछ भाग हैं, लेकिन कोई स्टैंडअलोन अर्थ नहीं है। अगर मैं गणित में सिर्फ "x" लिखूंगा, तो इसका मतलब यह हो सकता है कि फ़ंक्शन , या यह एक विशिष्ट संख्या हो सकती है, यदि को पहले मान दिया गया था, लेकिन हमारे पास सिर्फ नहीं है । और लॉग के बाद से। प्रतिगमन एक गणितीय मॉडल है, मुझे के गणितीय अर्थ में दिलचस्पी है । एक्स एक्स एक्सxxxxX
l7ll7

ऐसा लगता है जैसे आपको मेरे मुकाबले गणित की अधिक समझ है। मैं आपको केवल मानक विश्वविद्यालय के स्नातक अर्थमिति / सांख्यिकी उत्तर दे रहा हूं। मुझे आश्चर्य है कि शायद आप इसे थोड़ा-थोड़ा खत्म कर सकते हैं, कम से कम व्यावहारिक विश्लेषण के दृष्टिकोण से। उस पुस्तक के उद्धरण के बारे में, मेरी व्याख्या यह है कि वह जिस विशिष्ट x और y का जिक्र कर रहा है, वह यादृच्छिक है - लेकिन इसका मतलब यह नहीं है कि कोई भी x या कोई y यादृच्छिक है।
स्टटसनैलिस्ट

उदाहरण के लिए, यूके की राजनीति में वोटिंग ट्रेंड के लिए एक मॉडल में आश्रित चर प्रत्येक निर्वाचन क्षेत्र में कंज़र्वेटिव उम्मीदवार (राइडिंग टू कैनेडियन, डिस्ट्रिक्ट टू अमेरिकन) को प्राप्त मतों की संख्या हो सकती है, और स्वतंत्र चर औसत घर की कीमतों (एक प्रॉक्सी के लिए) हो सकता है यूके में धन / आय)। न तो यह एक "यादृच्छिक" चर है जैसा कि मैं इसे समझता हूं, लेकिन यह मॉडल के लिए एक पूरी तरह से उचित चीज होगी।
स्टैट्सनैलिस्ट

ठीक है, यह जानना अच्छा है कि मैं अर्थमिति / सांख्यिकी विभागों में किस तरह के उत्तरों की उम्मीद कर सकता हूं / मैं मानक हूं और मैं उस प्रतिक्रिया की बहुत सराहना करता हूं (मैं फिर से उठाउंगा, लेकिन मैं तब से नहीं कर सकता जब तक मैं पहले से ही नहीं था)। गणित के साथ समस्या यह है कि "एक बार जब आप काले हो जाते हैं तो आप कभी वापस नहीं जाते हैं": गणितीय परिशुद्धता में साल भर का प्रशिक्षण असहजता की भावना पैदा करेगा अगर कोई क्रिस्टल स्पष्ट नहीं होता है जब तक कि कोई स्पष्टता प्राप्त नहीं करता है [...]
l7llx
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.