हम क्यों कहते हैं कि परिणामी चर "भविष्यवक्ता (ओं) पर पुनः अंकित है?"


16

क्या इस शब्दावली के लिए कुछ सहज व्याख्या है? यह इस तरह से क्यों है, और भविष्यवक्ता (नों) को परिणाम पर फिर से प्रभावित नहीं किया जा रहा है?

आदर्श रूप से मैं उम्मीद कर रहा हूं कि यह शब्दावली क्यों मौजूद है, इसका उचित विवरण छात्रों को इसे याद रखने में मदद करेगा, और इसे गलत तरीके से कहने से रोक देगा।


1
क्या हम? मुझे यकीन नहीं है कि मैंने कभी ऐसा कहा है - और मैंने प्रतिगमन पर बहुत चर्चा की है। यदि आप किसी ऐसे व्यक्ति को जानते हैं जो यह कहता है, तो शायद आप उनसे पूछ सकते हैं। (मैं इस अवसर ने कहा, "पर है पर वहीं " - लेकिन पर मेरे लिए कुछ हद तक अजीब लगेगा)
Glen_b -Reinstate मोनिका

धन्यवाद - मेरा मतलब "ऑन" था न कि "ऑन"। मैंने अभी तय किया है।
user1205901 -

जवाबों:


19

मुझे नहीं पता कि "किस पर व्युत्पत्ति है" का व्युत्पत्ति क्या है, लेकिन यहाँ इस बात की व्याख्या है कि जब मैं इस अभिव्यक्ति को कह या सुन रहा हूँ तो मेरे मन में है। हस्ती एट अल द्वारा सांख्यिकीय शिक्षण के तत्वों के निम्नलिखित आंकड़ों पर विचार करें :

प्रतिगमन प्रक्षेपण है

इसके मूल में, रेखीय प्रतीपगमन के orthogonal प्रक्षेपण के बराबर है पर (पर) एक्स , जहां y है n निर्भर चर की टिप्पणियों के आयामी वेक्टर और एक्स उपस्पेस भविष्यवक्ता वैक्टर द्वारा फैला है।yXynX

यह रैखिक प्रतिगमन की बहुत उपयोगी व्याख्या है।

चूँकि को X पर प्रक्षेपित किया जा रहा है, इसलिए जब मैं सुनता हूं कि मुझे लगता है कि y " X पर" प्रभावित है । इस दृष्टिकोण से, यह कहना कम समझ में आता है कि X , y पर पुन: प्रभावित है या कि y " X " के साथ "विरुद्ध" या "पुन: प्रभावित है" ।yXyXXyyX

आदर्श रूप से मैं उम्मीद कर रहा हूं कि यह शब्दावली क्यों मौजूद है, इसका उचित विवरण छात्रों को इसे याद रखने में मदद करेगा, और इसे गलत तरीके से कहने से रोक देगा।

जैसा कि मैंने कहा, मुझे संदेह है कि यह एक स्पष्टीकरण है कि यह शब्दावली क्यों मौजूद है (शायद केवल यह क्यों बनी हुई है?), लेकिन मुझे यकीन है कि यह छात्रों को इसे याद रखने में मदद कर सकता है।


2
+1। छात्रों पर निर्भर करता है! मध्यवर्ती या उन्नत स्तरों पर बात करने और सोचने के लिए यह स्पष्ट रूप से एक वैध और उपयोगी तरीका है। क्या यह "मैं आश्चर्य करता हूं" पर शब्दावली के लिए जिम्मेदार है। यह बहुत पहले नहीं है कि आप लगभग किसी भी आरेख के साथ प्रतिगमन ग्रंथों को पा सकते हैं, अकेले एक जोरदार दृश्य या ज्यामितीय दृष्टिकोण दें, भले ही अब यह पूरी तरह से मानक है, जबकि मुझे लगता है कि यह शब्दावली कुछ दशक पीछे चली जाती है।
निक कॉक्स

(+1) जिस तरह से मुझे अपनी खोपड़ी के माध्यम से प्रतिगमन की अवधारणा मिली है वह इसे मॉडल मैट्रिक्स के कॉलम स्पेस सी ( ) पर के प्रक्षेपण के रूप में सोच रहा है, जो मुझे लगता है कि यह ज्यामितीय व्याख्या है जिसे आप दिखा रहे हैं । yC(A)
एंटोनी परेलाडा

1
शब्दावली का उपयोग करने के लिए यह एक बहुत अच्छा सांख्यिकीय कारण है। सामाजिक या भाषाई कारणों से क्यों यह लोकप्रिय है अलग हो सकता है!
निक कॉक्स

बस स्पष्ट होने के लिए: मैं यहाँ की टिप्पणियों में @NickCox की कही गई बातों से पूरी तरह सहमत हूँ।
अमीबा का कहना है कि मोनिका

6

मैंने अक्सर बोलने के इस तरीके का इस्तेमाल किया और सुना है। मुझे लगता है कि भविष्यवाणियों को लिखित रूप में स्वीकार करने, शब्दों का उपयोग करने या संकेतन का उपयोग करने या दोनों को मिलाने से पहले, परिणाम या प्रतिक्रिया का उल्लेख करने वाला अनुक्रम, सभी तरह से

Y=Xβ

समान रूप से दिलचस्प (या निर्बाध!) को अलग-अलग सेट करना, जिसे हम विभिन्न प्रकार के चर कहते हैं।

लेकिन यह पहले से ही भविष्यवाणियों का उल्लेख करने के लिए गणितीय और सांख्यिकीय रूप से समान रूप से मान्य लगता है, जैसे कि कई गणितज्ञ पहले तर्कों के साथ मैपिंग या फ़ंक्शन लिखते हैं।

हम अक्सर सांख्यिकीय चर्चाओं में जो अनुक्रम इस्तेमाल करते हैं, वह यह है कि वैज्ञानिक या व्यावहारिक रूप से हमारे पास आमतौर पर एक स्पष्ट विचार होता है कि हम क्या भविष्यवाणी करने की कोशिश कर रहे हैं - यह मृत्यु दर है, या आय, या गेहूं की उपज, या एक चुनाव में वोट, या जो भी हो - जबकि संभावित या वास्तविक भविष्यवक्ताओं का पूल इतना स्पष्ट नहीं हो सकता है। यहां तक ​​कि अगर यह स्पष्ट है, तो पहले महत्वपूर्ण चीजों का उल्लेख करना समझ में आता है। तुम क्या करने की कोशिश कर रहे हो? जो भी भविष्यवाणी करें । आप इसे कैसे करेंगे? इनमें से कुछ या सभी चर का उपयोग करें ।

मेरे पास किसी भी अन्य शब्द के बजाय "ऑन" के लिए एक कहानी नहीं है जो फिट होगी। मैंने सुना नहीं "के खिलाफ" या "के साथ प्रभावित"। यहां कोई तर्क नहीं हो सकता, बस पाठ्यपुस्तकों, शिक्षण और चर्चाओं में साथ-साथ याद किया जाता है।

yx


+1। लेकिन "पर पुन: प्रभावित" की मेरी व्यक्तिगत व्याख्या "अनुमानित पर" के माध्यम से है, मेरा जवाब देखें। मुझे आश्चर्य है कि अगर कई लोग इस तरह से इस अभिव्यक्ति के बारे में सोचते हैं, या यह केवल मैं ही हूं।
अमीबा का कहना है कि मोनिका

3

1) शब्द प्रतिगमन इस तथ्य से आता है कि सामान्य सरल रेखीय प्रतिगमन मॉडल में:

y=α+βx+ϵ

yxy^y¯xx¯

|y^y¯|/sy<|xx¯|/sx

उदाहरण के लिए यदि हम R में निर्मित BOD डेटा फ्रेम का उपयोग करते हैं:

fm <- lm(demand ~ Time, BOD)
with(BOD, all( abs(fitted(fm) - mean(demand)) / sd(demand) < abs(scale(Time))))
## [1] TRUE

आ प्रमाण के लिए देखें: https://en.wikipedia.org/wiki/Regression_toward_the_mean

2) अवधि पर तथ्य यह है कि फिट मूल्यों परिणाम चर का प्रक्षेपण कर रहे हैं से आता है पर उप-भविष्यवक्ता चर (अवरोधन शामिल करके फैला) के रूप में आगे इस तरह के रूप में कई स्रोतों में विस्तार से बताया http: //people.eecs.ku .edu / ~ jhuan / EECS940_S12 / स्लाइड्स / linearRegression.pdf

ध्यान दें

नीचे दी गई टिप्पणी के बारे में, टिप्पणीकार क्या कह रहा है, इसका उत्तर पहले से ही सूत्र रूप में ऊपर दिया गया है, सिवाय इसके कि उत्तर इसे सही तरीके से बताता है। वास्तव में, समानता के कारण:

(y^y¯)=β^(xx¯)

|β|<1

beta>1


1
मुझे पूरा यकीन है कि यह शब्द जहां प्रतिगमन शब्द से नहीं आया है। शब्द के शुरुआती उपयोग में बेटे की ऊंचाई पिता की ऊंचाई पर फिर से दर्ज की गई थी; माध्य प्रत्यावर्तन निष्कर्षों के कारण लंबे पिताओं के पुत्रों को माध्य पुनः प्राप्त करने की प्रवृत्ति दिखाई दी।
पॉल बीब

हालांकि यह उस विशेष डेटासेट के लिए सही था जो सामान्य रूप से सच नहीं है जब तक कि आप मानक विचलन के संदर्भ में निकटता को मापते नहीं हैं, लेकिन यह ठीक है कि उत्तर में असमानता क्या ऐसा करती है, शायद आप इसे पहचान नहीं पाए। वास्तव में आधुनिक धारणा सही सूत्रीकरण पर आधारित है जो मैंने कहा है और मानक विचलन को शामिल नहीं करने वाले गलत सूत्रीकरण पर। मैंने नोट में इस पर विस्तार किया है जिसे मैंने उत्तर के अंत में जोड़ा है।
जी। ग्रोथेंडिक

0

व्यक्तिगत रूप से, जब शब्दावली की व्याख्या करने की बात आती है, तो मुझे लगता है कि शब्द की परिभाषा हमेशा ही मदद करती है, खासकर छात्रों को समझाते समय। रेग्रेस शब्द की वास्तविक परिभाषा है:

"पूर्व या कम विकसित अवस्था में लौटें"।

तो मुझे समझाने का एक तरीका निम्नलिखित है:

"परिणाम को पूरी तरह से विकसित राज्य के रूप में सोचते हुए, हम कम विकसित राज्यों, अर्थात स्वतंत्र चर का उपयोग करके परिणाम की व्याख्या करने का प्रयास करते हैं। इस प्रकार परिणाम भविष्यवक्ताओं पर फिर से प्रभावित होता है।"

उम्मीद है की वो मदद करदे।


1
एक से अधिक "वास्तविक परिभाषा" है। मेरा सुझाव है कि सांख्यिकीय विज्ञान में एक मॉडल (डिफ़ॉल्ट रूप से एक रेखीय मॉडल) फिटिंग के रूप में प्रतिगमन की तकनीकी परिभाषा अब प्राथमिक है और "अर्थ के लिए पुनःप्रकाश" द्वारा कब्जा कर लिया गया ऐतिहासिक अर्थ है। जो दिलचस्प और कुछ समय उपयोगी है। माध्यमिक। मुझे यह सोचने में मददगार नहीं लगता है कि सामान्य रूप से भविष्यवाणियां "कम विकसित राज्य" हैं, उदाहरण के लिए, ऐसा कोई अर्थ नहीं है जिसमें भविष्यवक्ता बारिश परिणाम गेहूं की उपज की कम विकसित स्थिति है। किसी भी तरह से, मैं यह नहीं देखता कि यह कैसे अभिव्यक्ति की व्याख्या करता है।
निक कॉक्स

मैं आपकी बात को पूरी तरह देखता हूं। क्या कोई तरीका है जिससे आप मेरे द्वारा पोस्ट की गई परिभाषा के माध्यम से प्रतिगमन की व्याख्या कर सकते हैं? क्योंकि जिस तरह से मैं "कम विकसित" के बारे में सोचूंगा वह बारिश के अर्थ में गेहूं की उपज की तुलना में कम विकसित नहीं है, लेकिन कुछ ऐसा है जो गेहूं की उपज को आंशिक रूप से समझा सकता है।
एहसानएफ

1
यदि "कम विकसित" का मतलब कम विकसित नहीं है, तो मैं यह नहीं देख सकता कि शब्दांकन बिल्कुल मदद करता है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.