मतलबी पहेली का प्रतिगमन


9

डैनियल कहमैन द्वारा "सोच, तेज और धीमी" के "प्रतिगमन के अर्थ" अध्याय में एक उदाहरण दिया गया है और पाठक को पिछले वर्ष के समग्र बिक्री पूर्वानुमान और बिक्री संख्या को देखते हुए व्यक्तिगत दुकानों की बिक्री का पूर्वानुमान लगाने के लिए कहा गया है। । उदाहरण के लिए (पुस्तक के उदाहरण में 4 स्टोर हैं, मैं यहां 2 सरलता के लिए उपयोग करता हूं):

Store    2011    2012
1        100      ?
2        500      ?
Total    600     660

भोले पूर्वानुमान 1 और 2, दुकानों के लिए 110 और 550 प्रत्येक के लिए 10% की वृद्धि होगी। हालांकि, लेखक का दावा है कि यह भोली दृष्टिकोण गलत है। यह खराब प्रदर्शन करने वाले स्टोर के 10% से अधिक बढ़ने की संभावना है, और बेहतर प्रदर्शन करने वाले स्टोर में 10% से कम (या कमी) बढ़ने की संभावना है। तो शायद 115 (15% वृद्धि) और 535 (7% की वृद्धि) का पूर्वानुमान भोले पूर्वानुमान से "अधिक सही" होगा।

मुझे समझ में नहीं आता है कि हम यह कैसे निष्कर्ष निकाल सकते हैं कि स्टोर 1 की 100 की बिक्री जरूरी खराब प्रदर्शन करने वाली दुकान है? शायद, स्थान अंतर के कारण, स्टोर 1 और 2 का सही समय-सीरीज़ साधन 10 और 550 हैं, और स्टोर 1 का 2011 में सुपर वर्ष था, और स्टोर 2 का 2011 में विनाशकारी वर्ष था। तब इसका कोई मतलब नहीं होगा। स्टोर 1 के लिए कमी और स्टोर 2 के लिए वृद्धि का अनुमान लगाने के लिए?

मुझे पता है कि समय श्रृंखला की जानकारी मूल उदाहरण में नहीं दी गई थी, लेकिन मैं इस धारणा के तहत हूं कि "प्रतिगमन का मतलब" क्रॉस-अनुभागीय माध्य को संदर्भित करता है और इसलिए समय-श्रृंखला की जानकारी मायने नहीं रखती है। मुझे क्या गलतफहमी है?

जवाबों:


8

मैं उस किताब को पढ़ रहा हूं। आपने महत्वपूर्ण जानकारी को पर्याप्त रूप से स्थानांतरित नहीं किया है। यह कहता है कि "सभी स्टोर आकार और व्यापारिक चयन में समान हैं, लेकिन स्थान, प्रतिस्पर्धा और यादृच्छिक कारकों के कारण उनकी बिक्री भिन्न है।" यह महत्वपूर्ण है, खासकर कि पिछले सा। घटित होने के लिए प्रतिगमन के लिए यादृच्छिक कारक आवश्यक हैं (यदि बिक्री एक निश्चित राशि से बढ़ी है, तो दुकानों में समान रूप से फैलाया गया 10% लाभ सही होगा)।


2
क्या आप कह रहे हैं कि "सभी स्टोर समान हैं" धारणा का अर्थ है कि उनकी समय श्रृंखला का मतलब समान है? अन्यथा, दो समान स्टोर अभी भी स्थान के कारण बहुत भिन्न साधन हो सकते हैं।

1
मैं स्वीकार करता हूं कि यह किसी समस्या का सबसे बड़ा शब्द नहीं है, लेकिन आपके मूल प्रश्न में जो है उससे यह बहुत स्पष्ट है।
पीटर Flom

2

इतने कम डेटा बिंदुओं के साथ, उत्तर लगभग पूरी तरह से पूर्व (या निहित समतुल्य) द्वारा निर्धारित किया जाएगा। यदि लेखक ने इस तरह के डेटा को बहुत पहले देखा है, तो उनके पास यह सोचने का अच्छा कारण हो सकता है कि उनका उत्तर सही होने की अधिक संभावना है, उनकी पिछली टिप्पणियों को देखते हुए। मुझे लगता है कि यह सुझाव के लिए एक खिंचाव है कि यह इस मतलब के प्रतिगमन का एक उदाहरण है, कम से कम कुछ और जानकारी निर्दिष्ट किए बिना नहीं। उदाहरण के लिए, तुलनीय स्थानों में स्टोर हैं या नहीं? यदि वे हैं और दुकानों के बीच कोई अन्य स्पष्ट अंतर नहीं हैं, तो हम यह सोचकर उचित महसूस कर सकते हैं कि वे एक तुलनीय आबादी का हिस्सा हैं और हम प्रतिगमन के बारे में सोच सकते हैं। यदि दुकानों के बीच स्पष्ट अंतर हैं जो बिक्री में एक व्यवस्थित अंतर की व्याख्या कर सकते हैं, तो ऐसा करना कम समझदार हो जाता है।


0

मुझे लगता है कि एक बेहतर (काल्पनिक) चित्रण कुछ इस तरह हो सकता है:

Store    2011    2012
1        100      ?
2        180      ?
3        190      ?
4        210      ?
5        235      ?
6        300      ?

व्यवस्थित कारणों को छोड़कर हम सबसे खराब प्रदर्शन करने वाले (यादृच्छिक कारणों से) की उम्मीद नहीं करेंगे। और इसलिए सर्वश्रेष्ठ कलाकार के लिए भी।

इसलिए 10% औसत वृद्धि के साथ मैं # 1 को 110 से बेहतर और # 6 को 330 से बेहतर करने की उम्मीद करूंगा।

मुझे लगता है कि iffy हिस्सा मान्यताओं है। यह बहुत दुर्लभ IMHO है कि पैक का पिछलग्गू वास्तव में सिर्फ एक यादृच्छिक अस्थायी है और कुछ अंतर्निहित विषमता नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.