"सोच, तेज और धीमी" में मतलब के लिए प्रतिगमन


14

में सोच, तेज और धीमी , डैनियल Kahneman निम्नलिखित काल्पनिक सवाल बन गया है:

(पी। 186) जूली वर्तमान में एक राज्य विश्वविद्यालय में वरिष्ठ हैं। जब वह चार साल की थी, तब उसने धाराप्रवाह पढ़ा। उसका ग्रेड पॉइंट एवरेज (GPA) क्या है?

उनका इरादा यह स्पष्ट करना है कि कुछ आंकड़ों के बारे में भविष्यवाणियां करते समय हम अक्सर प्रतिगमन के लिए कैसे असफल होते हैं। बाद की चर्चा में, उन्होंने सलाह दी:

(पी। १ ९ ०) स्मरण करो कि दो उपायों के बीच संबंध- वर्तमान मामले में पढ़ने की उम्र और GPA- के बीच उनके कारकों के बीच साझा कारकों के अनुपात के बराबर है। उस अनुपात के बारे में आपका सबसे अच्छा अनुमान क्या है? मेरा सबसे आशावादी अनुमान लगभग 30% है। इस अनुमान को मानते हुए, हम सभी को निष्पक्ष भविष्यवाणी करने की आवश्यकता है। चार सरल चरणों में वहां कैसे पहुंचा जाए, इसके लिए यहां निर्देश दिए गए हैं:

  1. औसत GPA के अनुमान से शुरू करें।
  2. GPA का निर्धारण करें जो सबूतों की आपकी धारणा से मेल खाता है।
  3. पढ़ने की गति और GPA के बीच सहसंबंध का अनुमान लगाएं।
  4. यदि सहसंबंध 30 है, तो औसत से मिलान GPA से 30% की दूरी पर जाएं।

उनकी सलाह की मेरी व्याख्या इस प्रकार है:

  1. जूली के पढ़ने की गति के लिए एक मानक स्कोर स्थापित करने के लिए "वह धाराप्रवाह पढ़ती है जब वह चार साल की थी"।
  2. एक GPA निर्धारित करें जिसमें एक समान मानक स्कोर हो। (भविष्यवाणी करने के लिए तर्कसंगत GPA इस मानक स्कोर के अनुरूप होगा यदि GPA और पढ़ने की गति के बीच संबंध सही थे।)
  3. अनुमान लगाएं कि जीपीए में भिन्नता का प्रतिशत पढ़ने की गति में बदलाव के द्वारा समझाया जा सकता है। (मुझे लगता है कि वह इस संदर्भ में "सहसंबंध" के साथ दृढ़ संकल्प के गुणांक का उल्लेख कर रहे हैं?)
  4. क्योंकि जूली के पढ़ने की गति के मानक स्कोर का केवल 30% ही कारकों द्वारा समझाया जा सकता है जो उसके जीपीए के मानक स्कोर को भी समझा सकता है, हम केवल यह अनुमान लगाने में उचित हैं कि जूली के जीपीए का मानक स्कोर क्या होगा इसका 30% होगा सही सहसंबंध के मामले में।

क्या कहमन की प्रक्रिया की मेरी व्याख्या सही है? यदि हां, तो क्या उनकी प्रक्रिया का एक अधिक औपचारिक गणितीय औचित्य है, विशेष रूप से चरण 4? सामान्य तौर पर, दो चर और उनके मानक स्कोर में परिवर्तन / अंतर के बीच संबंध का क्या संबंध है?

जवाबों:


2

क्या कहमन की प्रक्रिया की मेरी व्याख्या सही है?

यह कहना थोड़ा कठिन है, क्योंकि कहमन के कदम # 2 को बहुत सटीक रूप से तैयार नहीं किया गया है: "उस जीपीए को निर्धारित करें जो आपके सबूतों की छाप से मेल खाता है" - वास्तव में इसका क्या मतलब है? यदि किसी के इंप्रेशन को अच्छी तरह से कैलिब्रेट किया जाता है, तो माध्य की ओर सही करने की आवश्यकता नहीं होगी। यदि किसी के इंप्रेशन सकल रूप से बंद हैं, तो उन्हें और भी मजबूत होना चाहिए।

इसलिए मैं @AndyW से सहमत हूं कि कहमन की सलाह केवल एक नियम है।

जैसा कि कहा गया है, तो आप Kahneman के कदम की व्याख्या करता है, तो # 2 आप अपनी व्याख्या चरणों ## 1--2 में यह व्याख्या के रूप में: यानी कि आप एक ही साथ जीपीए ले के रूप में -score के रूप में "की अपनी धारणा से मेल खाते जल्दबाज़ी पढ़ने के -score सबूत ", तो आपकी प्रक्रिया बिल्कुल गणितीय रूप से सही है और अंगूठे का नियम नहीं है।zz

[...] उसकी प्रक्रिया का एक और अधिक औपचारिक गणितीय औचित्य है, खासकर चरण 4? सामान्य तौर पर, दो चर और उनके मानक स्कोर में परिवर्तन / अंतर के बीच संबंध का क्या संबंध है?

यदि आप से अनुमान लगाते हैं और दोनों को -scores में बदल दिया जाता है , अर्थात शून्य माध्य और इकाई भिन्नता है, और एक दूसरे के बीच सहसंबंध , तो यह आसानी से दिखाया जा सकता है कि प्रतिगमन समीकरण यानी प्रतिगमन गुणांक सहसंबंध गुणांक के बराबर होगा।yएक्सzρ

y=ρएक्स,

यहाँ से यह तुरंत इस प्रकार है कि यदि आप का मान जानते हैं (जैसे कि आप रीडिंग प्रीसिटी का मानक स्कोर जानते हैं), तो (GPA का मानक स्कोर) की अनुमानित वैल्यू बार होगी ।एक्सyρ

यह वही है जिसे "माध्य के लिए प्रतिगमन" कहा जाता है। आप विकिपीडिया पर चर्चा में कुछ सूत्र और व्युत्पत्तियाँ देख सकते हैं ।


8

आपके नंबरों का क्रम कहमन बोली से मेल नहीं खाता है। इस वजह से ऐसा लगता है कि आप समग्र बिंदु को याद कर रहे हैं।

कहमन की बात सबसे महत्वपूर्ण है। इसका मतलब है कि हर किसी के लिए जीपीए का औसत अनुमान है। इस सलाह के पीछे की बात यह है कि यह आपका लंगर है। आपके द्वारा दी गई कोई भी भविष्यवाणी इस एंकर बिंदु के आसपास के परिवर्तनों के संदर्भ में होनी चाहिए। मुझे यकीन नहीं है कि मैं इस कदम को आपके किसी भी बिंदु पर देख रहा हूं!

Kahneman एक संक्षिप्त, WYSIATI का उपयोग करता है, जो आप देखते हैं वह सब है। वर्तमान में उपलब्ध जानकारी के महत्व को कम करने की यह मानवीय प्रवृत्ति है। कई लोगों के लिए, पढ़ने की क्षमता के बारे में जानकारी से लोगों को लगता है कि जूली स्मार्ट है, और इसलिए लोग एक स्मार्ट व्यक्ति के GPA को समझेंगे।

लेकिन, चार साल के बच्चे के व्यवहार में वयस्क व्यवहार से संबंधित बहुत कम जानकारी होती है। भविष्यवाणियां करने में इसे अनदेखा करने से आप शायद बेहतर होंगे। यह केवल एक छोटी राशि से आपको अपने लंगर से बाहर करना चाहिए। इसके अलावा, एक स्मार्ट व्यक्ति GPA के बारे में लोगों का पहला अनुमान बहुत गलत हो सकता है। चयन के कारण, कॉलेज के अधिकांश वरिष्ठ औसत बुद्धिमत्ता से ऊपर हैं।

हालांकि जूली की पढ़ने की क्षमता पर चार साल की उम्र के अलावा सवाल में कुछ और छिपी हुई जानकारी है।

  • जूली एक महिला नाम होने की संभावना है
  • वह एक राज्य विश्वविद्यालय में भाग ले रही है
  • वह सीनियर है

मुझे संदेह है कि इन तीनों विशेषताओं में समग्र छात्र आबादी की तुलना में औसत जीपीए थोड़ा बढ़ा है। उदाहरण के लिए, मैं शर्त लगाता हूं कि सीनियर्स की संभावना 'सोफमोरस' की तुलना में अधिक GPA है क्योंकि बहुत खराब GPA छोड़ने वाले छात्र।

इसलिए कहमन की प्रक्रिया (एक काल्पनिक के रूप में) कुछ इस तरह से होगी।

  1. एक राज्य विश्वविद्यालय में एक महिला वरिष्ठ के लिए औसत GPA 3.1 है।
  2. मुझे लगता है कि 4 पर जूली की उन्नत पढ़ने की क्षमता पर आधारित है कि उसका जीपीए 3.8 है
  3. मुझे लगता है कि 4 साल की उम्र में पढ़ने की क्षमता जीपीए के साथ 0.3 का सहसंबंध है
  4. फिर 3.1 और 3.8 के बीच का 30% 3.3 है (यानी 3.1 + (3.8-3.1)*0.3)

तो इस काल्पनिक में जूली के GPA के लिए अंतिम अनुमान 3.3 है।

कहमन के दृष्टिकोण में माध्य के लिए प्रतिगमन यह है कि चरण 2 में उपलब्ध सूचना के महत्व का सकल अति-अनुमान होने की संभावना है। इसलिए एक बेहतर रणनीति यह है कि हम अपनी भविष्यवाणी को समग्र रूप से वापस पा लें। चरण 3 और 4 यह अनुमान लगाने के तरीके (तदर्थ) हैं कि कितना पुन: प्राप्त करना है।


मैं प्रक्रिया के पीछे अंतर्ज्ञान को समझता हूं, लेकिन गणितीय औचित्य को नहीं। मेरी व्याख्या यह है कि औसत GPA के आकलन का उद्देश्य मानक स्कोर के संदर्भ में विशिष्ट GPA का अनुमान लगाने की अनुमति देना है; अन्यथा, वे पढ़ने की गति की तुलना में सार्थक नहीं हो सकते हैं। (कंट।)
राशन

1
कहमैन ने उल्लेख किया है कि ज्यादातर लोग GPA = 3.7 या 3.8 का अनुमान लगाते हैं, जो संभवत: मानक स्कोर के साथ मेल खाता है जो वे जूली के पढ़ने की गति के साथ संबद्ध हैं, लेकिन यह भी स्पष्ट रूप से मानता है कि दो चर के बीच संबंध सही है। मैं मुख्य रूप से इस बारे में उलझन में हूं कि क्या चरण 4 अंगूठे का एक अंतर्ज्ञान-आधारित नियम है या एक वास्तविक, सांख्यिकीय रूप से वैध प्रक्रिया है (यानी, क्या कोई मानक स्कोर को जोड़कर इलाज कर सकता है और सहसंबंध के आधार पर उनका अनुपात ले सकता है?)। यदि यह केवल एक आम आदमी के अंगूठे का नियम है, तो क्या अनुमान लगाने की अधिक सांख्यिकीय रूप से कठोर विधि मौजूद है?
राशन

"योगात्मक रूप से", मैं अपनी धारणा का उल्लेख कर रहा हूं कि (1) जूली के मानक स्कोर जीपीए के कुछ अनुपात को उन कारकों द्वारा समझाया गया है जो उसे पढ़ने की गति को भी समझा सकते हैं, (2) उसके मानक स्कोर के शेष अनुपात को जीपीए कारकों के बारे में बताया गया है। GPA की व्याख्या करने के लिए अद्वितीय है, कि (3) इन योगदानों ने अंतिम मानक स्कोर GPA के बराबर है जो हम जूली के लिए भविष्यवाणी करते हैं, और यह (4) हम अपने पूर्वाग्रह की भविष्यवाणी के अनुपात को ले कर अपनी भविष्यवाणी को सही कर सकते हैं। इस तरह मानक विचलन के अनुपात के साथ काम कर रहा है - जैसा कि विरोध किया जाता है, कहते हैं, उनके वर्गमूलों के साथ काम करना - मान्य है?
राशन

यह एक तदर्थ नियम है। चरण दो और तीन जरूरी नहीं कि तार्किक रूप से एक दूसरे के अनुरूप हों। (वे एक ही जानकारी को कहने के दो अलग-अलग तरीके हैं, एक प्रभाव का आकार है और दूसरा एक मानकीकृत प्रभाव आकार है।)
एंडी डब्ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.