डेटा एकत्र या व्याख्या करते समय सबसे आम पूर्वाग्रह मनुष्य क्या बनाते हैं?


39

मैं एक ईकोन / स्टेट प्रमुख हूं। मुझे पता है कि अर्थशास्त्रियों ने उन स्थितियों की पहचान करके मानवीय व्यवहार और तर्कसंगतता के बारे में अपनी धारणाओं को संशोधित करने की कोशिश की है, जिसमें लोग तर्कसंगत व्यवहार नहीं करते हैं। उदाहरण के लिए, मान लीजिए कि मैं आपको $ 1000 के नुकसान का 100% मौका या $ 2500 के नुकसान पर 50% का मौका देता हूं, लोग $ 2500 का विकल्प चुनते हैं, भले ही बाद वाले का अपेक्षित मूल्य $ 1000 की गारंटी से अधिक नुकसान हो। हानि। इसे "नुकसान से बचने" के रूप में जाना जाता है। व्यवहारवादी अर्थशास्त्री अब इन पैटर्नों का अध्ययन करते हैं और उन तरीकों की पहचान करने की कोशिश करते हैं जिनसे मनुष्य उन स्वयंसिद्धों से विचलित होते हैं जिन्हें आम तौर पर "तर्कसंगत" व्यवहार माना जाता है। यहां, मैं मानता हूं कि कम से कम अपेक्षित नुकसान को प्राथमिकता देना तर्कसंगत है।

मैं सोच रहा था कि क्या सांख्यिकीविदों ने डेटा संग्रह में सामान्य पैटर्न की पहचान की है जो लोगों को डेटा की व्याख्या करने में पक्षपाती परिणाम देते हैं। यदि डेटा एकत्र करने के लिए अनिवार्य रूप से "तर्कसंगत" तरीका था, तो मुझे लगता है कि ऐसे उदाहरण हैं जहां मनुष्य इससे विचलित होते हैं और "पूर्वाग्रह" का प्रदर्शन करते हैं। यदि हां, तो डेटा एकत्र या व्याख्या करते समय सबसे सामान्य पक्षपात मनुष्य क्या कर रहे हैं?


5
Podsakoff et al द्वारा एक बेहतरीन पेपर है। आम विधि के आधारों की समीक्षा करता है और दोनों सांख्यिकीय और प्रक्रियात्मक उपायों का प्रस्ताव करता है: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf तालिका 2 पर एक नज़र
अय्यन


10
आपके पास तर्कहीनता का एक तर्कहीन अनुमान है। आप परिणाम के लिए एक उपयोगिता फ़ंक्शन लागू करने में विफल हो रहे हैं। आपके उदाहरण में, मान लें कि उस व्यक्ति के पास $ 1000 हैं और उसे गैंगस्टर को ऋण चुकाने के लिए इसका उपयोग अभी से एक मिनट में करना चाहिए, या गैंगस्टर द्वारा मार दिया जाएगा। की 100% मौका $ के 100% मौका में 1000 हानि परिणाम जबकि की 50% संभावना को मार डाला जा रहा है, $ 2500 नुकसान केवल हत्या किए जाने के 50% मौका का परिणाम है। एक प्रमुख के रूप में, आपको तर्कहीनता की घोषणा करने से पहले उपयोगिता के लिए एक प्रारंभिक बिंदु के रूप में देखा जाना चाहिए।
मार्क एल। स्टोन

3
सांख्यिकीविद आमतौर पर उस तरह का शोध नहीं करते हैं। मुझे आश्चर्य है कि अगर मनोविज्ञान और तंत्रिका विज्ञान SE साइट के लिए यह क्यू अधिक उपयुक्त है ।
गूँज - मोनिका

3
मुझे लगता है कि स्ट्रीटलाइट प्रभाव - लाइटपोस्ट के तहत खोई हुई चाबियों (डेटा) की तलाश में है क्योंकि जहां रात में रोशनी होती है - बेहद आम है, खासकर अब, नल पर बहुत आसान डेटा के साथ। // डेटा एकत्र करने का कोई "तर्कसंगत तरीका" नहीं है क्योंकि आप - इसे इकट्ठा करने वाले शोधकर्ता - यादृच्छिक नहीं हैं।
के रूप में

जवाबों:


23

मुझे लगता है कि शिक्षा में, पी-वैल्यू बहुत गलत व्याख्या की जाती है। लोग भूल जाते हैं कि पी-मूल्य एक सशर्त संभावना व्यक्त करता है। यहां तक ​​कि अगर एक प्रयोग पूरी तरह से किया गया है और चुने हुए सांख्यिकीय परीक्षण के सभी आवश्यक मिलते हैं, तो झूठी खोज की दर आम तौर पर महत्व स्तर अल्फा की तुलना में बहुत अधिक है। झूठी खोज की दर सांख्यिकीय शक्ति में कमी और वास्तविक सकारात्मकता की व्यापकता के साथ बढ़ जाती है (Colquhoun, 2014; Nuzzo, 2014)।

इसके अलावा लोग अपने अनुमानों को सत्य मानते हैं और जिस पैरामीटर का वे अनुमान लगाते हैं, वह यादृच्छिक (हॉलर और क्रास, 2002) है। उदाहरण के लिए जब वे कहते हैं कि "95% मामलों में यह पहचाना गया आत्मविश्वास अंतराल पैरामीटर को कवर करता है ..."

सहसंबंध और कार्य-कारण का भ्रम संभवतः डेटा व्याख्या में एक बहुत ही सामान्य त्रुटि है।

डेटा संग्रह के संदर्भ में, मुझे लगता है कि एक सामान्य त्रुटि सबसे अधिक प्रतिनिधि नमूने के बजाय सबसे आसानी से सुलभ है।

Colquhoun, D. (2014)। झूठी खोज दर और पी मूल्यों की गलत व्याख्या की जांच। रॉयल सोसाइटी ओपन साइंस, 1-15।

नाज़ो, आर। (2014)। सांख्यिकीय त्रुटियां: P मान, सांख्यिकीय वैधता का "स्वर्ण मानक" उतना विश्वसनीय नहीं है जितना कि कई वैज्ञानिक मानते हैं। प्रकृति, ५०६, १५०-१५२।

हॉलर, एच। और क्रुस, एस। (2002): महत्व की गलत व्याख्या: एक समस्या छात्रों को उनके शिक्षकों के साथ साझा करें? मनोवैज्ञानिक अनुसंधान ऑनलाइन के तरीके, Vol.7, नंबर 1


19

मैं एक सामान्य अक्षमता की सराहना करना चाहूंगा कि सच्ची यादृच्छिकता कैसी दिखती है। लोगों को वास्तव में यादृच्छिक घटनाओं के दृश्यों में होने की तुलना में बहुत ही कम पैटर्न की उम्मीद है। यह तब भी दिखता है जब हम अपने दम पर यादृच्छिकता का अनुकरण करने की कोशिश करते हैं।

एक और काफी सामान्य रूप से स्वतंत्रता को समझ नहीं रहा है, जैसा कि जुआरी की गिरावट में है। हम कभी-कभी सोचते हैं कि पूर्व की घटनाएँ भविष्य के लोगों को तब भी प्रभावित कर सकती हैं, जब यह स्पष्ट रूप से असंभव हो, जैसे कि भविष्य में प्रभावित होने वाले कार्डों के फेरबदल के पिछले सौदे।


7

यह पहले ही बताया जा चुका है कि (व्यवहार) अर्थशास्त्रियों द्वारा "तर्कहीन" या "पक्षपाती" लेबल वाले कई व्यवहार और विचार प्रक्रिया वास्तव में वास्तविक दुनिया में अत्यधिक अनुकूल और कुशल हैं। बहरहाल, ओपी का सवाल दिलचस्प है। मुझे लगता है कि हालांकि, यह हमारी संज्ञानात्मक प्रक्रियाओं के बारे में अधिक मौलिक, वर्णनात्मक ज्ञान को संदर्भित करने के लिए लाभदायक हो सकता है, बजाय इसके कि विशिष्ट "पूर्वाग्रहों" की तलाश में जाएं जो आर्थिक साहित्य में चर्चा करने वालों (उदाहरण के लिए, नुकसान से बचने, बंदोबस्ती प्रभाव) के अनुरूप हैं। आधारभूत उपेक्षा आदि)।

उदाहरण के लिए, मूल्यांकन निश्चित रूप से डेटा विश्लेषण में एक मुद्दा है। मूल्यांकन के सिद्धांत में कहा गया है कि हम अधिक वजन वाली जानकारी की व्याख्या या मूल्यांकन करना आसान समझते हैं। एक प्रतिगमन गुणांक के मामले पर विचार करें। गुणांक के "वास्तविक दुनिया" परिणामों का मूल्यांकन करना कठिन काम हो सकता है। हमें स्वतंत्र और आश्रित चर की इकाइयों पर विचार करने की आवश्यकता है और साथ ही यह समझने के लिए कि क्या एक गुणांक की व्यावहारिक प्रासंगिकता है, हमारे स्वतंत्र और आश्रित चर के वितरण थे। दूसरी ओर, गुणांक के महत्व का मूल्यांकन करना आसान है: मैं इसके पी-मूल्य की तुलना अपने अल्फा स्तर से करता हूं। गुणांक की तुलना में पी-मूल्य की अधिक मूल्यांकन क्षमता को देखते हुए, यह आश्चर्यजनक रूप से आश्चर्यजनक है कि इतना अधिक पी-मूल्यों से बना है।

(मानकीकरण एक गुणांक की मूल्यांकन क्षमता को बढ़ाता है, लेकिन यह अस्पष्टता बढ़ा सकता है : यह समझ कि प्रासंगिक जानकारी अनुपलब्ध है या वापस ले ली गई है, क्योंकि हम जो डेटा संसाधित कर रहे हैं उसका "मूल" रूप हमारे लिए उपलब्ध नहीं है।)

एक संबंधित संज्ञानात्मक "पूर्वाग्रह" समवर्ती सिद्धांत है, एक निर्णय के संदर्भ में अधिक वजन वाली जानकारी जो "ठीक है" है, और स्मृति से पुनर्प्राप्ति की आवश्यकता नहीं है। (संक्षिप्तता सिद्धांत यह भी बताता है कि हम उस प्रारूप में जानकारी का उपयोग करने की संभावना रखते हैं जिसमें यह दिया गया है और प्रदर्शनकारी परिवर्तनों से बचने की प्रवृत्ति है।) एक पी-मूल्य की व्याख्या केवल प्रतिगमन उत्पादन को देखकर की जा सकती है; मुझे उस चीज के बारे में कोई ठोस ज्ञान प्राप्त करने की आवश्यकता नहीं है जो मैं मॉडलिंग कर रही हूं।

मैं उम्मीद करता हूं कि सांख्यिकीय आंकड़ों की व्याख्या में कई पूर्वाग्रहों को सामान्य समझ से पता लगाया जा सकता है कि हम किसी समस्या को हल करते समय या निर्णय लेते समय ("संज्ञानात्मक कंजूस", "बद्ध तर्कसंगतता" और इतने पर) आसान रास्ता अपनाने की संभावना रखते हैं। । संबंधित, आमतौर पर "आराम से" कुछ करने से आत्मविश्वास बढ़ता है जिसके साथ हम परिणामस्वरूप विश्वास ( प्रवाह सिद्धांत ) रखते हैं। (कोई भी इस संभावना पर विचार कर सकता है कि डेटा जो स्पष्ट करना आसान हो- खुद के लिए या दूसरों के लिए - हमारे विश्लेषण में अधिक वजन वाले हैं।) मुझे लगता है कि यह विशेष रूप से दिलचस्प हो जाता है जब हम संभावित अपवादों पर विचार करते हैं। उदाहरण के लिए, कुछ मनोवैज्ञानिक शोध बताते हैं कि यदि हम मानते हैं कि किसी समस्या को हल करना मुश्किल होना चाहिए, तो हम दृष्टिकोण और समाधानों का पक्ष ले सकते हैं जो कम ठोस और अधिक कठिन हैं, उदाहरण के लिए, एक साधारण से अधिक आर्कन विधि का चयन करें।


7

मेरे विचार से सबसे बड़ा एकल कारक "पुष्टि पूर्वाग्रह" के रूप में जाना जाता है। मेरे अध्ययन से पता चलता है कि मैं क्या सोचता हूँ, यह तय करने के बाद, मैं अनजाने में उन डेटा बिंदुओं को स्वीकार करता हूं, जो सभी डेटा बिंदुओं का बहाना बनाते हैं, जो इसका खंडन करते हैं। मैं अनजाने में "स्पष्ट साधन त्रुटि" (या कुछ समतुल्य) को किसी भी डेटा बिंदु के रूप में अस्वीकार कर सकता हूं जो मेरे निष्कर्ष पर फिट नहीं बैठता है। कुछ मामलों में, यह काफी हद तक नरम नहीं होगा; उन डेटा बिंदुओं को पूरी तरह से बाहर फेंकने के बजाय, मैं "त्रुटि" को दूर करने के लिए कुछ फार्मूला बनाऊंगा, जो मेरे पूर्ववर्ती निष्कर्ष की पुष्टि करने की दिशा में परिणामों को आसानी से बढ़ाएगा।

इसके बारे में कुछ भी विशेष रूप से नापाक नहीं है; यह सिर्फ इतना है कि हमारा दिमाग कैसे काम करता है। इस तरह के पूर्वाग्रह को छानने के लिए बहुत प्रयास करना पड़ता है, और यह एक कारण है कि वैज्ञानिक दोहरे-अंधा अध्ययनों को मनाना पसंद करते हैं, जैसे कि माप प्रदर्शन करने वाले व्यक्ति को यह नहीं पता है कि प्रयोग को साबित करने की उम्मीद है। इसके बाद बड़े पैमाने पर अनुशासन की आवश्यकता होती है, जिसे उसने ईमानदारी से मापा हो।


1
मुझे लगता है कि यह वास्तव में सबसे खतरनाक पूर्वाग्रह है क्योंकि यह पहले से ही डेटा संग्रह चरण में हो सकता है, उदाहरण के लिए एक छोटे सब्सक्राइबर में डेटा एकत्र करना जो आपकी अपेक्षाओं की पुष्टि करने या प्रमुख सर्वेक्षण प्रश्नों का उपयोग करने की सबसे अधिक संभावना है।
stijn

1
पुष्टि पक्षपाती विषयों के बीच वास्तव में बुरा हो सकता है, जहां विषयों के कथित मौलिक आधार भी अलग हैं, प्रमुख दावे हैं कि "एक्स आपके अनुशासन (अपने संवेदन तरीकों के साथ) में असंभव है, लेकिन मेरा (हम कर सकते हैं) में स्पष्ट है भावना एक्स) ”। जैसे सेब पेड़ों में लटकने या जमीन पर लेटने के लिए होते हैं; वे अपने हिसाब से नहीं गिर सकते। अक्सर, भौतिक विज्ञान में, गणितीय आधार में परिवर्तन होता है जो भ्रम को छिपाता है।
फिलिप ओकले

6

रैखिकता

मुझे लगता है कि डेटा व्याख्या / विश्लेषण के दौरान एक आम पूर्वाग्रह यह है कि लोग आमतौर पर रैखिक संबंधों को ग्रहण करने के लिए जल्दी होते हैं। गणितीय रूप से, एक प्रतिगमन मॉडल मानता है कि इसका निर्धारक घटक भविष्यवक्ताओं का रैखिक कार्य है; दुर्भाग्य से यह हमेशा सच नहीं है। मैं हाल ही में एक अंडरग्रेजुएट पोस्टर कॉन्फ्रेंस में गया था और मैंने एक रेखीय मॉडल के साथ फिट होने वाले स्वैच्छिक द्विघात या गैर-रैखिक रुझानों की मात्रा को कम से कम कहने के लिए चिंताजनक था।

(यह जुआरी के भ्रम, का उल्लेख के अतिरिक्त है -value अशुद्ध अर्थ और सच अनियमितता;। सभी प्रासंगिक पदों के लिए +1)p


2

एक अंतरराज्यीय मामला जुआरी पतन की चर्चा है।

क्या मौजूदा डेटा को शामिल या बहिष्कृत किया जाना चाहिए? अगर मैं पहले से ही 6 छक्कों के साथ आगे हूं, तो क्या ये मेरी एक दर्जन कोशिशों में शामिल है? पूर्व डेटा के बारे में स्पष्ट रहें।

मुझे पूर्ण संख्या से अनुपात में कब बदलना चाहिए? शून्य (एक यादृच्छिक चलना) पर लौटने के लिए एक इंतियाल जीतने वाली लकीर के दौरान प्राप्त लाभ के लिए एक लंबा समय लगता है ।

एक मिलियन डॉलर का 0.1% एक बड़ी कंपनी के लिए अधिक नहीं हो सकता है, लेकिन $ 1000 को ढीला करना एक एकमात्र व्यापारी के लिए जीवन और मृत्यु हो सकती है (यही वजह है कि निवेशक 'प्रेरित' लोगों को निवेश करना चाहते हैं)। प्रतिशत में शिफ्ट होना पूर्वाग्रह हो सकता है।

यहां तक ​​कि सांख्यिकीविदों के पास भी पूर्वाग्रह हैं।


2

मैं डैनियल काह्नमैन द्वारा "थिंकिंग, फास्ट एंड स्लो" की सिफारिश करूंगा , जो कि कई संज्ञानात्मक पक्षपातों को स्पष्ट भाषा में समझाता है।

आप " http://www.burns-stat.com/review-thinking-fast-slow-daniel-kahneman/ " का भी उल्लेख कर सकते हैं, जो उपरोक्त पुस्तक में कुछ पूर्वाग्रहों का सारांश है।

अधिक विस्तृत अध्याय वार सारांश के लिए आप " https://erikreads.files.wordpress.com/2014/04/thinking-fast-and-slow-book-summary.pdf " पढ़ना चाह सकते हैं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.