क्या आंकड़ों पर अत्यधिक उद्धृत कागजात हैं जो वास्तव में खराब सांख्यिकीय प्रथाओं का प्रसार कर चुके हैं?


13

सांख्यिकीय विधियों का दुरुपयोग करने के कई तरीके हैं। क्या आप खराब सांख्यिकीय अभ्यास के किसी भी उदाहरण के बारे में जानते हैं जो पहली बार स्पष्ट सलाह के रूप में प्रकाशित हुए थे (जैसे "आपको इस पद्धति का उपयोग करना चाहिए ..."), प्रतिष्ठित शैक्षणिक पत्रिकाओं में जो तब बार-बार उद्धृत किया गया था?

एक उदाहरण प्रति पूर्वानुमान नियम के 10 घटनाएँ हो सकता है जो अक्सर लॉजिस्टिक या कॉक्स पीएच प्रतिगमन मॉडल ( लिंक ) के लिए लागू किया जाता है ।

स्पष्ट होने के लिए, मेरा मतलब अत्यधिक उद्धृत कागजात नहीं है जो खराब आँकड़े विधियों का उपयोग करने के लिए हुआ है - ये तुच्छ रूप से सामान्य हैं, दुर्भाग्य से।


3
क्या आप सांख्यिकी पत्रिकाओं में मूल प्रकाशन की तलाश कर रहे हैं ? गैर-सांख्यिकी पत्रिकाओं में प्रचारित होने वाली सांख्यिकीय बुरी प्रथा का कोई अंत नहीं है (और जब एक समीक्षक बताते हैं कि कुछ गलत है, तो लेखक आमतौर पर "पिछले शोध में हमारे पेपर को टाई करने के लिए" इसे छोड़ने का तर्क देंगे)। निरंतर परिणामों को विवेकहीन करने जैसी चीजों के लिए किसी भी मूल प्रकाशन का पता लगाना कठिन हो सकता है, हालांकि, चूंकि बुरे विचार स्वतंत्र रूप से फसल करते हैं।
स्टीफन कोलासा

मेरा मतलब है स्पष्ट सलाह के रूप में, उदाहरण के लिए "यह करो ..."। मैंने स्पष्ट करने के लिए प्रश्न संपादित किया है। धन्यवाद।
DL Dahly

2
आप अक्सर आँकड़े पत्रिकाओं में स्पष्ट रूप से "यह करें" आदेश नहीं देखते हैं। आप इसे कुछ एप्लिकेशन क्षेत्रों में देखते हैं, खासकर जब ऐसे लोगों द्वारा लिखे गए हैं जो कुछ समस्याग्रस्त अभ्यास (ओं) की आलोचना कर रहे हैं (जहां वे कभी-कभी कहते हैं कि 'ए मत करो, बी मत करो' - लेकिन खुद को काफी संदिग्ध सलाह दे सकते हैं।) आप के बाद की बात है? मैं अन्य क्षेत्रों में पत्रिकाओं को इतना सब नहीं पढ़ता हूं, लेकिन मैंने अतीत में उस तरह के कुछ कागजात देखे हैं। (भले ही मैं ठीक से याद कर सकता हूं, हालांकि, मैं नहीं कह सकता हूं। पता है कि उनमें से किसी को अत्यधिक उद्धृत किया गया था) ... ctd
Glen_b -Reinstate मोनिका

1
ctd ... एक कागज नहीं है, मैं एक पाठ्यपुस्तक में कुछ संदिग्ध सलाह को इंगित कर सकता हूं, जो अपने अनुप्रयोग क्षेत्र में अनुसंधान के लिए आँकड़े सीखने वाले लोगों के साथ लोकप्रिय लगती है।
Glen_b -Reinstate मोनिका

2
कृपया बताएं कि "सांख्यिकीय झूठ" से आपका क्या मतलब है। यह आँकड़ों में एक मानक अवधारणा नहीं है, जो किसी कार्य के लिए अधिक या कम उपयुक्त प्रक्रियाओं की सिफारिश करने की चिंता करती है। हां, कुछ प्रक्रियाओं को दूसरों की तुलना में खराब माना जाता है, लेकिन "झूठ" के रूप में उनके उपयोग को रोकना मुश्किल है। "असत्य" से आप किसी तरह की भ्रामक व्याख्या का मतलब निकालेंगे, या किसी अनजाने प्रक्रिया का उपयोग करने की सलाह, या गणितीय त्रुटि के आधार पर सलाह, या ... क्या?
whuber

जवाबों:


4

आरए फिशर, "फील्ड प्रयोगों की व्यवस्था"। ग्रेट ब्रिटेन के कृषि मंत्रालय की पत्रिका। 33: 503–513। 1926।

α=0.05

... लाइन को उस स्तर पर खींचना सुविधाजनक है जिस स्तर पर हम कह सकते हैं: "या तो उपचार में कुछ है, या एक संयोग ऐसा हुआ है जैसे बीस परीक्षणों में एक से अधिक बार नहीं होता है।"

... यदि बीस में से एक भी पर्याप्त नहीं लगता है, तो हम, यदि हम इसे पसंद करते हैं, तो लाइन को पचास में से एक (2 प्रतिशत बिंदु), या सौ में से एक (1 प्रतिशत बिंदु) में ड्रा करें। व्यक्तिगत रूप से, लेखक 5 प्रतिशत के स्तर पर महत्व का निम्न स्तर निर्धारित करना पसंद करता है , और पूरी तरह से सभी परिणामों को अनदेखा करता है जो इस स्तर तक पहुंचने में विफल होते हैं। एक वैज्ञानिक तथ्य को केवल प्रायोगिक रूप से स्थापित माना जाना चाहिए, यदि एक उचित रूप से डिज़ाइन किया गया प्रयोग इस स्तर के महत्व को देने में विफल रहता है।


3

अर्थमिति में, आप निश्चित रूप से सभ्य पत्रिकाओं में प्रकाशित सुविख्यात (और अत्यधिक कुशल) अर्थशास्त्री द्वारा प्रचारित तरीकों के कुछ उदाहरण पा सकते हैं। मैं एक सैद्धांतिक पेपर से अवगत नहीं हूं, लेकिन लालोंडे (1986) यह बताने के लिए काफी प्रसिद्ध है कि वर्तमान में उपयोग की जाने वाली विधियां ठीक नहीं हैं: वे प्रेक्षक के साथ समान डेटासेट प्रयोगात्मक विधियों की तुलना करते हैं और (कारण) उपचार के क्षेत्र में बड़े अंतर पाते हैं। मूल्यांकन । एक बड़ा साहित्य है जिसने इन गैर-प्रायोगिक तरीकों का प्रचार किया जो कि तब तक उपयोग किए जाते थे और जिन्हें आज भी अक्सर इस्तेमाल किया जाता है।

इसके बाद, वहाँ (और मुझे लगता है कि अभी भी है) इस बारे में एक बहस है कि क्या प्रॉपर्टीज स्कोर मिलान संभव समाधान है (उदाहरण के लिए यहां देखें )।

इसके अलावा, वाद्य चर अनुमान के बारे में बहुत विवाद है । अत्यधिक उद्धृत मूल पत्रों के निष्कर्ष विवादित रहे हैं। यह संभवतः आपके प्रश्न का निकटतम उदाहरण है। बाउंड एंड जैगर (1996, और बाद के पेपर्स) ने एनग्रिस्ट और क्रुएगर (1991, Google विद्वान के अनुसार 2700 उद्धरण) से प्रसिद्ध पेपर के निष्कर्षों पर सवाल उठाया है, जो मूल रूप से लागू अर्थशास्त्र के साहित्य में वाद्य चर विधि की स्थापना करता है।

कार्यशीलता स्थापित करने के लिए तथाकथित कम रूप अनुमानों की उपयुक्तता के बारे में बड़ी बहस भी है , उदाहरण के लिए इमबेंस (2010) देखें

एक और बड़ा विषय निश्चित रूप से मानक त्रुटि के बारे में है। एक शायद एक प्रसिद्ध कागज प्रचारक पी-मूल्यों को पा सकता है। अर्थमिति में, गलत मौजूदा तरीकों के कारण अधिक समय के लिए मानक त्रुटि, अक्सर गलत ( अंतर-अंतर डिजाइन में ) मिसकॉल की गई है, यहां देखें । हालाँकि मुझे उस संदर्भ में इन तरीकों का प्रस्ताव करने वाले एक मूल उच्च-उद्धृत पेपर के बारे में जानकारी नहीं है लेकिन मुझे यकीन है कि आपको इस क्षेत्र में कुछ उदाहरण मिलेंगे।

सूत्रों का कहना है:

एनग्रिस्ट, जोशुआ डी।, और एलन बी। कीगर। "क्या अनिवार्य स्कूल उपस्थिति स्कूली शिक्षा और कमाई को प्रभावित करती है?" अर्थशास्त्र की त्रैमासिक पत्रिका 106, सं। 4 (1991): 979-1014।

बर्ट्रेंड, मैरिएन, एस्थर डुफ्लो और सेंथिल मुलैनाथन। "हमें अंतर-अंतर के अनुमानों पर कितना भरोसा करना चाहिए?" अर्थशास्त्र की त्रैमासिक पत्रिका 119, सं। 1 (2004): 249-275।

बाउंड, जॉन और डेविड ए। जेगर। मजदूरी समीकरणों में एक उपकरण के रूप में जन्म के मौसम की वैधता पर: एनग्रिस्ट एंड क्रूगर के "कमेंट्री स्कूल अटेंडेंस इफेक्ट्स शॉ। नंबर w5835 पर एक टिप्पणी। राष्ट्रीय आर्थिक अनुसंधान ब्यूरो, 1996।

देहजिया, राजीव "व्यावहारिक प्रवृत्ति स्कोर मिलान: स्मिथ और टॉड का उत्तर।" जर्नल ऑफ़ इकोनोमेट्रिक्स 125, नं। 1-2 (2005): 355-364।

Imbens, Guido W. "इससे बेहतर कुछ नहीं: Deaton (2009) और Heckman और Urzua (2009) पर कुछ टिप्पणियां।" जर्नल ऑफ इकोनॉमिक लिटर 48, नं। 2 (2010): 399-423।

LaLonde, रॉबर्ट जे। "प्रायोगिक डेटा के साथ प्रशिक्षण कार्यक्रमों के अर्थमितीय मूल्यांकन का मूल्यांकन।" अमेरिकी आर्थिक समीक्षा (1986): 604-620। *


1

मैं एक कोशिश देता हूं (हालांकि इतना मजबूत नहीं):

बहुत उपयोगी [कैमरन, एसी, और मिलर, डीएल (2015)। क्लस्टर-मजबूत निष्कर्ष के लिए एक चिकित्सक का मार्गदर्शन। मानव संसाधन जर्नल, 50 (2), 317-372।] // पहले से ही 1900 Google विद्वान उद्धरण // मानक त्रुटियों के क्लस्टरिंग के उचित स्तर के बारे में सलाह प्रदान करता है:

"सर्वसम्मति रूढ़िवादी है और पूर्वाग्रह से बचने के लिए और संभव होने पर बड़े और अधिक कुल समूहों का उपयोग करने के लिए, उस बिंदु तक और उस बिंदु को शामिल करना, जिस पर बहुत कम क्लस्टर होने की चिंता है।"

हालांकि, [अबडी, ए।, अथी, एस, इमबेंस, जीडब्ल्यू, और वोल्ड्रिज, जे। (2017)। आपको क्लस्टरिंग के लिए मानक त्रुटियों को कब समायोजित करना चाहिए? (नंबर w24003)। नेशनल ब्यूरो ऑफ इकोनॉमिक रिसर्च।] से पता चलता है कि "वास्तव में बहुत स्तर पर क्लस्टरिंग में नुकसान होता है"। कृपया बाद के पेज 1 देखें: https://economics.mit.edu/files/13927

हो सकता है कि आप अबादी एट अल (2017) द्वारा हाइलाइट किए गए दो गलतफहमी से शुरू होने वाले एक मामले को भी बनाने में सक्षम हों।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.