एक मनोविज्ञान पत्रिका ने पी-मूल्यों और आत्मविश्वास के अंतराल पर प्रतिबंध लगा दिया; क्या वास्तव में उनका उपयोग बंद करना बुद्धिमानी है?


73

25 फरवरी, 2015, पत्रिका बुनियादी और अनुप्रयुक्त सामाजिक मनोविज्ञान एक संपादकीय जारी प्रतिबंध लगाने भविष्य सभी कागजात से -values और विश्वास के अंतराल।p

विशेष रूप से, वे कहते हैं (स्वरूपण और जोर मेरा है):

  • [...] प्रकाशन से पहले, लेखकों को NHSTP [अशक्त परिकल्पना महत्व परीक्षण प्रक्रिया] ( -values, t -values, F -values, '' महत्वपूर्ण '' मतभेदों के बारे में कथन या उसके अभाव) के सभी पहलुओं को हटाना होगा। , और इसी तरह)।ptF

  • एनएचएसटीपी अशक्त परिकल्पना की संभावना प्रदान करने में कैसे विफल रहता है, इसे खारिज करने के लिए एक मजबूत मामला प्रदान करने की आवश्यकता है, इसके अनुरूप, आत्मविश्वास अंतराल यह निष्कर्ष निकालने के लिए एक मजबूत मामला प्रदान नहीं करता है कि ब्याज की आबादी पैरामीटर के भीतर होने की संभावना है। मध्यान्तर। इसलिए, विश्वास अंतराल भी बीएएसपी से प्रतिबंधित है।

  • [...] बायेसियन प्रक्रियाओं के संबंध में, हम केस-बाय-केस जजमेंट करने का अधिकार सुरक्षित रखते हैं, और इस तरह बायेसियन प्रक्रियाओं को बीएएसपी से न तो आवश्यक है और न ही प्रतिबंधित है।

  • [...] क्या किसी भी तरह की सांख्यिकीय प्रक्रियाओं की आवश्यकता है? - नहीं [...] हालांकि, बीएएसपी को प्रभाव विवरण सहित मजबूत वर्णनात्मक आंकड़ों की आवश्यकता होगी।

pp

p

या जैसा कि @whuber ने इसे डालने का सुझाव दिया है, क्या इस दृष्टिकोण को आमतौर पर मात्रात्मक अनुसंधान के प्रतिमान के रूप में देखा जाना चाहिए? और यदि नहीं तो बतायें, क्यों नहीं?

पुनश्च। ध्यान दें कि मेरा प्रश्न स्वयं प्रतिबंध के बारे में नहीं है ; यह सुझाए गए दृष्टिकोण के बारे में है। मैं बार-बार बनाम बायेसियन इंट्रेंस के बारे में नहीं पूछ रहा हूं। Bayesian तरीकों के बारे में संपादकीय बहुत नकारात्मक है; इसलिए यह अनिवार्य रूप से आँकड़ों का उपयोग करने के बारे में है।


अन्य चर्चा: रेडिट , गेलमैन


14
रैखिक प्रतिगमन मॉडल में पी-मान और आत्मविश्वास अंतराल के बीच एक-से-एक मानचित्रण है, इसलिए मुझे पी-मूल्यों पर प्रतिबंध लगाने का एक मजबूत कारण नहीं दिखता है, लेकिन आत्मविश्वास अंतराल को बनाए रखना बहुत मायने रखता है। लेकिन पी-मूल्यों और आत्मविश्वास के अंतराल पर प्रतिबंध लगाने से परिणामों के विवरण में एक अंतर रह जाता है ... मुझे आश्चर्य है कि अगर वे मानक त्रुटियों की रिपोर्ट करने की अनुमति देते हैं (जो कि एक-से-एक मैपिंग समूह का एक और उपाय होगा)।
रिचर्ड हार्डी

7
सब कुछ दुरुपयोग किया जा सकता है इसलिए इस शर्त पर सामान पर प्रतिबंध लगाना, अच्छी तरह से ... अजीब है। मैं पी-वैल्यूज़ का प्रशंसक नहीं हूं, लेकिन यह समस्या के लिए एक बहुत अच्छा अनुभव है। एक बात उचित सामग्री का प्रयोग करने के लिए प्रोत्साहित किया जाता है, लेकिन चीजों पर प्रतिबंध लगाने समस्या से निपटने के लिए एक उचित तरीके से की तरह ध्वनि नहीं करता है ...
टिम

12
महान विचार। आंकड़ों का उपयोग करना इस क्षेत्र की अवैज्ञानिक प्रकृति को छिपाता है।
अक्कल

4
यह पी मानों के दुरुपयोग पर हताशा के लिए एक पूर्ण अतिरेक की तरह लगता है। मैं सामान्य रूप से P मानों के बजाय p मानों के दुरुपयोग पर प्रतिबंध लगाने से बहुत अधिक खुश होऊंगा।
TrynnaDoStat

8
अपनी सूची में 4 आइटम सुझाव है कि वे कर रहे हैं नहीं बिंदु अनुमान है, जो निष्कर्ष होगा, लेकिन प्रभाव आकार केवल के रूप में वर्णनात्मक सांख्यिकी सूचना की आवश्यकता होती है। (फिर भी, संपादकीय में कुछ पंक्तियाँ, "हम प्रोत्साहित करते हैं कि बड़े साइकोलॉजी साइज़ की तुलना में साइकोलॉजी रिसर्च में विशिष्ट है, क्योंकि जैसे-जैसे सैंपल साइज़ बढ़ता है, वर्णनात्मक आँकड़े बढ़ते-बढ़ते स्थिर हो जाते हैं और सैंपलिंग एरर की समस्या कम होती है")। मैं स्थिरता और नमूना त्रुटि के प्रभाव के लिए मात्रात्मक लेखांकन के इस धारणा औपचारिकता में अनुसंधान के लिए 2016 संपादकीय के फोन करने के लिए तत्पर हैं)।
Scortchi

जवाबों:


23

वर्तमान 2015 के संपादकीय का पहला वाक्य जिसमें ओपी लिंक है, पढ़ता है:

बेसिक और एप्लाइड सोशल साइकोलॉजी (बीएएसपी) 2014 के संपादकीय * ने जोर देकर कहा कि अशक्त परिकल्पना महत्व परीक्षण प्रक्रिया (NHSTP) अमान्य है ...

(मेरा जोर)

दूसरे शब्दों में, संपादकों के लिए यह पहले से ही सिद्ध वैज्ञानिक तथ्य है कि "अशक्त परिकल्पना महत्व परीक्षण" अमान्य है, और 2014 के संपादकीय ने केवल इतना जोर दिया, जबकि वर्तमान 2015 के संपादकीय सिर्फ इस तथ्य को लागू करते हैं।

NHSTP का दुरुपयोग (दुर्भावनापूर्ण रूप से भी ऐसा) वास्तव में अच्छी तरह से चर्चा और प्रलेखित है। और यह मानव इतिहास में अनसुना नहीं है कि "चीजों पर प्रतिबंध लगा दिया गया है" क्योंकि यह पाया गया है कि सभी के कहने और किए जाने के बाद, उन्हें अच्छे उपयोग के लिए अधिक से अधिक दुरुपयोग किया गया था (लेकिन क्या हमें सांख्यिकीय रूप से परीक्षण नहीं करना चाहिए?)। यह एक "दूसरा सबसे अच्छा" समाधान हो सकता है, जो लाभ के बजाय (औसतन आँकड़ों के) नुकसान को कम करने के लिए आया है, और इसलिए हम अनुमान लगाते हैं (अनुमानी आँकड़े) कि यह भविष्य में भी हानिकारक होगा।

लेकिन उत्साह से ऊपर पहला वाक्य के शब्दों के पीछे से पता चला, इस -exactly देखो, एक के रूप में बनाता कट्टरपंथी एक शांत अध्यक्षता हाथ है कि प्रस्ताव के बजाय चोरी करने के लिए जाता है में कटौती करने के निर्णय के बजाय दृष्टिकोण। यदि कोई उपरोक्त उद्धरण में उल्लिखित एक वर्षीय पुराने संपादकीय को पढ़ता है (DOI: 10.1080 / 01973533.2014.865505), तो कोई यह देखेगा कि यह नए संपादक द्वारा जर्नल की नीतियों के पुन: निर्धारण का एक हिस्सा है।

संपादकीय नीचे स्क्रॉल करते हुए, वे लिखते हैं

... इसके विपरीत, हम मानते हैं कि पी <.05 बार पास करना बहुत आसान है और कभी-कभी कम गुणवत्ता वाले अनुसंधान के लिए एक बहाना के रूप में कार्य करता है।

इसलिए ऐसा प्रतीत होता है कि उनके अनुशासन से संबंधित उनका निष्कर्ष यह है कि अशक्त-परिकल्पनाओं को "बहुत बार" खारिज कर दिया जाता है, और इसलिए कथित निष्कर्षों से महत्वपूर्ण सांख्यिकीय महत्व प्राप्त हो सकता है। यह पहले वाक्य में "अमान्य" तानाशाही के समान तर्क नहीं है।

इसलिए, इस सवाल का जवाब देने के लिए, यह स्पष्ट है कि पत्रिका के संपादकों के लिए, उनका निर्णय न केवल बुद्धिमान है, बल्कि पहले से ही लागू होने में देर हो चुकी है: वे सोचते हैं कि वे काटते हैं कि आँकड़ों का कौन सा हिस्सा हानिकारक हो गया है, रखते हुए लाभकारी भागों-मुझे विश्वास नहीं हो रहा है कि यहाँ कुछ भी है जो कुछ "समकक्ष" के साथ बदलने की आवश्यकता है ।

एपिस्टेमोलोगिक रूप से, यह एक ऐसा उदाहरण है जहां सामाजिक विज्ञान के विद्वान आंशिक रूप से मात्रात्मक तरीकों का उपयोग करके अपने अनुशासन और परिणामों को अधिक उद्देश्यपूर्ण बनाने के प्रयास से पीछे हट जाते हैं, क्योंकि वे इस निष्कर्ष पर पहुंचे हैं कि (कैसे?) कि, अंत में? प्रयास ने "अच्छे से अधिक बुरे" का निर्माण किया। मैं कहूंगा कि यह एक बहुत ही महत्वपूर्ण मामला है, सिद्धांत रूप में संभव हुआ है, और एक कि यह "उचित संदेह से परे" प्रदर्शित करने के लिए काम के वर्षों की आवश्यकता होगी और वास्तव में आपके अनुशासन में मदद करेगा। लेकिन प्रकाशित सिर्फ एक या दो संपादकीय और पत्र (शायद आँकड़े) सबसे अधिक केवल एक गृह युद्ध को प्रज्वलित करते हैं।

2015 के संपादकीय का अंतिम वाक्य पढ़ता है:

हम आशा और आशा करते हैं कि एनएचएसटीपी पर प्रतिबंध लगाने से एनएचएसटीपी की अपमानजनक संरचना से लेखकों को मुक्त करने के लिए प्रस्तुत पांडुलिपियों की गुणवत्ता में वृद्धि का प्रभाव होगा, जिससे रचनात्मक सोच के लिए एक महत्वपूर्ण बाधा समाप्त हो जाएगी। NHSTP दशकों से मनोविज्ञान पर हावी है; हमें उम्मीद है कि पहला एनएचएसटीपी प्रतिबंध लगाने से, हम यह प्रदर्शित करते हैं कि मनोविज्ञान को एनएचएसटीपी की बैसाखी की आवश्यकता नहीं है, और यह कि अन्य पत्रिकाएँ सूट का पालन करती हैं।


5
हां ... हमें इस साइट पर जीभ-इन-गाल या सार्डोनिक जवाब लिखते समय सावधान रहना होगा: वे (पूरी तरह से) गलत समझा जा सकता है!
whuber

4
@ naught101 ... यह बहुत कूटनीतिक नहीं होगा। ध्यान दें कि जिस तरह से एनएचएसटीपी की निंदा की जाती है, वह मनोवैज्ञानिकों को खुद बख्शता है कि उन्होंने इन सभी दशकों में इसका इस्तेमाल किया है। यदि यह आपके द्वारा प्रस्तावित किए जाने के तरीके को लिखा जाता है, तो यह वैज्ञानिकों के रूप में उनके सहयोगियों पर प्रत्यक्ष हमले की तरह अधिक दिखाई देगा। जैसा कि यह अब अनिवार्य रूप से पाठ का अर्थ है कि अच्छे इरादों से भरे मनोवैज्ञानिकों को दुर्भाग्य से "किसी" द्वारा दृष्टिकोण का उपयोग करने में गुमराह किया गया है, जिसने इस मामले में "वैज्ञानिक प्राधिकरण की शक्ति" का दुरुपयोग किया है ... शायद वैज्ञानिक द्वारा संचालित बुरे सांख्यिकीविदों द्वारा। साम्राज्यवाद?
एलेकोस पापाडोपोलोस

4
नाच न जाने आंगन टेढ़ा।
n

3
@BrianDHall मैं इस मुद्दे पर विशिष्ट लेखक के कार्यों के बजाय NHSTP (इस साइट में शामिल) के मुद्दों पर अधिक आधिकारिक संसाधनों को देखने का सुझाव दूंगा। बात मुश्किल और अपनी टिप्पणी के आसपास "स्वीकार" और "जोर" अर्थ विज्ञान ... पहले से चर्चा करनी चाहिए सूक्ष्म -already है
Alecos पापाडोपौलोस

6
@ naught101: यदि आप ध्यान दें कि काम करने वाला चेनसा को ठीक से संभाल नहीं सकता है, तो आप उपकरण को दोष नहीं दे सकते। लेकिन फिर भी आप इसे आगे के नुकसान से बचाने के लिए, इसे कामगार से दूर ले जाएंगे ;-)
nikie

19

PP<0.05

आत्मविश्वास के अंतराल पर प्रतिबंध लगाना भी खत्म हो गया है, लेकिन उन कारणों के लिए नहीं जो दूसरों ने कहा है। आत्मविश्वास अंतराल केवल तभी उपयोगी होते हैं जब कोई उन्हें बायेसियन विश्वसनीय अंतराल (उपयुक्त गैर-सूचना पुजारियों के लिए) के रूप में गलत व्याख्या करता है। लेकिन वे अभी भी उपयोगी हैं। तथ्य यह है कि उनकी सटीक लगातार व्याख्या से कुछ भी नहीं होता है, लेकिन भ्रम का अर्थ है कि हमें "चकमा से बाहर निकलने" और बायेसियन या संभावना स्कूल जाने की आवश्यकता है। लेकिन अच्छी पुरानी आत्मविश्वास सीमाओं को गलत तरीके से समझने से उपयोगी परिणाम प्राप्त किए जा सकते हैं।

यह शर्म की बात है कि जर्नल के संपादकों ने बायेसियन आंकड़ों को गलत समझा और शुद्ध संभावना के अस्तित्व के बारे में नहीं जानते। वे जो मांग कर रहे हैं वह बायस्पियन के बाद के वितरण द्वारा आसानी से प्रदान किया जा सकता है थोड़ा संशयवादी पादरियों का उपयोग करके।


n3±0.53±1p<0.05

4
मुझे लगता है कि मानक त्रुटियों की देखरेख की जाती है (क्योंकि वे सममित वितरण का अनुमान लगाते हैं), लेकिन सटीकता के उपयोगी उपाय, जैसे कि अर्थ चुकता त्रुटि। आप संभावना कवरेज की कल्पना किए बिना रूट माध्य चुकता त्रुटि के आधार पर एक सटीक अंतराल के बारे में सोच सकते हैं। इसलिए मैं यह नहीं देखता कि इस चर्चा में किसी मानक त्रुटि का जोर कहां है। और मैं यह सुझाव नहीं दे रहा था कि हम सीएल का उपयोग करना बंद कर दें। लेकिन सीएल के साथ कठिनाई मुख्य रूप से संभाव्यता व्याख्या में प्रयासों से आती है।
फ्रैंक हरेल

हममम। दिलचस्प। मेरे लिए ऐसा लगता है कि मानक त्रुटि से लेकर सीआई (एक स्थिर कारक!) तक ऐसा कोई छोटा कदम है, कि उनके साथ अलग तरह से व्यवहार करना अजीब होगा। लेकिन शायद यह एक अर्थ बिंदु है; मुझे लगता है कि आपका क्या मतलब है कि लोग मानक त्रुटियों और सीआई के बारे में अलग-अलग सोचते हैं और सीआई के बारे में अधिक भ्रमित हो जाते हैं। मुझे आश्चर्य है कि मानक त्रुटियों के बारे में यह विशेष पत्रिका नीति क्या कहती है (संपादकीय स्पष्ट रूप से उनका उल्लेख नहीं करता है)।
अमीबा

2
सममित स्थितियों में, मानक त्रुटि एक विश्वास अंतराल के लिए एक बिल्डिंग ब्लॉक है। लेकिन कई मामलों में सही आत्मविश्वास अंतराल असममित है, इसलिए यह एक मानक त्रुटि पर आधारित नहीं हो सकता है। बूटस्ट्रैप और बैक-ट्रांसफॉर्मिंग की कुछ किस्में इस प्रकार के दो दृष्टिकोण हैं। प्रोफ़ाइल संभावना आत्मविश्वास अंतराल विशेष रूप से यहाँ ध्यान में रखते हैं।
फ्रैंक हरेल

@ फ्रेंक हरेल - "शुद्ध संभावना निष्कर्ष" के रूप में, मैं सहमत हूं कि डेटा की संभावना को संक्षेप में प्रस्तुत करने के बिना इसे थ्रेसहोल्ड के साथ संक्षेपित करने पर जोर दिया गया प्रतीत होता है कि उत्तर संपादकों के लिए लोभी थे। AWF एडवर्ड्स की पुस्तक "लाइकेलिहुड" (1972) सीधे संपादक की चिंता पर बात करती है: "हम इन तर्कों पर विचार कर सकते हैं (उदाहरण महत्व परीक्षण) जब तक कि अध्याय के बाद तक, और एक प्रक्रिया के वर्णन के लिए तुरंत पास हो जाएं, फेलिशियल की अवधारणा की संभावना के आधार पर। , जो इनमें से किसी भी वस्तु के लिए खुला है, जिसे महत्व परीक्षणों में समतल किया जा सकता है। "
जॉन मार्क

13

मैं इस दृष्टिकोण को कई पहले प्रकाशित 'महत्वपूर्ण निष्कर्षों' को दोहराने के लिए सामाजिक मनोविज्ञान की अक्षमता को संबोधित करने के प्रयास के रूप में देखता हूं।

इसके नुकसान हैं:

  1. यह कई कारकों को संबोधित नहीं करता है, जो प्रभाव को प्रभावित करते हैं। उदाहरण के लिए,

    • ए) लोग अभी भी अपने डेटा को देख सकते हैं और अपनी पढ़ाई को चलाना बंद कर सकते हैं जब एक प्रभाव आकार उन्हें ब्याज के पर्याप्त रूप से बड़े होने के रूप में हमला करता है।

    • बी) बड़े प्रभाव आकार अभी भी शक्ति के पूर्वव्यापी आकलन में बड़ी शक्ति है।

    • सी) लोग अभी भी दिलचस्प और बड़े प्रभावों के लिए मछली पकड़ेंगे (एक प्रयोग में परिकल्पनाओं के एक समूह का परीक्षण करना और फिर उस एक को रिपोर्ट करना जो पोप किया गया है) या

    • डी) का दावा है कि एक अप्रत्याशित अजीब प्रभाव सभी के साथ की उम्मीद थी।

    क्या पहले इन मुद्दों को हल करने का प्रयास नहीं किया जाना चाहिए?

  2. एक क्षेत्र के रूप में आगे की ओर जा रहा है यह बहुत भयानक पिछले निष्कर्षों की समीक्षा करेंगे। विभिन्न अध्ययनों की विश्वसनीयता का मात्रात्मक मूल्यांकन करने का कोई तरीका नहीं है। यदि प्रत्येक पत्रिका ने इस दृष्टिकोण को लागू किया है, तो आपके पास सामाजिक वैज्ञानिकों का एक समूह होगा जो यह कहेगा कि एक्स के लिए सबूत है जब यह पूरी तरह से अस्पष्ट है कि एक्स कितना विश्वसनीय है और वैज्ञानिक इस बात पर बहस कर रहे हैं कि प्रकाशित प्रभाव की व्याख्या कैसे की जाए या यह तर्क दिया जाए कि क्या यह महत्वपूर्ण है या लायक है। के बारे में बातें कर रहे हैं। क्या यह आंकड़े होने की बात नहीं है? संख्या का आकलन करने के लिए एक सुसंगत तरीका प्रदान करना। मेरी राय में, यदि यह व्यापक रूप से लागू किया गया था, तो यह नया दृष्टिकोण गड़बड़ाएगा।

  3. यह परिवर्तन छोटे प्रभाव आकारों के साथ अध्ययन के परिणामों को प्रस्तुत करने के लिए शोधकर्ताओं को प्रोत्साहित नहीं करता है, इसलिए यह वास्तव में फ़ाइल-दराज प्रभाव को संबोधित नहीं करता है (या क्या वे प्रभाव के आकार की परवाह किए बिना बड़े एन के साथ निष्कर्ष प्रकाशित करने जा रहे हैं?) यदि हमने सावधानीपूर्वक तैयार किए गए अध्ययनों के सभी परिणामों को प्रकाशित किया है, तो भले ही व्यक्तिगत अध्ययन के परिणामों की विश्वसनीयता अनिश्चित हो, मेटा-विश्लेषण और अध्ययनों की समीक्षा जो सांख्यिकीय विश्लेषण की आपूर्ति करते हैं, सच्चाई की पहचान करने में बहुत बेहतर काम करेंगे।


2
@captain_ahab के बारे में 3 बिंदु, हमें उल्लेख करना चाहिए कि संपादक के पिछले संपादकीय (2014) ने स्पष्ट रूप से "अशक्त-प्रभाव" अध्ययनों को प्रस्तुत करने के लिए प्रोत्साहित किया।
एलेकोस पापाडोपोलोस

1
मैं संपादकीय में एक टिप्पणी खोजने के लिए प्रतीत नहीं हो सकता है कि प्रकाशन के लिए किसी भी मापदंड पर चर्चा करने की आवश्यकता को छोड़कर सामान्य से अधिक बड़े आकार के नमूने हैं (कैसे वे स्वीकार्य एन की पहचान करने की योजना बना रहे हैं, इसके बारे में बिना अनुमान के आंकड़े मेरे लिए अस्पष्ट हैं)। मेरे लिए इस संपादकीय में कोई जोर नहीं है कि वे परवाह नहीं करते कि प्रभाव का आकार क्या है। यह मुझे लगता है कि वे अभी भी दिलचस्प प्रभाव और दिलचस्प कहानियों की तलाश में रहेंगे, जो मुझे लगता है कि सामाजिक विज्ञान के काम में बड़ी समस्या है (यानी, दिलचस्प प्रभाव और कहानियों के लिए पोस्ट-हॉक खोज)।
कप्तान_साहब

2
ऐसा क्या लगता है कि एक बेहतर समाधान यह है कि सभी वैज्ञानिकों को अध्ययन को चलाने वाले एक सार्वजनिक स्थान में अध्ययन की परिकल्पना, बुनियादी तर्कसंगत, शक्ति और विश्लेषण के दृष्टिकोण को लॉग इन करना होगा। और फिर उस अध्ययन को निर्धारित तरीके से प्रकाशित करने के लिए सीमित किया जा रहा है। यदि कोई अप्रत्याशित दिलचस्प प्रभाव पाया जाता है, तो उन्हें सार्वजनिक रूप से लॉग इन करना चाहिए, फिर एक नया अध्ययन चलाना चाहिए जो उस प्रभाव की जांच करता है। झूठी सकारात्मकता को नियंत्रित करते हुए यह दृष्टिकोण वैज्ञानिकों को नए प्रभाव प्रकाशित किए बिना उनकी उत्पादकता को प्रदर्शित करने में भी सक्षम होगा।
कप्तान_अहब

7

मेरे पास एक अद्भुत उद्धरण है जो लगभग एक ही बिंदु के लिए तर्क देता है, लेकिन काफी नहीं - चूंकि यह एक पाठ्यपुस्तक में एक प्रारंभिक पैराग्राफ है जो ज्यादातर अक्सर सांख्यिकी और परिकल्पना परीक्षण के बारे में है।

यह लेखक की तरह गैर-सांख्यिकीविदों द्वारा व्यापक रूप से आयोजित किया जाता है, कि यदि आप अच्छे प्रयोग करते हैं तो आंकड़े आवश्यक नहीं हैं। वे काफी सही हैं। [...] बेशक, यह अच्छा है कि अच्छे प्रयोग करना मुश्किल है। अधिकांश लोगों को वे सभी सहायता की आवश्यकता होती है जो उन्हें यह दावा करने से रोकने के लिए कर सकती हैं कि उनका पसंदीदा सिद्धांत उन टिप्पणियों द्वारा पुष्ट किया जाता है जो कुछ भी नहीं करते हैं। और आंकड़ों के उस खंड का मुख्य कार्य जो महत्व के परीक्षणों से संबंधित है, लोगों को खुद को मूर्ख बनाने से रोकना है। इस दृष्टि से, महत्त्वपूर्ण परीक्षणों का कार्य लोगों को प्रयोगों को प्रकाशित करने से रोकना है, न कि उन्हें प्रोत्साहित करना। आदर्श रूप में, वास्तव में, महत्त्वपूर्ण परीक्षण कभी भी प्रिंट में दिखाई नहीं देने चाहिए, अगर इस्तेमाल किया गया हो, तो अपर्याप्त प्रयोगों का पता लगाने के लिए प्रारंभिक चरणों में,

- डेविड Colquhoun , 1971 पर जीवविज्ञान पर व्याख्यान


1
आपकी पोस्ट वास्तव में एक टिप्पणी है, बजाय एक उत्तर के, इसलिए मैं इसे अपवित्र करने से बच रहा हूं, लेकिन मैं उद्धरण साझा करने के लिए धन्यवाद देना चाहता हूं। इस मार्ग में बहुत सी गलतफहमियाँ स्पष्ट हैं कि यह सभी को इंगित करने और डिबैंक करने के लिए व्यापक प्रयास (स्थान नहीं कहने के लिए) करेगा। एक शब्द में, हालांकि, इन दावे के लिए काउंटर "दक्षता" है। यदि हर किसी के पास असीमित समय और बजट है तो हम कम से कम "अच्छे प्रयोग" करने की आकांक्षा कर सकते हैं। लेकिन जब संसाधन सीमित होते हैं, तो केवल "अंतिम, ... स्पष्ट" प्रयोगों का संचालन करना मूर्खतापूर्ण (साथ ही महंगा) होगा।
whuber

2
आपकी टिप्पणी के लिए धन्यवाद, @whuber; तुम जो कह रहे हो मैं उससे सहमत हूँ। फिर भी, मुझे यह जोड़ना होगा कि मुझे यह कहते हुए अच्छा लग रहा है कि आदर्श रूप से प्रायोगिक आंकड़ों को इतना ठोस होना चाहिए कि औपचारिक परिकल्पना परीक्षणों को निरर्थक बना दिया जा सके। यह एक अप्राप्य आदर्श नहीं है! मेरे क्षेत्र (जहां पी मूल्यों एक बहुत उपयोग किया जाता है) में, मुझे लगता है कि सबसे अच्छा कागजात कर रहे हैं उनके बिना समझाने: जैसे क्योंकि वे एक दूसरे का समर्थन कई प्रयोगों की एक दृश्य है, जो एक साथ लिया, पेश स्पष्ट रूप से एक सांख्यिकीय अस्थायी नहीं हो सकता। टिप्पणी करें: यह एक टिप्पणी के लिए बहुत लंबा था, और मुझे लगा कि यह एक सीडब्ल्यू जवाब के रूप में ठीक है।
अमीबा am

हां, मैं समझता हूं कि इसे एक उत्तर के रूप में क्यों पोस्ट किया जाना था, और इसलिए इसे एक टिप्पणी में स्थानांतरित करने के लिए वोट नहीं दिया (जो उद्धरण के अंतिम भाग को काट देगा)। मैं सहमत हूं कि आदर्श विशेष मामलों में अप्राप्य नहीं है । मैं यह भी मानता हूं कि इसे सहन करना एक अच्छा आदर्श है। लेकिन प्रयोगों को डिजाइन करने के तरीके के बारे में एक गाइड के रूप में (जो, कुल मिलाकर, संसाधनों को आवंटित करने का एक अनुशासन है), यह एक भयानक गलती हो सकती है। (यह निश्चित रूप से बहस का मुद्दा है।) सुझाव है कि एक "अच्छे" प्रयोग को कभी सांख्यिकीय तरीकों की आवश्यकता नहीं होगी, हालांकि, एक जो कि सरसरी परीक्षा तक भी खड़ा नहीं होता है।
whuber

1
शायद पढ़ने का एक तरीका यह है कि प्रारंभिक महत्व परीक्षण के रूप में कहा गया है कि एक पदार्थ ने सुझाव दिया है कि एक निश्चित शारीरिक प्रतिक्रिया उत्तेजित करती है, अब आप अपनी जांच को खुराक-प्रतिक्रिया वक्र पर विभिन्न प्रकार के अवरोधकों के प्रभाव में प्रकाशित कर रहे हैं।
Scortchi
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.