सामान्य सांख्यिकीय पाप क्या हैं?


227

मैं मनोविज्ञान में एक स्नातक छात्र हूँ, और जैसा कि मैं आँकड़ों में अधिक से अधिक स्वतंत्र अध्ययन कर रहा हूं, मैं अपने औपचारिक प्रशिक्षण की अपर्याप्तता से आश्चर्यचकित हूं। दोनों व्यक्तिगत और दूसरे हाथ अनुभव से पता चलता है कि स्नातक और स्नातक प्रशिक्षण में सांख्यिकीय कठोरता की गंभीरता मनोविज्ञान के बजाय सर्वव्यापी है। जैसे, मैंने सोचा कि यह मेरे जैसे स्वतंत्र शिक्षार्थियों के लिए "सांख्यिकीय पापों" की एक सूची बनाने के लिए उपयोगी होगा, छात्रों को मानक अभ्यास के रूप में सिखाया जाने वाले सांख्यिकीय अभ्यासों को सारणीबद्ध करना जो वास्तव में या तो श्रेष्ठ (अधिक शक्तिशाली, या लचीले, या) द्वारा अभिभूत हैं। मजबूत, आदि) आधुनिक तरीकों या स्पष्ट रूप से अमान्य दिखाया गया है। यह स्वीकार करते हुए कि अन्य क्षेत्रों में भी इसी तरह की स्थिति का अनुभव हो सकता है, मैं एक समुदाय विकी का प्रस्ताव करता हूं जहां हम अनुशासनों में सांख्यिकीय पापों की एक सूची एकत्र कर सकते हैं।


5
मुझे पता है कि "पाप" संभवतः भड़काऊ है और यह कि सांख्यिकीय विश्लेषण के कुछ पहलू काले और सफेद नहीं हैं। मेरा इरादा उन मामलों को सुलझाना है जहां एक दिया-पढ़ाया जाने वाला अभ्यास बहुत स्पष्ट रूप से अनुचित है।
माइक लॉरेंस

5
यदि आप चाहें तो जीव विज्ञान / जीवन विज्ञान के छात्रों को भी मिश्रण में जोड़ सकते हैं;)
nico

1
शायद यह जीवन विज्ञान के पापों का प्रतिकार करता है? ... या कुछ और अधिक विशिष्ट ...
जॉन

1
@whuber कुछ अच्छे उत्तर थे, इसलिए मैंने उन दोनों को मिला दिया।

1
हाय @ अमांडा, क्या आप कुछ संकेत दे सकते हैं कि यहाँ क्या बात है? कोई भी व्यक्ति रिक-लुढ़का होने की संभावना को पसंद नहीं करता है।
n

जवाबों:


118

डेटा को देखने के लिए असफल (साजिश)।


+1 शाबाश! मैं हैरान हूँ यह अभी तक उल्लेख नहीं किया गया है।
whuber

1
बहुत, बहुत महत्वपूर्ण!
deps_stats

1
शायद सबसे आम एक।
कार्लोस सिनेली

115

पी-वैल्यू की अधिकांश व्याख्याएं पापपूर्ण हैं! पी-मूल्यों का पारंपरिक उपयोग बुरी तरह से दोषपूर्ण है; एक तथ्य यह है कि, मेरी राय में, परिकल्पना परीक्षणों और महत्व के परीक्षणों के शिक्षण के लिए मानक दृष्टिकोण पर सवाल उठाता है।

हॉलर और क्रूस ने पाया है कि सांख्यिकीय प्रशिक्षक लगभग उतने ही संभव हैं जितने छात्र पी-मूल्यों की गलत व्याख्या करते हैं। (परीक्षण को उनके पेपर में लें और देखें कि आप कैसे करते हैं।) स्टीव गुडमैन ने संभावना के पक्ष में पी -वेल्यू के पारंपरिक (गलत-) उपयोग को छोड़ने के लिए एक अच्छा मामला बनाया है। हबर्ड पेपर भी देखने लायक है।

हॉलर और क्रूस। महत्व की गलत व्याख्या: एक समस्या जो छात्र अपने शिक्षकों से साझा करते हैं । साइकोलॉजिकल रिसर्च के तरीके (2002) वॉल्यूम। 7 (1) पीपी 1-20 ( पीडीएफ )

हबर्ड और बायरी। शास्त्रीय सांख्यिकीय परीक्षण में एविडेंस (पी) के बनाम त्रुटियों (α) के उपायों पर भ्रम । द अमेरिकन स्टेटिस्टिशियन (2003) वॉल्यूम। 57 (3)

अच्छा आदमी। साक्ष्य-आधारित चिकित्सा आँकड़ों की ओर। 1: पी मूल्य परित्याग। एन इंटर्न मेड (1999) वॉल्यूम। 130 (12) पीपी 995-1004 ( पीडीएफ )

और देखें:

वागेनमेकर्स, ईजे। P मानों की व्यापक समस्याओं का एक व्यावहारिक समाधान। साइकोनोमिक बुलेटिन एंड रिव्यू, 14 (5), 779-804।

कुछ स्पष्ट कटौती के मामलों के लिए जहां एक पी-मूल्य की नाममात्र "सही" व्याख्या भी प्रयोगकर्ता द्वारा किए गए विकल्पों के कारण गलत बना दी गई है।

अद्यतन (2016) : 2016 में, अमेरिकी सांख्यिकीय एसोसिएशन ने पी-मूल्यों पर एक बयान जारी किया, यहां देखें । यह एक तरह से, मनोविज्ञान पत्रिका द्वारा लगभग एक साल पहले जारी "पी-वैल्यूज पर प्रतिबंध" की प्रतिक्रिया थी।


2
@Michael (+1) मैंने एब्सट्रैक्ट और अनगेटेड पीडीएफ के लिंक जोड़े। आशा है कि आप बुरा नहीं मानेंगे
chl

7
+1, लेकिन मैं कुछ महत्वपूर्ण टिप्पणियां करना चाहूंगा। उद्घाटन लाइन के बारे में, कोई भी यह कह सकता है कि "लगभग सभी" (माप सिद्धांत में) किसी भी अच्छी तरह से परिभाषित अवधारणा की व्याख्या गलत है, क्योंकि केवल एक ही सही है। दूसरा, जब आप "पारंपरिक उपयोग" और "मानक दृष्टिकोण" कहते हैं, तो आप क्या संदर्भित करते हैं? ये अस्पष्ट संदर्भ एक पुआल आदमी की तरह लगते हैं। वे उदाहरण के लिए, सांख्यिकी शिक्षा पर साहित्य में जो कुछ भी पा सकते हैं, उससे सहमत नहीं हैं।
whuber

4
@Whuber गुडमैन पेपर पर एक नज़र डालें। यह फार्माकोलॉजी के क्षेत्र में मेरे अनुभव के साथ बहुत अच्छी तरह से जोड़ता है। विधियों का कहना है कि "परिणाम जहां P <0.05 को सांख्यिकीय महत्वपूर्ण के रूप में लिया गया था" और फिर परिणाम p + 0.05 के लिए p <0.015 और ++ के लिए p <0.0001 के लिए + के साथ प्रस्तुत किए जाते हैं। यह कथन त्रुटि दर के नियंत्रण का अर्थ है ला नेमैन और पियर्सन, लेकिन पी के विभिन्न स्तरों का उपयोग फिशर के दृष्टिकोण का सुझाव देता है जहां पी मान शून्य परिकल्पना के खिलाफ सबूत की ताकत का सूचकांक है। जैसा कि गुडमैन बताते हैं, आप एक साथ त्रुटि दर को नियंत्रित नहीं कर सकते हैं और सबूतों की ताकत का आकलन कर सकते हैं।
माइकल ल्यू

8
@ मायकिल, उस तरह की रिपोर्टिंग की वैकल्पिक, अधिक उदार व्याख्याएं हैं। उदाहरण के लिए, लेखक इस बात से अवगत हो सकता है कि पाठक अपने स्वयं के महत्व की सीमा को लागू करना चाहते हैं और इसलिए उनकी मदद करने के लिए पी-वैल्यू को हरी झंडी दिखाते हैं। वैकल्पिक रूप से, लेखक संभावित बहु-तुलनात्मक समस्याओं से अवगत हो सकता है और एक बोनफेरोनी-जैसे समायोजन में विभिन्न स्तरों का उपयोग कर सकता है। शायद पी-वैल्यू के दुरुपयोग के दोष का कुछ हिस्सा पाठक के चरणों में रखा जाना चाहिए, न कि लेखक के।
whuber

4
@Whuber मैं पूरी तरह से सहमत हूं, लेकिन केवल यही कि आप जो सुझाव देते हैं वह कुछ छोटे मामलों में सच है ('पूरी तरह से प्रतिबंधित संस्करण')। कुछ पत्रिकाएँ हैं जो निर्दिष्ट करती हैं कि p मानों को सटीक मानों के बजाय एक, दो या तीन सितारा स्तरों पर रिपोर्ट किया जाना चाहिए, इसलिए वे पत्रिकाएँ परिणाम के लिए कुछ ज़िम्मेदारी साझा करती हैं। हालाँकि, दोनों कि गैर-मानी जाने वाली आवश्यकता और p मानों का स्पष्ट रूप से अनुभवहीन उपयोग, मेरी अलमारियों पर मौजूद कई परिचयात्मक सांख्यिकी ग्रंथों में त्रुटि दर और साक्ष्य के बीच के अंतर की स्पष्ट व्याख्या के अभाव का परिणाम हो सकता है।
माइकल लेव

73

सबसे खतरनाक जाल जिसका मैंने भविष्यवाणिय मॉडल पर काम करते समय किया था, एक परीक्षण डेटासेट को जल्दी से आरक्षित नहीं करना था ताकि इसे "अंतिम" प्रदर्शन मूल्यांकन के लिए समर्पित किया जा सके।

यदि आपके पास किसी भी तरह से परीक्षण डेटा का उपयोग करने का मौका है, तो मापदंडों को ट्वीटर करते समय, पूर्व का चयन करते हुए, सीखने के एल्गोरिथ्म को रोकने के मानदंड का चयन करते हुए ...

इस समस्या से बचने के लिए, नए डेटासेट पर अपना काम शुरू करने से पहले आपको अपना डेटा इस प्रकार विभाजित करना चाहिए:

  • विकास सेट
  • मूल्यांकन सेट

फिर अपने विकास सेट को "प्रशिक्षण विकास सेट" और "परीक्षण विकास सेट" के रूप में विभाजित करें जहां आप विभिन्न मापदंडों के साथ विभिन्न मॉडलों को प्रशिक्षित करने के लिए प्रशिक्षण विकास सेट का उपयोग करते हैं और परीक्षण विकास सेट पर प्रदर्शन के अनुसार सर्वश्रेष्ठ का चयन करते हैं। आप क्रॉस सत्यापन के साथ ग्रिड खोज भी कर सकते हैं लेकिन केवल विकास सेट पर। मूल्यांकन सेट का उपयोग कभी न करें जबकि मॉडल का चयन 100% नहीं किया गया है।

एक बार जब आप मॉडल के चयन और मापदंडों के साथ आश्वस्त हो जाते हैं, तो चयनित मॉडल के "वास्तविक" पूर्वानुमेय सटीकता का अनुमान लगाने के लिए निर्धारित मूल्यांकन पर 10 गुना क्रॉस-सत्यापन करें।

यदि आपका डेटा अस्थायी है, तो भी समय कोड पर विकास / मूल्यांकन विभाजन का चयन करना सबसे अच्छा है: "भविष्यवाणियां करना कठिन है - विशेष रूप से भविष्य के बारे में।"


5
मैं इस सिद्धांत से सहमत हूं लेकिन एक छोटे से डेटा सेट के मामले में (मेरे पास अक्सर केवल 20-40 मामले हैं) एक अलग मूल्यांकन सेट का उपयोग व्यावहारिक नहीं है। नेस्टेड क्रॉस-मान्यता इसके आस-पास हो सकती है लेकिन छोटे डेटा सेट पर निराशावादी अनुमान लगा सकती है
BGreene

11
सामान्य तौर पर यह विश्वसनीय होने के लिए डेटा विभाजन के लिए एक विशाल डेटासेट लेता है। यही कारण है कि बूटस्ट्रैप के साथ कठोर आंतरिक सत्यापन इतना आकर्षक है।
फ्रैंक हरेल

खासकर जब विकास सेट पिछले डेटा और मूल्यांकन सेट भविष्य डेटा है। क्यों नहीं, सभी मॉडल ट्यूनिंग के बाद, पूरे विकास सेट पर तय मापदंडों के साथ अंतिम मॉडल को प्रशिक्षित करें और इसके साथ पूरे मूल्यांकन सेट की भविष्यवाणी करें। एक वास्तविक परिदृश्य में, आप भविष्य के डेटा के माध्यम से मान्य नहीं कर सकते हैं जिस तरह से आप का वर्णन करते हैं, इसलिए आप सभी प्रासंगिक पिछले डेटा का उपयोग करेंगे।
डेविड एर्न्स्ट

64

पी-वैल्यू की रिपोर्टिंग जब आपने आंकड़ों (परिकल्पना परीक्षण) के बजाय डेटा-माइनिंग (परिकल्पना खोज) की।


2
क्या आप (या कोई) विस्तृत कर सकते हैं?
एंटोनी-सैक


पी-वैल्यू के बारे में कई परिकल्पना परीक्षण (बोनफेरोनी विधि के स्वाद या अधिक उन्नत सुधार के साथ) के लिए क्या सही है? मुझे लगता है कि यह डेटा खनन के संदर्भ में भी ठीक है?
एंटोनी-सैक

मैं सामान्य विचार को पसंद करता हूं, लेकिन यह एक परिकल्पना के साथ आंकड़ों की बराबरी करने के लिए एक विकृति है जब बाद वाला पूर्व का सबसेट होता है।
rolando2

46

परिकल्पनाओं का परीक्षण बनाम (उदाहरण के लिए गौसियन सेटिंग में)एच 1 : μ 0H0:μ=0H1:μ0

एक मॉडल में उस को सही ठहराने के लिए (अर्थात " अस्वीकृत नहीं है" और " सत्य है")।एच 0 एच 0 0μ=0H0H0

उस प्रकार के (बहुत खराब) तर्क का एक बहुत अच्छा उदाहरण है जब आप परीक्षण करते हैं कि क्या परीक्षण के पहले दो गॉसियों के संस्करण समान हैं (या नहीं) यदि उनके माध्य समान हैं या नहीं, तो समान विचरण की धारणा के साथ।

एक और उदाहरण तब होता है जब आप सामान्यता को सही ठहराने के लिए सामान्यता (बनाम गैर सामान्यता) का परीक्षण करते हैं। प्रत्येक सांख्यिकीविद् ने किया है कि जीवन है? यह baad है :) (और लोगों को गैर-गौसंसिटी की मजबूती की जांच करने के लिए धक्का देना चाहिए)


6
एक ही तर्क ("एच 1 की अनुपस्थिति के साक्ष्य के रूप में एच 1 में सबूतों की अनुपस्थिति") अनिवार्य रूप से सभी अच्छाई-से-फिट परीक्षणों को रेखांकित करता है। तर्क भी अक्सर फसलें जब लोग कहते हैं कि "परीक्षण गैर महत्वपूर्ण था, हम इसलिए निष्कर्ष निकाल सकते हैं कि कारक X का कोई प्रभाव नहीं है / चर Y का कोई प्रभाव नहीं है"। मुझे लगता है कि यदि परीक्षण की शक्ति के बारे में तर्क के साथ पाप कम गंभीर है (उदाहरण के लिए, एक निश्चित प्रासंगिक प्रभाव आकार दिए गए एक निश्चित शक्ति तक पहुंचने के लिए नमूना आकार का एक प्राथमिकताओं का अनुमान)।
caracal

आप बिजली के बारे में कोई concideration नहीं बनाते हैं, मैं claming कहेंगे जब यह अस्वीकार कर दिया है बहुत बहुत बुरा सत्य है, जबकि claming सच है, जबकि अस्वीकार कर दिया है बस थोड़ी गलत है :)। एच 1 1 एच 0H0H1H0
रॉबिन जिरार्ड

महान!! जी हाँ, यह मुझे पागल कर देता है ..
jpillow

3
मैं सांख्यिकीय रूप से साक्षर होने की कोशिश करता हूं और फिर भी समय-समय पर इसके लिए गिरता हूं। विकल्प क्या हैं? अपना मॉडल बदलें ताकि पुराना नल हो जाए ? केवल अन्य विकल्प मैं के बारे में सोच सकते हैं बिजली आपके पर्याप्त अध्ययन है कि रिक्त अस्वीकार करने के लिए एक विफलता है है व्यवहार में अशक्त की पुष्टि करने के लिए पर्याप्त करीब है। उदाहरण के लिए, यदि आप यह सुनिश्चित करना चाहते हैं कि आपकी कोशिकाओं में एक अभिकर्मक जोड़ने से उनमें से 2% से अधिक नहीं मारे जाएंगे, तो एक संतोषजनक झूठी नकारात्मक दर की शक्ति। H1
डॉकबकेट्स

@ एक दो तरफा परीक्षणों के साथ डॉकबैक्स तुल्यता परीक्षण शक्ति आधारित दृष्टिकोण की तुलना में अधिक कठोर है। लेकिन आपको एक न्यूनतम प्रासंगिक प्रभाव आकार निर्धारित करने की आवश्यकता है जिसके नीचे आप व्यावहारिक तुल्यता की बात कर सकते हैं।
डेविड अर्नेस्ट

46

कुछ गलतियाँ जो मुझे परेशान करती हैं:

  1. निष्पक्ष अनुमान लगाने वालों को हमेशा पक्षपाती अनुमानक से बेहतर माना जाता है।

  2. यह मानते हुए कि एक उच्च अर्थ है एक अच्छा मॉडल, निम्न का अर्थ है एक बुरा मॉडल।आर 2R2R2

  3. गलत तरीके से व्याख्या / सहसंबंध लगाना।

  4. मानक त्रुटि के बिना बिंदु अनुमान रिपोर्टिंग।

  5. अधिक मजबूत, बेहतर प्रदर्शन, गैर / अर्धवृत्ताकार विधियाँ उपलब्ध होने पर कुछ प्रकार के मल्टीवेरिएट नॉर्मलिटी (जैसे लीनियर डिस्क्रिमिनेन्ट एनालिसिस) मानने वाले तरीकों का उपयोग करना।

  6. एक भविष्यवक्ता और प्रतिक्रिया के बीच शक्ति के माप के रूप में पी-मान का उपयोग करना, बजाय इसके कि कुछ रिश्ते का कितना प्रमाण है ।


5
क्या आप इन्हें अलग-अलग विकल्पों में तोड़ेंगे?
रसेलपियरसी

41

निरंतर भविष्यवक्ता चर का द्वि-संकरण या तो "सरलीकृत" विश्लेषण या निरंतर भविष्यवक्ता के प्रभाव में गैर-रैखिकता की "समस्या" के लिए हल करना।


18
मुझे नहीं लगता कि यह वास्तव में एक "पाप" है क्योंकि प्राप्त परिणाम गलत नहीं हैं। हालांकि, यह बहुत सारी उपयोगी जानकारी को फेंक देता है इसलिए यह अच्छा अभ्यास नहीं है।
रोब हंडमैन

2
इन पंक्तियों के साथ, चरम समूहों का उपयोग प्रभाव के आकार का अनुमान लगाता है जबकि औसत या माध्य विभाजन के प्रभाव के आकार के आकार का उपयोग होता है।
रुसेलपिएर्स

2
अगर दो या अधिक विशिष्ट आबादी हो तो यह भी पाप नहीं है। मान लें कि आपके पास अलग-अलग वर्ग या उप-आबादी है, तो यह समझ में नहीं आ सकता है। एक बहुत ही तुच्छ उदाहरण: क्या मैं साइट / स्थान / शहर / देश या अक्षांश / लंबे के लिए संकेतक का उपयोग करूंगा?
आइटरेटर

3
+1 और यह एक गंभीर पाप बन जाता है जब वे डिचोटोमाइजेशन कटऑफ को चुनना शुरू करते हैं ताकि यह किसी प्रकार के अंतर का अनुकूलन करे जो तब परीक्षण किया जाता है।
एरिक

5
@ सूचक आपको वास्तविक कारणों से (दो या दो से अधिक श्रेणियों को) एकत्र करने के लिए शुरू होता है, जिसका कारण यह है कि किसी के पास यह मानने के लिए एक प्राथमिक सैद्धांतिक कारण है कि विचरण उन श्रेणियों में सार्थक रूप से संकलित है । उदाहरण के लिए, हम हर समय ऐसा करते हैं कि ट्रिलियन या इतनी कोशिकाओं के संग्रह में एक व्यक्ति शामिल होता है , या कि पृथ्वी पर 24 घंटे की एक सन्निहित अवधि को सार्थक रूप से एक इकाई के रूप में व्याख्या किया जाता है। लेकिन मनमाने ढंग से एकत्रीकरण केवल सूचना (जैसे सांख्यिकीय शक्ति) को "बाहर फेंक" नहीं करता है, बल्कि घटना के बीच संबंधों के बारे में (गंभीर) पूर्वाग्रह पैदा कर सकता है।
एलेक्सिस

41

वास्तव में इस सवाल का जवाब नहीं है, लेकिन इस विषय पर एक पूरी किताब है:

फिलिप आई। गुड, जेम्स विलियम हार्डिन (2003)। आंकड़ों में सामान्य त्रुटियां (और उनसे कैसे बचें)। विले। आईएसबीएन 9780471460688


6
+1 मैंने इस पुस्तक को पढ़ने के कुछ समय बाद ही सुनिश्चित कर लिया था। मुझे सांख्यिकीय गलतियों को करने के लिए बहुत सारे अवसर मिलते हैं, इसलिए मैं हमेशा आभारी हूं कि मैंने उन्हें बनाने से पहले उन्हें बताया !
whuber


41

अनुष्ठान सांख्यिकी।

यह "पाप" तब होता है जब आप अपनी उपयुक्तता की परवाह किए बिना जो कुछ भी पढ़ाया जाता है, उसे लागू करते हैं, क्योंकि यह है कि चीजें कैसे की जाती हैं। यह रटे द्वारा आंकड़े हैं, मशीन को आपके लिए अपने आंकड़े चुनने देने से एक स्तर ऊपर।

उदाहरण सांख्यिकी-स्तर के छात्रों के लिए अपने मामूली टी-टेस्ट और एनोवा टूलकिट में सब कुछ फिट करने की कोशिश कर रहे हैं, या किसी भी समय कोई भी व्यक्ति पाता है "ओह, मेरे पास स्पष्ट डेटा है, मुझे एक्स का उपयोग करना चाहिए।" डेटा, या पूछे जाने वाले प्रश्न पर विचार करें।

इस पाप पर भिन्नता में कोड का उपयोग करना शामिल है जिसे आप केवल उत्पादन के प्रकार को समझने के लिए नहीं समझते हैं, लेकिन "पाँचवाँ स्तंभ, नीचे 8 पंक्तियों के बारे में" या जो भी उत्तर आप खोज रहे हैं वह है।


6
दुर्भाग्य से, यदि आप सांख्यिकीय अनुमानों में रुचि नहीं रखते हैं, या समय और / या संसाधनों पर दुर्लभ हैं, तो अनुष्ठान बहुत आकर्षक लगता है ...
संभाव्यता

मेरे लिए एपिग्रैड का वर्णन किसी ऐसे व्यक्ति का है जो आक्षेप के बारे में असंगत रूप से परवाह करता है और प्रतिबिंब, खोज और कार्य-कारण के विचार जैसी चीजों की उपेक्षा करता है।
रोलैंडो 2

35

शायद मॉडल के चयन के बाद स्टेप वाइज रिग्रेशन और अन्य प्रकार के परीक्षण।

मौजूदा रिश्तों के पीछे कोई प्राथमिकता परिकल्पना होने के बिना मॉडलिंग के लिए स्वतंत्र चर का चयन करना अन्य गलतियों के साथ तार्किक पतन या सहज सहसंबंध पैदा कर सकता है।

उपयोगी संदर्भ (एक जैविक / जीवविज्ञान परिप्रेक्ष्य से):

  1. कोजक, एम।, और अज़ीवेडो, आर। (2011)। अनुक्रमिक पथ विश्लेषण मॉडल बनाने के लिए स्टेप वाइज चर चयन का उपयोग करने से समझ में आता है? फिजियोलॉजी प्लांटम, 141 (3), 197–200। डोई: 10.1111 / j.1399-3054.2010.01431.x

  2. व्हिंघम, एमजे, स्टीफंस, पी।, ब्रैडबरी, आरबी, और फ्रीकटन, आरपी (2006)। हम अभी भी पारिस्थितिकी और व्यवहार में स्टेप वाइज मॉडलिंग का उपयोग क्यों करते हैं? द जर्नल ऑफ़ एनिमल इकोलॉजी, 75 (5), 1182–9। डोई: 10.1111 / j.1365-2656.2006.01141.x

  3. फ्रैंक हैरेल, रिग्रेशन मॉडलिंग रणनीतियाँ , स्प्रिंगर 2001।


32

कुछ मैं सम्मेलन पत्रों में एक आश्चर्यजनक राशि देखता हूं और यहां तक ​​कि पत्रिकाएं कई तुलनाएं कर रही हैं (उदाहरण के लिए द्विभाजित सहसंबंध) और फिर सभी p <.05s को "महत्वपूर्ण" (पल के लिए सही या गलत होने की अनदेखी) के रूप में रिपोर्ट करना।

मुझे पता है कि मनोविज्ञान स्नातकों के बारे में आपका क्या मतलब है, साथ ही- मैंने मनोविज्ञान में पीएचडी पूरी की है और मैं अभी भी केवल वास्तव में सीख रहा हूं। यह काफी बुरा है, मुझे लगता है कि मनोविज्ञान को मात्रात्मक डेटा विश्लेषण को अधिक गंभीरता से लेने की आवश्यकता है यदि हम इसका उपयोग करने जा रहे हैं (जो, स्पष्ट रूप से, हमें चाहिए)


9
यह विशेष रूप से महत्वपूर्ण है। मुझे एक अध्ययन पढ़ना याद है कि क्या रमजान उन शिशुओं के लिए बुरा था जिनकी माताएं उपवास कर रही थीं। यह प्रशंसनीय (कम भोजन, जन्म के समय कम वजन) लग रहा था, लेकिन फिर मैंने परिशिष्ट को देखा। हजारों परिकल्पनाएं, और उनमें से कुछ प्रतिशत "महत्वपूर्ण" श्रेणी में थे। आपको अजीब "निष्कर्ष" मिलता है जैसे "यह बच्चे के लिए बुरा है अगर रमजान 2, 4 या 6 वां महीना है"।
कार्लोस

29

खोजपूर्ण होने के नाते लेकिन पुष्ट होने का ढोंग कर रहा है। यह तब हो सकता है जब कोई विश्लेषण रणनीति (यानी मॉडल फिटिंग, परिवर्तनशील चयन और इतने पर) को संचालित डेटा संचालित या परिणाम संचालित करता है, लेकिन इसे खुले तौर पर नहीं बताता है और फिर केवल "सबसे अच्छा" (यानी सबसे छोटे पी-मूल्यों के साथ) रिपोर्टिंग करता है जैसे कि परिणाम यह केवल विश्लेषण था। यह उस बिंदु से भी संबंधित है अगर क्रिस बीले ने कई परीक्षण किए और वैज्ञानिक रिपोर्ट में उच्च झूठी सकारात्मक दर का परिणाम दिया।


26

वह जो मैं अक्सर देखता हूं और हमेशा अपने गियर्स को पीसता हूं, यह धारणा है कि एक समूह में सांख्यिकीय रूप से महत्वपूर्ण मुख्य प्रभाव और दूसरे समूह में गैर-सांख्यिकीय रूप से महत्वपूर्ण मुख्य प्रभाव एक महत्वपूर्ण प्रभाव x समूह इंटरैक्शन का अर्थ है।


24

विशेष रूप से महामारी विज्ञान और सार्वजनिक स्वास्थ्य में - लघुगणक पैमाने के बजाय अंकगणित का उपयोग करना जब एसोसिएशन के सापेक्ष उपायों के ग्राफ की रिपोर्टिंग (खतरा अनुपात, बाधाओं अनुपात या जोखिम अनुपात)।

अधिक जानकारी यहाँ


5
सभी xkcd.com/833
radek

23

सहसंबंध का अर्थ कार्य-कारण है, जो अशक्त परिकल्पना को स्वीकार करने में उतना बुरा नहीं है।


लेकिन कभी-कभी ... कभी-कभी कार्य-कारण की संभावित दिशाओं में अत्यधिक असमानता होती है। मैं निश्चित रूप से यह नहीं सोचने जा रहा हूं कि उम्र और ऊंचाई के बीच एक संबंध ऊंचाई के कारण हो सकता है ... या कुछ अंतराल चर भी। इसके अलावा, मुझे लगता है कि यह एक है कि व्यवहार विज्ञान प्रशिक्षण आमतौर पर काफी संवेदनशील है।
जॉन

वास्तव में, A and B are correlatedआमतौर पर केवल कुछ चीज़ों को देखते हुए, A causes Bलेकिन नहीं B causes A... (और Cकिन कारणों Aऔर कारणों के बारे में भूल जाते हैं B)
आंद्रे होल्ज़नर

12
गूगल $ 65B एक वर्ष में फर्क के बारे में परवाह नहीं करता है ...
नील McGuigan

5
मैं आपकी बातों से सहमत हूं और वे सभी मान्य हैं। लेकिन क्या Google के लाभ का अर्थ है: सहसंबंध => कारण?
सनकूलू डिस

3
Google वह सभी धन बनाता है जो कार्य-कारण की परवाह नहीं करता है। वास्तव में, यह क्यों होगा? भविष्यवाणी है बात ...
संयुक्तापति

23

एनोवा का उपयोग करते हुए दर डेटा (सटीकता, आदि) का विश्लेषण, जिससे यह अनुमान लगाया जाता है कि दर डेटा में गॉसियन वितरित त्रुटि है जब यह वास्तव में द्विपदीय रूप से वितरित किया जाता है। डिक्सन (2008) इस पाप के परिणामों की चर्चा और अधिक उपयुक्त विश्लेषण दृष्टिकोण की खोज प्रदान करता है।


4
यह विश्लेषण की शक्ति को कितना कम करता है? यह किन परिस्थितियों में सबसे अधिक समस्याग्रस्त है? कई मामलों में एनोवा की धारणाओं से विचलन एक महत्वपूर्ण सीमा तक परिणामों को काफी हद तक प्रभावित नहीं करते हैं।
माइकल ल्यू

एनोवा प्रक्रिया का विकल्प क्या है?
हेनरिक

@ मिचेल ल्यू और हेनरिक: मैंने डिक्सन (2008) के लिंक को शामिल करने के लिए इस प्रविष्टि को अपडेट किया
माइक लॉरेंस

2
लेकिन संक्षेप में, यह सबसे अधिक समस्याग्रस्त है जब मनाया गया संभावना कम या अधिक होता है क्योंकि मानों की सीमा संकुचित होती है और गौसियन मान्यताओं को पूरा करने में असमर्थ होती है।
रसेलपियरिएस

यह केवल द्विपद के लिए सामान्य सन्निकटन जितना ही खराब है - ठीक होना चाहिए, बशर्ते कि प्रत्येक मामले को दर की गणना में उपयोग किए जाने वाले भाजक द्वारा भारित किया जाए। उम्मीद करेंगे कि यह 10% से कम और 90% से ऊपर की दरों के लिए खराब प्रदर्शन करे।
संभावना 24

18

एक मौजूदा लोकप्रिय व्यक्ति कच्चे प्रदर्शन मूल्यों के आसपास 95% विश्वास अंतराल की साजिश रच रहा है जब वे केवल एक प्रभाव के विचरण से संबंधित होते हैं। उदाहरण के लिए, विश्वास अंतराल के साथ दोहराया उपायों के डिजाइन में प्रतिक्रिया समय का एक भूखंड जहां त्रुटि शब्द ANOVA के दोहराया उपायों के MSE से प्राप्त होता है। ये विश्वास अंतराल कुछ भी समझदारी का प्रतिनिधित्व नहीं करते हैं। वे निश्चित रूप से पूर्ण प्रतिक्रिया समय के बारे में कुछ भी प्रतिनिधित्व नहीं करते हैं। आप प्रभाव के चारों ओर विश्वास अंतराल उत्पन्न करने के लिए त्रुटि शब्द का उपयोग कर सकते हैं लेकिन ऐसा शायद ही कभी किया जाता है।


क्या एक मानक लेख है जिसे समीक्षकों को इस सर्व-सामान्य अभ्यास की मांग करने से रोकने के लिए उद्धृत किया जा सकता है?
russellpierce

एकमात्र आलोचक मैं जानता हूं कि ब्लोइन एंड रिओपेल (2005) है, लेकिन वे इस मामले के दिल में नहीं आते हैं। मैं आम तौर पर उन्हें नहीं दिखाने पर जोर देता हूं, लेकिन मैसन एंड लॉफ्टस (2003, 2003 के फिगर 4, राइट पैनल ...) के इफेक्ट ग्राफ में कुछ सही करते हुए ... अगर उन्हें बाईं ओर से हटा दिया जाता तो आप इसे सही करते। )।
जॉन

बस स्पष्ट होने के लिए, उन CI के साथ समस्या यह है कि वे विशुद्ध रूप से शर्तों के बीच अंतर के संबंध में हीन कारणों से उपयोग किए जाते हैं और इसलिए PLSD से भी बदतर हैं ... वास्तव में मैं उन्हें पसंद करता हूं। कम से कम वे ईमानदार हैं।
जॉन

17

जब मैं माइकल लेव के बारे में बहुत कुछ कह सकता हूं, संभावना अनुपात के पक्ष में पी-मूल्यों को छोड़ना अभी भी एक अधिक सामान्य समस्या है - प्रभाव के आकार पर संभाव्य परिणामों की अधिकता, जो परिणामी अर्थ देने के लिए आवश्यक हैं। इस प्रकार की त्रुटि सभी आकारों और आकारों में आती है और मुझे यह सबसे गंभीर सांख्यिकीय गलती लगती है। जे। कोहेन और एम। ओक्स और अन्य लोगों पर आकर्षित, मैंने http://integrativestatistics.com/insidious.htm पर इस पर एक टुकड़ा लिखा है ।


3
मैं वास्तव में स्पष्ट नहीं हूं कि कैसे एक संभावना अनुपात (एलआर) वह सब कुछ हासिल नहीं करता है जो एक प्रभाव आकार प्राप्त करता है, जबकि एक आसानी से व्याख्यात्मक पैमाने पर भी काम करता है (डेटा में जेड के लिए वाई की तुलना में एक्स का अधिक प्रमाण है)। एक प्रभाव आकार आमतौर पर अस्पष्टीकृत परिवर्तनशीलता के लिए समझाया गया अनुपात का कुछ रूप है, और (नेस्टेड मामले में) LR एक मॉडल के बीच अस्पष्टीकृत परिवर्तनशीलता का अनुपात है जिसका एक प्रभाव होता है और एक ऐसा नहीं होता है। कम से कम प्रभाव आकार और एलआर के बीच एक मजबूत सहसंबंध नहीं होना चाहिए, और यदि हां, तो संभावना अनुपात पैमाने पर जाकर क्या खो जाता है?
माइक लॉरेंस

माइक - आपने मुझे दिलचस्पी ली है, लेकिन क्या आपके अंक समूहों के बीच अंतर के प्रभाव के रूप में सरल रूप में प्रभावी हैं? इनकी व्याख्या आसानी से एक झूठ बोलने वाले व्यक्ति द्वारा की जा सकती है और इसे विश्वास अंतराल भी सौंपा जा सकता है।
रोलैंडो 2

आह, इसलिए प्रभाव के आकार से, आपका मतलब पूर्ण प्रभाव आकार से है, एक ऐसा मूल्य जो स्वयं के लिए अर्थहीन है, लेकिन सापेक्ष प्रभाव के आकार में परिवर्तन द्वारा सार्थक बनाया जा सकता है (जैसा कि मैंने उल्लेख किया है, परिवर्तनशीलता के कुछ माप से विभाजित करके), या कंप्यूटिंग द्वारा पूर्ण प्रभाव आकार के लिए एक आत्मविश्वास अंतराल। उपरोक्त मेरा तर्क LRs बनाम सापेक्ष प्रभाव आकारों के गुणों पर लागू होता है। उन मामलों में कंप्यूटिंग प्रभाव सीआई की उपयोगिता हो सकती है जहां प्रभाव का वास्तविक मूल्य ब्याज (उदाहरण के लिए भविष्यवाणी) है, लेकिन मैं अभी भी एलआर द्वारा प्रभावों के लिए सबूत के बारे में बात करने के लिए अधिक सहज पैमाने के रूप में खड़ा हूं।
माइक लॉरेंस

मुझे लगता है कि LRs बनाम CI का उपयोग संभवतः संदर्भ के अनुसार अलग-अलग होगा, जो कि निम्नानुसार उपयोगी रूप से संक्षेप में प्रस्तुत किया जा सकता है: विज्ञान के अधिक खोजपूर्ण चरण, जहां सिद्धांत मोटे तौर पर अस्तित्व की घटना / अनुपस्थिति की विशेषता है, साक्ष्य की मात्रा निर्धारित करने के लिए LRs पसंद कर सकते हैं। दूसरी ओर, CI को विज्ञान के अधिक उन्नत चरणों में पसंद किया जा सकता है, जहां सिद्धांतों को अपेक्षित प्रभावों की श्रेणियों सहित बारीक भविष्यवाणी की अनुमति देने के लिए पर्याप्त रूप से परिष्कृत किया जाता है, या इसके विपरीत, जब प्रभाव परिमाण के विभिन्न रेंज विभिन्न सिद्धांतों का समर्थन करते हैं। अंत में, किसी भी मॉडल से उत्पन्न भविष्यवाणियों को CI की आवश्यकता होती है।
माइक लॉरेंस

0|β|=1|β|>1|β|1β=0β0

15

इस धारणा का परीक्षण करने में विफल है कि त्रुटि सामान्य रूप से वितरित है और उपचार के बीच निरंतर विचरण है। इन मान्यताओं का हमेशा परीक्षण नहीं किया जाता है, इस प्रकार कम से कम वर्ग मॉडल फिटिंग का उपयोग अक्सर किया जाता है जब यह वास्तव में अनुचित होता है।


11
जब डेटा गैर-सामान्य या विषमकोणीय हो तो कम से कम वर्गों के आकलन के बारे में क्या अनुचित है? यह पूरी तरह से कुशल नहीं है, लेकिन यह अभी भी निष्पक्ष और सुसंगत है।
रोब हंडमैन

3
यदि डेटा विषमलैंगिक हैं, तो आप नमूना भविष्यवाणियों से बहुत ही मासूमियत के साथ समाप्त हो सकते हैं क्योंकि प्रतिगमन मॉडल उच्च विचरण वाले क्षेत्रों में नमूनों पर त्रुटि को कम करने के लिए बहुत प्रयास करेगा और कम विचरण के क्षेत्रों के नमूनों पर पर्याप्त कठोर नहीं होगा। इसका मतलब है कि आप एक बहुत बुरी तरह से पक्षपाती मॉडल के साथ समाप्त हो सकते हैं। इसका यह भी अर्थ है कि भविष्यवाणियों पर त्रुटि बार गलत होंगे।
डिक्रान मार्सुपियल

6
नहीं, यह निष्पक्ष है, लेकिन यदि आप बताए गए कारणों के लिए अधिक कुशल विधि का उपयोग करते हैं तो विचरण इससे बड़ा है। हां, भविष्यवाणी अंतराल गलत हैं।
रॉब हैन्डमैन

4
हां (मैं मॉडल के व्यवस्थित रूप से एक बोलचाल की भाषा में पक्षपाती का उपयोग कर रहा था इसका मतलब है कि मॉडल व्यवस्थित रूप से फ़ीचर स्पेस के उच्च-विचरण क्षेत्रों में टिप्पणियों के प्रति पक्षपाती था - मेया पुलपा!) - यह कहना अधिक सटीक होगा कि उच्च विचरण का मतलब है! खराब डेटासेट का उपयोग करके खराब मॉडल प्राप्त करने की संभावना बढ़ जाती है। जो आपके प्रश्न का उचित उत्तर लगता है। मैं वास्तव में निष्पक्षता को इतने आराम से नहीं देखता हूं - यह महत्वपूर्ण है कि मॉडल को वास्तव में मेरे पास मौजूद डेटा पर अच्छी भविष्यवाणी देनी चाहिए और अक्सर विचरण अधिक महत्वपूर्ण होता है।
डिक्रान मार्सुपियल

14

अंडरग्रेजुएट में मेरा इंट्रो साइकोमेट्रिक्स कोर्स कम से कम दो हफ़्ते बिताना सिखाता था कि स्टेप वाइज रिग्रेशन कैसे किया जाता है। क्या कोई ऐसी स्थिति है जहां सौतेलापन प्रतिगमन एक अच्छा विचार है?


6
"अच्छा विचार" स्थिति पर निर्भर करता है। जब आप भविष्यवाणी को अधिकतम करना चाहते हैं तो यह एक भयानक विचार नहीं है - हालांकि यह अधिक फिटिंग का कारण बन सकता है। कुछ दुर्लभ मामले हैं जहां यह अपरिहार्य है - जहां मॉडल चयन को निर्देशित करने के लिए कोई सिद्धांत नहीं है। मैं स्टेप वाइज रिग्रेशन को "पाप" के रूप में नहीं गिनाऊंगा, लेकिन इसका उपयोग जब सिद्धांत मॉडल के चयन के लिए पर्याप्त होता है।
रसेलपिएरेस

20
शायद पाप स्टेप वाइज रिग्रेशन के माध्यम से प्राप्त मॉडल पर सांख्यिकीय परीक्षण कर रहा है।
रोब हंडमैन

3
यदि आप क्रॉस-वैलिडेशन का उपयोग करते हैं, तो यह ठीक नहीं है और अतिरिक्त एक्सट्रपलेशन नहीं करें। पी-मूल्यों को प्रकाशित न करें, क्योंकि वे अर्थहीन हैं।
नील मैकगिगन

मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं, जिसमें स्टेप वाइज रिग्रेशन का इस्तेमाल किया गया है। इसका कारण यह है कि मेरे पास डी >> एन है, जहां डी आयामीता है और एन नमूना आकार है (इस प्रकार सभी चर के साथ एक मॉडल का उपयोग करके शासन कर रहा है), सुविधाओं के सबसेट एक दूसरे के साथ सहसंबद्ध हैं, मैं एक सांख्यिकीय रूप से राजसी तरीका चाहता हूं शायद 2-3 "सर्वश्रेष्ठ" सुविधाओं का चयन करना, और मैं पी-मूल्यों की रिपोर्ट करने का इरादा नहीं करता, कम से कम कुछ प्रकार के रूढ़िवादी सुधार के बिना।
dsimcha

12

मेरे पुराने आँकड़े प्रो में आउटलेर से निपटने के लिए "अंगूठे का नियम" था: यदि आप अपने स्कैल्पलॉट पर एक बाहर की ओर देखते हैं, तो इसे अपने अंगूठे के साथ कवर करें :)


यह Winsorization के समान है जो बहुत भयानक नहीं है।
अरी बी। फ्रीडमैन

12

यह एक पॉप-स्टैटस के उत्तर की तुलना में अधिक हो सकता है जो आप खोज रहे हैं, लेकिन:

जब डेटा अत्यधिक तिरछा होता है, तो स्थान के एक संकेतक के रूप में माध्य का उपयोग करना

यह आवश्यक रूप से एक समस्या नहीं है, अगर आपको और आपके दर्शकों को पता है कि आप किस बारे में बात कर रहे हैं, लेकिन यह आमतौर पर ऐसा नहीं होता है, और मंझला अक्सर एक बेहतर विचार दे सकता है कि क्या हो रहा है।

मेरा पसंदीदा उदाहरण औसत मजदूरी है, जिसे आमतौर पर "औसत मजदूरी" के रूप में रिपोर्ट किया जाता है। किसी देश में आय / धन असमानता के आधार पर, यह औसत दर्जे की मजदूरी से काफी अलग हो सकता है, जो वास्तविक जीवन में लोगों के लिए बहुत बेहतर संकेतक देता है। उदाहरण के लिए, ऑस्ट्रेलिया में, जहां हमारे पास अपेक्षाकृत कम असमानता है, मध्य माध्य की तुलना में 10-15% कम है । अमेरिका में अंतर बहुत अधिक है , मध्य माध्य 70% से कम है, और अंतर बढ़ रहा है।

"औसत" (माध्य) पर रिपोर्ट करने से एक गुलाब की तस्वीर में मजदूरी के परिणाम की तुलना में वारंट किया जाता है, और बड़ी संख्या में लोगों को यह गलत धारणा भी दे सकता है कि वे "सामान्य" लोगों के रूप में ज्यादा कमाई नहीं कर रहे हैं।


इस बारे में एक अर्ध-संबंधित चर्चा है क्योंकि यह यहां प्रवृत्ति विश्लेषण पर लागू होता है: tamino.wordpress.com/2012/03/29/…
n

2
यह केवल तिरछापन से संबंधित नहीं है, बल्कि एक सामान्य समस्या है कि फैलाव पर विचार किए बिना मध्य प्रवृत्ति का मतलब या कोई अन्य उपाय पर्याप्त नहीं है। उदाहरण के लिए, यदि दो समूहों के मध्यक समान थे, लेकिन अंतर चतुर्थक सीमा एक जनसंख्या के लिए 100 गुना बड़ी थी। बस मंझले को देखकर, आप कहेंगे कि वे "समान जनसंख्या वितरण" हैं, जब वास्तव में वे बहुत अलग होंगे। समस्याओं का निर्माण करने वाले कई तरीकों का उल्लेख नहीं करना ...
संभावना

लेकिन, कुछ प्रयोजनों के लिए इसका मतलब है प्रासंगिक: मजदूरी एक है व्यापक , चर जिसका अर्थ है कि मजदूरी के रकम अर्थपूर्ण हैं। उन सवालों के लिए जहां कुछ (उप) समूह की कुल मजदूरी आय प्रासंगिक है, साधन सही चीज हैं: कुल को माध्य से प्राप्त किया जा सकता है, न कि माध्य से।
kjetil b halvorsen

@kjetilbhalvorsen: क्यों न केवल कुल का उपयोग करें?
n

n

10

कि पी-वैल्यू यह संभावना है कि अशक्त परिकल्पना सत्य है और (1-पी) यह संभावना है कि वैकल्पिक परिकल्पना सत्य है, इसमें से शून्य परिकल्पना को अस्वीकार करने में विफल होने का अर्थ है वैकल्पिक परिकल्पना झूठी है आदि।


1
1

दिलचस्प है, क्या आप मुझे इसके बारे में पढ़ने के लिए एक संदर्भ दे सकते हैं?
डिक्रान मार्सुपियल

2
(यहां आप जाते हैं) [ ece.uvic.ca/~bctill/papers/mocap/Aitkin_1997.pdf] व्यक्तिगत रूप से, जबकि मुझे यह दिलचस्प लगता है, मैं इस सवाल से जूझता हूं कि संभावना अनुपात के पीछे वितरण के कारण की मात्रा कितनी है ब्याज।
probabilityislogic

10

@Dirkan के समान नस में - शून्य परिकल्पना के सत्य होने के साक्ष्य के एक औपचारिक उपाय के रूप में पी-वैल्यू का उपयोग। इसमें कुछ अच्छी अनुमानी और सहज ज्ञान युक्त अच्छी विशेषताएं हैं, लेकिन अनिवार्य रूप से साक्ष्य का एक अधूरा माप है क्योंकि यह वैकल्पिक परिकल्पना का कोई संदर्भ नहीं देता है। हालांकि डेटा अशक्त (एक छोटे पी-मूल्य के लिए अग्रणी) के तहत संभावना नहीं है , वैकल्पिक हाइपरसिस के तहत डेटा और भी अधिक संभावना नहीं हो सकता है।


मैं जवाब नहीं दे रहा हूं क्योंकि मैं एक सोच की परेशानी में नहीं जाना चाहता हूं और उस मामले के लिए सभी लोगों के माध्यम से जा रहा हूं जो पहले से ही सुनिश्चित करने के लिए कि मैं एक को दोहराता नहीं हूं! लेकिन मुझे लगता है कि मैं मददगार हो सकता हूं। गुड एंड हार्डिन की एक पुस्तक है, जिसे "सांख्यिकी में सामान्य त्रुटियां और उनसे कैसे बचा जाए।" आप वहां बहुत सारे महान उदाहरण पा सकते हैं। यह एक लोकप्रिय किताब है जो पहले से ही अपने चौथे संस्करण में जा रही है।
माइकल चेरिक

साथ ही ऑल्टमैन की पुस्तक चैपमैन एंड हॉल / सीआरसी "मेडिकल रिसर्च में प्रैक्टिकल स्टेटिस्टिक्स" में चिकित्सा साहित्य पर एक अध्याय है जहां कई सांख्यिकीय पापों का खुलासा हुआ है जो प्रकाशित पत्रों में हुआ है।
माइकल चेरिक

9

सापेक्ष आवृत्तियों को दर्शाने के लिए पाई चार्ट का उपयोग करना। अधिक यहाँ


2
साइट पर कुछ तर्क शामिल करना अच्छा रहेगा।
naught101

9

"पूर्ण सत्य" को मापने के लिए परिकल्पना परीक्षण में आँकड़ों / संभाव्यता का उपयोग करना। सांख्यिकी केवल ऐसा नहीं कर सकती है, वे केवल वैकल्पिक विकल्पों के बीच निर्णय लेने में उपयोग कर सकते हैं , जिसे सांख्यिकीय प्रतिमान "बाहर" से निर्दिष्ट किया जाना चाहिए। "आंकड़ों से अशक्त परिकल्पना सही साबित होती है" जैसे कथन गलत हैं; आँकड़े केवल आपको बता सकते हैं "वैकल्पिक परिकल्पना की तुलना में अशक्त परिकल्पना डेटा की पक्षधर है"। यदि आप यह मानते हैं कि या तो शून्य परिकल्पना या विकल्प सही होना चाहिए, तो आप कह सकते हैं कि "शून्य सिद्ध सच है", लेकिन यह आपकी धारणा का केवल एक तुच्छ परिणाम है, डेटा द्वारा प्रदर्शित कुछ भी नहीं।


9

α=0.05

और इसी तरह (या लगभग वैसा ही) @ ओगरेल का जवाब , एक ग्रिड खोज करना और केवल सर्वोत्तम परिणाम की रिपोर्ट करना।


मुझे लगता है कि आप एक अलग कॉमिक से जुड़ना चाहते हैं, हालांकि यह एक अमर है।
rolando2

संभवतः, अगर मुझे अच्छी तरह से याद है कि मेरे मन में क्या था: xkcd.com/882
एंड्रयू

8

(थोड़ी किस्मत के साथ यह विवादास्पद होगा।)

वैज्ञानिक प्रयोगों के सांख्यिकीय विश्लेषण के लिए नेमन-पियर्सन दृष्टिकोण का उपयोग करना। या, बदतर, नेमन-पीयरसन और फिशर के एक बीमार परिभाषित हाइब्रिड का उपयोग करके।


अज्ञानी होने के लिए खेद है, लेकिन वैज्ञानिक प्रयोगों के विश्लेषण (परिणाम) के विश्लेषण के लिए नेमन-पियर्सन निर्माण में क्या गलत है?
आंद्रे होल्ज़नर

@ और मुझे लगता है कि यह टिप्पणी इस धागे में कहीं और @Michael Lew द्वारा पेश किए गए एक अन्य से संबंधित हो सकती है ( आंकड़े ।stackexchange.com/questions/4551/… )।
whuber

8

अनुरोध करना, और शायद फ़्लो चार्ट प्राप्त करना : वह ग्राफ़िकल चीज़ जहाँ आप कहते हैं कि आपके वैरिएबल का स्तर क्या है और आप किस प्रकार के संबंध की तलाश कर रहे हैं, और आप ब्रैंड नेम टेस्ट या ब्रांड नेम स्टेटिस्टिक प्राप्त करने के लिए नीचे दिए गए ऐरो का अनुसरण करते हैं। । कभी-कभी रहस्यमय 'पैरामीट्रिक' और 'गैर-पैरामीट्रिक' रास्तों के साथ पेश किया जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.