दूसरे के परिणाम के आधार पर सांख्यिकीय परीक्षण चुनना (जैसे सामान्यता)


13

तो मैंने सुना है कि यह कहा गया है कि एक सांख्यिकीय परीक्षण को दूसरे के परिणाम के आधार पर चुनना एक अच्छा विचार नहीं है। हालांकि यह मुझे अजीब लगता है। उदाहरण के लिए, लोग अक्सर एक गैर पैरामीट्रिक परीक्षण का उपयोग करना चुनते हैं जब कुछ अन्य परीक्षण बताते हैं कि अवशिष्ट सामान्य रूप से वितरित नहीं किए गए हैं। यह दृष्टिकोण बहुत व्यापक रूप से स्वीकृत लगता है लेकिन इस पैराग्राफ में पहले वाक्य से सहमत नहीं लगता है। मैं इस मुद्दे पर स्पष्टीकरण प्राप्त करने की उम्मीद कर रहा था।


3
सिर्फ इसलिए कि अवशेष गौसियन नहीं हैं, इसका मतलब यह नहीं है कि आपको गैर-पैरामीट्रिक परीक्षणों की आवश्यकता है। आप आमतौर पर डेटा की प्रकृति से डेटा का उपयोग करने के लिए मॉडल (हां मॉडल, टेस्ट नहीं) का प्रकार (गणना, 0 1 डेटा, निरंतर, मतलब-भिन्नता संबंध, रैखिक या गैर-रैखिक संबंध, आदि) और तदनुसार फिट मॉडल का उपयोग कर सकते हैं। पहले से तय आंकड़ों की विशेषताओं को पूरा करने के लिए परिकल्पना का परीक्षण किया जाना था। एक बार जब आपको लगता है फिट फिट मॉडल की मान्यताओं को पूरा करता है तो आप पी-मूल्य और अन्य आँकड़ों का मूल्यांकन कर सकते हैं,
मोनिका को बहाल करें - जी सिम्पसन

जवाबों:


14

यह देखते हुए कि इस चरम या अधिक चरम डेटा का अवलोकन करने की संभावना है यदि सच है, तो की व्याख्या क्या है जहां एक प्रक्रिया के माध्यम से वहां पहुंचा है जहां परीक्षण के चयन में एक आकस्मिक निर्णय किया गया था जो उत्पादन किया गया था वह ? उत्तर अनजाना है (या कम से कम बहुत अनजाना)। परीक्षण चलाने का निर्णय लेने या किसी अन्य संभाव्य प्रक्रिया के आधार पर आपने अपने परिणाम की व्याख्या को और भी जटिल बना दिया है। एच 0 पी पी पी पी पीpH0ppppमूल्यों की अधिकतम व्याख्या तब की जाती है जब नमूना आकार और विश्लेषण योजना पूरी तरह से अग्रिम में चुनी गई थी। अन्य स्थितियों में, व्याख्याएं कठिन हो जाती हैं, यही कारण है कि यह एक अच्छा विचार नहीं है। यह कहा जा रहा है, यह एक व्यापक रूप से स्वीकार किया गया अभ्यास है ... आखिरकार, एक परीक्षण चलाने के लिए भी परेशान क्यों करें यदि आपको पता चले कि आपने जिस परीक्षण को चलाने की योजना बनाई थी वह अमान्य था? उस प्रश्न का उत्तर बहुत कम निश्चित है। यह सब सरल तथ्य पर उबलता है कि अशक्त परिकल्पना महत्व परीक्षण ( के प्राथमिक उपयोग के मामले ) में कुछ समस्याएं हैं जो सर्माउंट करना मुश्किल हैं।p


मैं संभवतः Google पर इस घटना पर चर्चा करने वाले किसी भी लेख को खोजने में असमर्थ था, क्योंकि मैंने गलत खोज शब्दों का उपयोग किया था। क्या कोई मुझे एक लेख की दिशा में इंगित करने में सक्षम होगा जो परीक्षणों के आधार पर परीक्षणों की समस्या पर चर्चा करता है?
रोब हॉल

1
@ रोबॉल: यह "काल्पनिक आंकड़ों के लिए काल्पनिक मुद्दों का महत्व" का एक विशिष्ट उदाहरण है। सी एफ वागेनमेकर्स, 2007, पी। 784. वागेनमेकर्स विशेष रूप से एपी कॉलम में परिवर्तन के मुद्दे पर कहते हैं "एपी वैल्यू की गणना करने के लिए, आपको यह जानना होगा कि आपने क्या किया होगा डेटा अलग तरीके से निकला था ... इसमें वह भी शामिल है जो अगर डेटा होता तो आप क्या करते?" स्पष्ट रूप से गैर-सामान्य रूप से वितरित किया गया था ..., पी मूल्यों की गणना केवल तब की जा सकती है जब नमूना योजना पूरी तरह से ज्ञात हो और अग्रिम में निर्दिष्ट हो "।
रसैलपिएर्स

8

उदाहरण के लिए, लोग अक्सर एक गैर पैरामीट्रिक परीक्षण का उपयोग करना चुनते हैं जब कुछ अन्य परीक्षण बताते हैं कि अवशिष्ट सामान्य रूप से वितरित नहीं किए गए हैं। यह दृष्टिकोण बहुत व्यापक रूप से स्वीकृत लगता है लेकिन इस पैराग्राफ में पहले वाक्य से सहमत नहीं लगता है। मैं इस मुद्दे पर स्पष्टीकरण प्राप्त करने की उम्मीद कर रहा था।

हां, बहुत से लोग इस तरह का काम करते हैं, और अपने दूसरे परीक्षण को एक में बदल देते हैं जो विषमता से निपट सकते हैं जब वे विचरण की समानता को अस्वीकार करते हैं, और इसी तरह।

सिर्फ इसलिए कि कुछ सामान्य है, इसका मतलब यह नहीं है कि यह आवश्यक रूप से बुद्धिमान है।

वास्तव में, कुछ जगहों पर (मैं सबसे खराब-आक्रामक विषयों का नाम नहीं दूंगा) इस औपचारिक परिकल्पना परीक्षण का एक बहुत अन्य औपचारिक परिकल्पना परीक्षण पर आकस्मिक है।

ऐसा करने में समस्या यह है कि आपकी प्रक्रियाओं में उनके नाममात्र गुण नहीं होते हैं, कभी-कभी पास भी नहीं होते हैं। (दूसरी ओर, संभावित चरम उल्लंघन के लिए किसी भी विचार के बिना उस तरह की चीजों को संभालने से भी बदतर हो सकता है।)

कई पत्रों का सुझाव है कि विषमलैंगिक मामले के लिए, आप बस बेहतर अभिनय कर रहे हैं जैसे कि संस्करण इसके लिए परीक्षण करने के लिए बराबर नहीं हैं और केवल अस्वीकृति पर इसके बारे में कुछ करते हैं।

सामान्य स्थिति में यह कम स्पष्ट है। बड़े नमूनों में कम से कम, कई मामलों में सामान्यता सभी महत्वपूर्ण नहीं है (लेकिन विडंबना यह है कि बड़े नमूनों के साथ, आपकी सामान्यता का परीक्षण अस्वीकार करने की अधिक संभावना है), जब तक कि गैर-सामान्यता बहुत जंगली नहीं है। एक अपवाद भविष्यवाणी अंतराल के लिए है, जहां आपको वास्तव में सही के करीब होने के लिए अपनी वितरण धारणा की आवश्यकता होती है।

भाग में, एक समस्या यह है कि परिकल्पना परीक्षण एक अलग प्रश्न का उत्तर देता है, जिसका उत्तर दिया जाना चाहिए। आपको वास्तव में यह जानने की आवश्यकता नहीं है कि 'डेटा वास्तव में सामान्य है' (लगभग हमेशा, यह बिल्कुल सामान्य प्राथमिकता नहीं होगी )। सवाल यह है कि 'गैर-सामान्यता की सीमा मेरे अनुमान को कितनी बुरी तरह प्रभावित करेगी'।

दूसरा मुद्दा आम तौर पर या तो केवल नमूना आकार से स्वतंत्र होता है या वास्तव में बढ़ते नमूना आकार के साथ बेहतर होता है - फिर भी परिकल्पना परीक्षण बड़े नमूना आकारों में लगभग हमेशा अस्वीकार कर देगा।

कई स्थितियों में, जहां मजबूत या यहाँ तक कि वितरण नि: शुल्क प्रक्रियाओं देखते हैं जो बहुत ही सामान्य (और संभवत: पूरी तरह से कुशल के करीब हैं कर रहे हैं अब तक कई मामलों में यह मूर्खतापूर्ण प्रतीत नहीं होता लेने के लिए - और अधिक कुशल से काफी कुछ मामूली प्रस्थान पर) एक ही विवेकपूर्ण दृष्टिकोण।


नीस (+1) क्या आप उन लेखों का संदर्भ दे सकते हैं जिनका उल्लेख आप हेट्रोसेकेडिक मामले के बारे में करते हैं?
गुई

2
मैं किसी भी बिंदु को इंगित नहीं करना चाहता हूं, लेकिन मैं हर समय उन पर ऑनलाइन चलता हूं, इसलिए यह पता लगाना मुश्किल नहीं है कि कौन लोग इस पर जोर देते हैं (वे वही हैं जो ऐतिहासिक रूप से परिकल्पना परीक्षण पर जोर देते हैं)। दरअसल यहां सवाल पैदा लोग जहां पोस्टर लगता है कि वे के विषयों है औपचारिक परीक्षण का उपयोग करने के आम तौर पर वही होगा। यह सिर्फ एक या दो विषयों में नहीं है - मैं कई देखता हूं - लेकिन कुछ विशेष रूप से अक्सर ऐसा करते दिखते हैं। यथोचित रूप से सामान्य होने के लिए, मैं केवल यह मान सकता हूं कि उन क्षेत्रों में विशेष रूप से प्रसिद्ध ग्रंथ हैं जो इस पर जोर देते थे।
Glen_b -रिटनेट मोनिका

1
@ gui11aume यहां एक संदर्भ है ... यह उन लोगों में से एक नहीं है जिन्हें मैं ढूंढ रहा था, लेकिन यह उस बिंदु को बनाता है जो मुझे मिल रहा था (यह प्रारंभिक परीक्षण चीजों को बदतर बना सकता है)।
Glen_b -Reinstate मोनिका

2
एंड्रयू जेलमैन ने संबंधित समूहों के बीच विषमता के बारे में हाल ही में एक संबंधित पोस्ट किया था जो संबंधित है (कम से कम इस तरह की प्रक्रिया समस्याग्रस्त क्यों है)।
एंडी डब्ल्यू

1
थोड़ी देर पहले से इन चर्चाओं से संबंधित एक प्रश्न: सांख्यिकी.स्टैकएक्सचेंज.com
questions

8

मुख्य मुद्दों को दूसरों द्वारा अच्छी तरह से समझाया गया है, लेकिन अंतर्निहित या संबद्ध के साथ भ्रमित हैं

  1. पी-मानों के लिए अति-श्रद्धा, आँकड़ों में अधिकांश एक प्रकार के प्रमाणों पर।

  2. यह देखने की अनिच्छा कि सांख्यिकीय रिपोर्ट अनिवार्य रूप से विकल्पों के संयोजन पर आधारित हैं, कुछ दृढ़ता से प्रमाण-आधारित हैं, अन्य पिछले विश्लेषण, अंतर्ज्ञान, अनुमान, निर्णय, सिद्धांत के मिश्रण पर आधारित हैं।

मान लीजिए कि मैंने और मेरे सतर्क दोस्त टेस्ट ने सब कुछ एक प्रतिक्रिया के लिए लॉग ट्रांसफॉर्मेशन चुना, लेकिन मैं डेटा के साथ शारीरिक तर्क और पिछले अनुभव के मिश्रण के आधार पर उस निष्कर्ष पर पहुंचता हूं, जबकि टेस्ट सब कुछ बॉक्स-कॉक्स परीक्षण और अनुमान के आधार पर लॉग स्केल चुनता है एक पैरामीटर के।

अब हम दोनों एक ही एकाधिक प्रतिगमन का उपयोग करते हैं। क्या हमारे पी-मूल्यों की अलग-अलग व्याख्या है? एक व्याख्या पर, टेस्ट एवरीथिंग के पी-मान उसके पिछले संदर्भों में सशर्त हैं। मैंने इनफॉरमेशन का भी इस्तेमाल किया, लेकिन ज्यादातर वे अनौपचारिक थे, जो पिछले प्रोजेक्ट्स में पिछले ग्राफ़, कैलकुलेशन आदि की लंबी श्रृंखला पर आधारित थे। यह कैसे रिपोर्ट किया जाना है?

स्वाभाविक रूप से, परीक्षण के परिणाम और सब कुछ खुद के लिए प्रतिगमन परिणाम समान हैं।

समझदार सलाह और संदिग्ध दर्शन का एक ही मिश्रण भविष्यवक्ताओं की पसंद और कार्यात्मक रूप पर लागू होता है। उदाहरण के लिए, अर्थशास्त्रियों को व्यापक रूप से पिछली सैद्धांतिक चर्चाओं का सम्मान करने और प्रत्येक मामले में अच्छे कारण के साथ डेटा स्नूपिंग से सावधान रहने के लिए सिखाया जाता है। लेकिन सबसे कमजोर उदाहरणों में संबंधित सिद्धांत साहित्य में पहले से किया गया एक अस्थायी सुझाव है, कुछ अनुभवजन्य विश्लेषण के बाद बहुत संभव है। लेकिन साहित्य संदर्भ को पवित्र करता है, जबकि हाथ में डेटा से सीखना कई लेखकों के लिए संदिग्ध है।


बहुत स्पष्ट (+1)।
गुई

1
+1। हालाँकि, आपके विश्लेषण बनाम टेस्ट एवरीथिंग के विश्लेषण के प्रदर्शन में लंबे समय का अंतर है। हर बार जब यह विश्लेषण चलाया जाता है, तो आप उसी रणनीति का उपयोग करेंगे, जो साहित्य में लिखा गया था (जो प्रयोग द्वारा उतार-चढ़ाव नहीं करता है) के आधार पर। OTOH, डेटा हैं नमूने के तौर पर, और बॉक्स कॉक्स परीक्षण से उत्पादन अध्ययन द्वारा अध्ययन में उतार चढ़ाव होगा।
गूँग - मोनिका

यह चक्कर है, लेकिन मेरा अनुभव भी लंबे समय से बदल रहा है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.