क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार' है?


297

एक पूर्व सहयोगी ने एक बार मुझसे निम्न प्रकार से तर्क दिया:

हम आमतौर पर प्रक्रियाओं के परिणामों के लिए सामान्यता परीक्षण लागू करते हैं, जो अशक्त के तहत, यादृच्छिक चर उत्पन्न करते हैं जो केवल asymptotically या लगभग सामान्य होते हैं (कुछ मात्रा पर निर्भर 'asymptotically' भाग के साथ जो हम बड़ी नहीं कर सकते हैं); सस्ती स्मृति, बड़े डेटा और तेज प्रोसेसर के युग में, सामान्यता परीक्षणों को हमेशा बड़े (हालांकि बहुत बड़े नहीं) नमूनों के लिए सामान्य वितरण की अशक्तता को अस्वीकार करना चाहिए । और इसलिए, सामान्य रूप से, सामान्यता परीक्षणों का उपयोग केवल छोटे नमूनों के लिए किया जाना चाहिए, जब वे संभवतया कम शक्ति और टाइप I दर पर कम नियंत्रण रखते हैं।

क्या यह एक वैध तर्क है? क्या यह एक प्रसिद्ध तर्क है? क्या सामान्यता की तुलना में एक 'फजीर' अशक्त परिकल्पना के लिए प्रसिद्ध परीक्षण हैं?


23
संदर्भ के लिए: मुझे नहीं लगता कि इसके लिए समुदाय विकि की आवश्यकता है।
शेन

2
मुझे यकीन नहीं था कि 'सही उत्तर' था ...
shabbychef

5
एक निश्चित अर्थ में, यह सभी परिमाणों के परिमित संख्या के सभी परीक्षण के लिए सही है। साथ निश्चित (पैरामीटर की संख्या जिस पर परीक्षण caried जाता है) और कुछ बिंदु पर अशक्त सीमा के बिना growthing, दो समूहों के बीच कोई अंतर (चाहे कितने भी छोटे) हमेशा टूट जाएगा। दरअसल, यह बायेसियन परीक्षणों के पक्ष में एक तर्क है। nkn
user603

2
मेरे लिए, यह एक वैध तर्क नहीं है। वैसे भी, कोई भी जवाब देने से पहले आपको चीजों को थोड़ा औपचारिक करने की जरूरत है। आप गलत हो सकते हैं और आप नहीं हो सकते हैं, लेकिन अब आपके पास जो कुछ है वह एक अंतर्ज्ञान से अधिक कुछ नहीं है: मेरे लिए वाक्य "सस्ते स्मृति, बड़े डेटा और तेज प्रोसेसर के युग में, सामान्यता परीक्षणों को हमेशा सामान्य की अशक्तता को अस्वीकार करना चाहिए" स्पष्टीकरण की आवश्यकता है :) मुझे लगता है कि यदि आप अधिक औपचारिक सटीकता देने की कोशिश करते हैं तो उत्तर सरल होगा।
रॉबिन जिरार्ड

8
"हाइपोथिसिस परीक्षण के लिए बड़े डेटासेट अनुपयुक्त हैं" पर थ्रेड इस प्रश्न के सामान्यीकरण पर चर्चा करता है। ( Stats.stackexchange.com/questions/2516/... )
whuber

जवाबों:


229

यह कोई तर्क नहीं है। यह एक (थोड़ा दृढ़ता से कहा गया है) तथ्य है कि औपचारिक सामान्यता परीक्षण हमेशा आज के साथ काम करने वाले विशाल नमूना आकारों पर अस्वीकार करते हैं। यह साबित करना आसान है कि जब n बड़ा हो जाता है, तो पूर्ण सामान्यता से सबसे छोटा विचलन भी महत्वपूर्ण परिणाम देगा। और जैसा कि हर डेटासेट में कुछ हद तक यादृच्छिकता होती है, कोई भी एकल डेटासेट सामान्य रूप से वितरित नमूना नहीं होगा। लेकिन लागू आंकड़ों में सवाल यह नहीं है कि क्या डेटा / अवशिष्ट ... पूरी तरह से सामान्य हैं, लेकिन धारण करने के लिए मान्य हैं।

मुझे शापिरो-विलक परीक्षण के साथ उदाहरण दें । नीचे दिया गया कोड वितरण का एक सेट बनाता है जो सामान्यता का दृष्टिकोण रखता है लेकिन पूरी तरह से सामान्य नहीं हैं। इसके बाद, हम परीक्षण करते हैं shapiro.testकि क्या इन लगभग सामान्य वितरणों का एक नमूना सामान्यता से विचलित है। आर में:

x <- replicate(100, { # generates 100 different tests on each distribution
                     c(shapiro.test(rnorm(10)+c(1,0,2,0,1))$p.value,   #$
                       shapiro.test(rnorm(100)+c(1,0,2,0,1))$p.value,  #$
                       shapiro.test(rnorm(1000)+c(1,0,2,0,1))$p.value, #$
                       shapiro.test(rnorm(5000)+c(1,0,2,0,1))$p.value) #$
                    } # rnorm gives a random draw from the normal distribution
               )
rownames(x) <- c("n10","n100","n1000","n5000")

rowMeans(x<0.05) # the proportion of significant deviations
  n10  n100 n1000 n5000 
 0.04  0.04  0.20  0.87 

अंतिम पंक्ति यह जांचती है कि प्रत्येक नमूना आकार के सिमुलेशन का कौन सा अंश सामान्यता से महत्वपूर्ण रूप से विचलित है। इसलिए 87% मामलों में, 5000 टिप्पणियों का एक नमूना शापिरो-विल्क्स के अनुसार सामान्यता से महत्वपूर्ण रूप से विचलित करता है। फिर भी, यदि आप qq भूखंडों को देखते हैं, तो आप कभी भी सामान्यता से विचलन का फैसला नहीं करेंगे। नीचे आप एक उदाहरण के रूप में यादृच्छिक नमूने के एक सेट के लिए qq- भूखंडों को देखते हैं

वैकल्पिक शब्द

पी-वैल्यू के साथ

  n10  n100 n1000 n5000 
0.760 0.681 0.164 0.007 

40
साइड नोट पर, केंद्रीय सीमा प्रमेय औपचारिक सामान्यता को कई मामलों में अनावश्यक रूप से जांचता है जब n बड़ा होता है।
जोरिस मेय्स

31
हां, असली सवाल यह नहीं है कि डेटा वास्तव में सामान्य रूप से वितरित किए जाते हैं, लेकिन क्या वे सामान्य रूप से विश्लेषण की व्यावहारिक उद्देश्य के लिए उचित होने की अंतर्निहित धारणा के लिए पर्याप्त रूप से सामान्य हैं, और मैंने सोचा होगा कि CLT आधारित तर्क सामान्य रूप से है [sic] उसके लिए पर्याप्त है।
डिक्रान मार्सुपियल

53
यह उत्तर प्रश्न को संबोधित नहीं करता प्रतीत होता है: यह केवल यह दर्शाता है कि एसडब्ल्यू परीक्षण अपने नाममात्र आत्मविश्वास स्तर को प्राप्त नहीं करता है, और इसलिए यह उस परीक्षण में एक दोष (या कम से कम इसके Rकार्यान्वयन में) की पहचान करता है। लेकिन यह सब - सामान्य रूप से सामान्यता परीक्षण की उपयोगिता के दायरे पर इसका कोई असर नहीं है। सामान्य परीक्षण जो बड़े नमूना आकारों पर हमेशा अस्वीकार करते हैं, प्रारंभिक दावा केवल गलत है।
व्हिबर

19
@ उत्तर इस प्रश्न को संबोधित करता है। प्रश्न का पूरा बिंदु "निकट-सामान्यता" में "पास" है। एसडब्ल्यू परीक्षण करता है कि क्या मौका है कि नमूना एक सामान्य वितरण से तैयार किया गया है। के रूप में वितरण मैं का निर्माण कर रहे हैं जानबूझकर सामान्य नहीं है, तो आप यह क्या करने के लिए वादा किया दप परीक्षण उम्मीद थी: अशक्त अस्वीकार करते हैं। पूरे बिंदु यह है कि बड़े नमूनों में यह अस्वीकृति निरर्थक है, क्योंकि सामान्यता से विचलन के कारण वहां शक्ति का नुकसान नहीं होता है। इसलिए परीक्षण सही है, लेकिन व्यर्थ है, जैसा कि QQplots द्वारा दिखाया गया है
जोरिस मेय्स

11
आपने जो लिखा था उस पर मैंने भरोसा किया था और "लगभग-सामान्य" वितरण से आपका क्या मतलब था। अब मैं देखता हूं - लेकिन केवल कोड को पढ़कर और सावधानीपूर्वक परीक्षण करके - कि आप तीन मानक सामान्य वितरण से और पर साधनों के साथ अनुकरण कर रहे हैं और परिणामों को अनुपात में जोड़ रहे हैं । क्या आप यह उम्मीद नहीं करेंगे कि सामान्यता का अच्छा परीक्षण इस मामले में अशक्तता को खारिज कर देगा? आपने जो प्रभावी ढंग से प्रदर्शन किया है वह यह है कि क्यूक्यू प्लॉट ऐसे मिश्रणों का पता लगाने में बहुत अच्छे नहीं हैं, बस! 1 , 2 2 : 2 : 10, 1,22:2:1
whuber

172

यह सोचने के बारे में कि क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार' है, एक को पहले यह सोचना होगा कि यह किसके लिए उपयोगी है। बहुत से लोग (अच्छी तरह से ... कम से कम, कई वैज्ञानिक) इस प्रश्न को सामान्यता परीक्षण के उत्तर को गलत समझते हैं।

प्रश्न सामान्यता परीक्षण उत्तर देता है: क्या गौसियन आदर्श से किसी भी विचलन के ठोस सबूत हैं? मध्यम रूप से बड़े वास्तविक डेटा सेट के साथ, उत्तर लगभग हमेशा हां होता है।

प्रश्न वैज्ञानिक अक्सर जवाब देने के लिए सामान्यता परीक्षण की अपेक्षा करते हैं: क्या डेटा गौसियन आदर्श से पर्याप्त रूप से विचलित होता है जो एक गाऊसी वितरण को मानने वाले परीक्षण के "निषिद्ध" उपयोग के लिए है? वैज्ञानिक अक्सर चाहते हैं कि सामान्यता परीक्षण रेफरी हो जो पारंपरिक (ANOVA, आदि) परीक्षणों का परित्याग करने का फैसला करता है और इसके बजाय रूपांतरित डेटा का विश्लेषण करता है या रैंक-आधारित गैर-पैरामीट्रिक परीक्षण या एक resampling या बूटस्ट्रैप दृष्टिकोण का उपयोग करता है। इस उद्देश्य के लिए, सामान्यता परीक्षण बहुत उपयोगी नहीं हैं।


16
एक अच्छे और जानकारीपूर्ण उत्तर के लिए +1। मुझे एक आम गलतफहमी के लिए एक अच्छी व्याख्या देखने के लिए उपयोगी लगता है (जो कि मैं गलती से खुद का अनुभव कर रहा हूं: आंकड़े.स्टैकएक्सचेंज . com / questions / 7022/… )। हालांकि मुझे जो याद आता है, वह इस सामान्य गलतफहमी का एक वैकल्पिक समाधान है। मेरा मतलब है, अगर सामान्यता परीक्षण गलत तरीके से जाना जाता है, तो एक सामान्य सन्निकटन स्वीकार्य / न्यायसंगत होने पर कोई कैसे जांच कर सकता है?
पोस्डेफ

6
विश्लेषक (या, अच्छी तरह से, शोधकर्ता / वैज्ञानिक) के (सामान्य) अर्थ के लिए कोई विकल्प नहीं है। और अनुभव (सीखने और देखने की कोशिश करके: अगर मुझे लगता है कि यह सामान्य है तो मुझे क्या निष्कर्ष मिलेगा? यदि नहीं तो क्या फर्क पड़ता है?)। ग्राफिक्स आपके सबसे अच्छे दोस्त हैं।
फेयरमाइल्स

2
मुझे यह पेपर पसंद है, जो आपके द्वारा किए गए बिंदु को बनाता है: मसेरी, टी (1989)। गेंडा, सामान्य वक्र, और अन्य असंभव जीव। मनोवैज्ञानिक बुलेटिन, 105 (1), 156-166।
जेरेमी मील्स

4
ग्राफिक्स देखना बहुत अच्छा है, लेकिन अगर मैन्युअल रूप से जांच करने के लिए बहुत सारे हैं तो क्या होगा? क्या हम संभावित संकट स्थलों को इंगित करने के लिए उचित सांख्यिकीय प्रक्रियाएं तैयार कर सकते हैं? मैं बड़े पैमाने पर ए / बी प्रयोग करने वालों की तरह सोच रहा हूं: exp-platform.com/Pages/…
dfrankow

118

मुझे लगता है कि सामान्यता के लिए परीक्षण ग्राफिकल परीक्षाओं के साथी के रूप में उपयोगी हो सकते हैं। उन्हें सही तरीके से उपयोग किया जाना है, हालांकि। मेरी राय में, इसका मतलब है कि कई लोकप्रिय परीक्षण, जैसे कि शापिरो-विल्क, एंडरसन-डार्लिंग और जर्क-बेरा परीक्षणों का उपयोग कभी नहीं किया जाना चाहिए।

इससे पहले कि मैं अपना दृष्टिकोण स्पष्ट करूँ, मुझे कुछ टिप्पणी करने दें:

  • एक दिलचस्प हालिया पेपर रूचोन एट अल में। दो-नमूना टी-परीक्षण पर शापिरो-विल्क परीक्षण के प्रभाव का अध्ययन किया। उदाहरण के लिए टी-टेस्ट करने से पहले सामान्यता के लिए परीक्षण की दो-चरण प्रक्रिया समस्याओं के बिना नहीं है। फिर तो, टी-टेस्ट करने से पहले नॉर्मली जांच की सामान्यता की दो-चरणीय प्रक्रिया है । अंतर यह है कि उत्तरार्द्ध का प्रभाव जांच करने के लिए बहुत अधिक कठिन है (क्योंकि इसमें सांख्यिकीय रूप से 100,000 या इतने बार सामान्य रूप से जांच करने के लिए एक सांख्यिकीविद् की आवश्यकता होगी ...)।
  • उदाहरण के लिए, गैर-सामान्यता को निर्धारित करना उपयोगी है , उदाहरण के लिए नमूना तिरछा गणना करके, भले ही आप औपचारिक परीक्षण नहीं करना चाहते हों।
  • बहुभिन्नरूपी सामान्यता ग्राफिकल रूप से आकलन करने में मुश्किल हो सकती है और बहुभिन्नरूपी आँकड़ों के लिए असममित वितरण को धीमा किया जा सकता है। इसलिए सामान्यता के लिए टेस्ट एक बहुभिन्नरूपी सेटिंग में अधिक उपयोगी होते हैं।
  • सामान्यता के लिए परीक्षण संभवतः उन चिकित्सकों के लिए विशेष रूप से उपयोगी हैं जो ब्लैक-बॉक्स विधियों के एक सेट के रूप में आंकड़ों का उपयोग करते हैं । जब सामान्यता को अस्वीकार कर दिया जाता है, तो चिकित्सक को सामान्यता की धारणा के आधार पर एक मानक प्रक्रिया को पूरा करने के बजाय, एक गैरपरंपरागत प्रक्रिया का उपयोग करने, एक परिवर्तन को लागू करने या एक अधिक अनुभवी सांख्यिकीविद् से परामर्श करने पर विचार करना चाहिए।
  • जैसा कि दूसरों द्वारा बताया गया है, यदि n काफी बड़ा है, तो सीएलटी आमतौर पर दिन बचाता है। हालांकि, "बड़े पर्याप्त" क्या वितरण के विभिन्न वर्गों के लिए अलग है।

(मेरी परिभाषा में) सामान्यता के लिए एक परीक्षण को विकल्प के एक वर्ग के खिलाफ निर्देशित किया जाता है यदि यह उस वर्ग के विकल्पों के प्रति संवेदनशील है, लेकिन अन्य वर्गों के विकल्पों के प्रति संवेदनशील नहीं है। विशिष्ट उदाहरण परीक्षण हैं जो तिरछा या कर्टोटिक विकल्प की ओर निर्देशित होते हैं । सबसे सरल उदाहरण परीक्षण आंकड़ों के रूप में नमूना तिरछा और कुर्तोसिस का उपयोग करते हैं।

सामान्यता के निर्देशित परीक्षण निश्चित रूप से सर्वग्राही परीक्षणों (जैसे कि शपीरो-विल्क और जर्क-बेरा परीक्षण) के लिए बेहतर होते हैं क्योंकि यह सामान्य है कि केवल कुछ प्रकार की गैर-सामान्यता एक विशेष हीनता प्रक्रिया के लिए चिंता का विषय हैं।

आइए स्टूडेंट के टी-टेस्ट को एक उदाहरण के रूप में देखें। मान लें कि हमारे पास तिरछा साथ वितरण से एक आईड नमूना हैγ=E(Xμ)3σ3κ=E(Xμ)4σ43.Xγ=0γκ सामान्य वितरण के लिए 0 कर रहे हैं।

Tn

P(Tnx)=Φ(x)+n1/216γ(2x2+1)ϕ(x)n1x(112κ(x23)118γ2(x4+2x23)14(x2+3))ϕ(x)+o(n1),

Φ()ϕ()

γn1/2κn1Tn

n

अंगूठे के एक नियम के रूप में ( प्रकृति का नियम नहीं ), साधनों के बारे में अनुमान तिरछापन के प्रति संवेदनशील है और भिन्नता के बारे में अनुमान कुर्तोसिस के प्रति संवेदनशील है।

सामान्यता के लिए निर्देशित परीक्षण का उपयोग करने से '' खतरनाक '' विकल्प के खिलाफ उच्च शक्ति प्राप्त करने का विकल्प होता है और विकल्प '' खतरनाक '' के मुकाबले कम शक्ति होती है, जिसका अर्थ है कि हम सामान्यता से विचलन के कारण सामान्यता को अस्वीकार करने की संभावना कम है। 'हमारी हीन प्रक्रिया के प्रदर्शन को प्रभावित नहीं करता है। गैर-सामान्यता इस तरह से निर्धारित की जाती है जो हाथ में समस्या के लिए प्रासंगिक है।यह हमेशा रेखांकन करना आसान नहीं होता है।

n|γ|1

|n1/216γ(2zα/22+1)ϕ(zα/2)|0.01
γ=0n


2
अब यह एक महान जवाब है!
user603

10
हाँ, यह स्वीकार किया जाना चाहिए, वास्तव में शानदार जवाब
जेनसेक्कुई

2
"यह सामान्य है कि केवल कुछ प्रकार की गैर-सामान्यता एक विशेष हीनता प्रक्रिया के लिए चिंता का विषय है।" - बेशक किसी को उस प्रकार की गैर-सामान्यता के लिए निर्देशित परीक्षण का उपयोग करना चाहिए। लेकिन तथ्य यह है कि एक सामान्यता परीक्षण का उपयोग कर रहा है इसका मतलब है कि वह सामान्यता के सभी पहलुओं की परवाह करता है । सवाल यह है: उस मामले में एक सामान्य परीक्षण एक अच्छा विकल्प है।
आरबीएम

विशेष परीक्षणों के लिए मान्यताओं की पर्याप्तता के लिए परीक्षण आम हो रहे हैं, जो शुक्र से अनुमान लगाने में से कुछ को हटा देता है।
कार्ल

1
@ कार्ल: क्या आप उसके लिए कुछ संदर्भ / उदाहरण जोड़ सकते हैं?
kjetil b halvorsen

58

IMHO सामान्यता परीक्षण निम्नलिखित कारणों से बिल्कुल बेकार हैं:

  1. छोटे नमूनों पर, यह एक अच्छा मौका है कि आबादी का सही वितरण काफी हद तक गैर-सामान्य है, लेकिन सामान्यता परीक्षण इसे लेने के लिए शक्तिशाली नहीं है।

  2. बड़े नमूनों पर, टी-टेस्ट और एनोवा जैसी चीजें गैर-सामान्यता के लिए बहुत मजबूत हैं।

  3. सामान्य रूप से वितरित जनसंख्या का पूरा विचार किसी भी तरह एक सुविधाजनक गणितीय सन्निकटन है। आम तौर पर सांख्यिकीय रूप से निपटाए गए किसी भी मात्रा में सभी वास्तविक संख्याओं के समर्थन के साथ वितरण नहीं हो सकता है। उदाहरण के लिए, लोगों के पास एक नकारात्मक ऊंचाई नहीं हो सकती। ब्रह्मांड में कुछ भी नकारात्मक द्रव्यमान या उससे अधिक द्रव्यमान नहीं हो सकता है। इसलिए, यह कहना है कि सुरक्षित है कुछ भी नहीं है वास्तव में सामान्य रूप से वास्तविक दुनिया में वितरित किए।


2
विद्युत संभावित अंतर वास्तविक दुनिया की मात्रा का एक उदाहरण है जो नकारात्मक हो सकता है।
निको

16
@ निको: निश्चित रूप से यह नकारात्मक हो सकता है, लेकिन इसकी कुछ सीमित सीमा है क्योंकि ब्रह्मांड में केवल इतने सारे प्रोटॉन और इलेक्ट्रॉन हैं। बेशक यह व्यवहार में अप्रासंगिक है, लेकिन यह मेरी बात है। कुछ भी सामान्य रूप से वितरित नहीं किया जाता है (मॉडल गलत है), लेकिन बहुत सारी चीजें हैं जो काफी करीब हैं (मॉडल उपयोगी है)। असल में, आप पहले से ही जानते थे कि मॉडल गलत था, और अस्वीकार को अस्वीकार या अस्वीकार नहीं करना अनिवार्य रूप से इस बारे में कोई जानकारी नहीं देता है कि क्या यह फिर भी उपयोगी है।
dsimcha

1
@dsimcha - मुझे लगता है कि वास्तव में व्यावहारिक, उपयोगी प्रतिक्रिया।
रोलैंडो 2

5
t

@dsimcha "मॉडल गलत है"। हालांकि सभी मॉडल "गलत" नहीं हैं?
अतीराग

30

मुझे लगता है कि सामान्यता के लिए पूर्व-परीक्षण (जिसमें ग्राफिक्स का उपयोग करने वाले अनौपचारिक आकलन शामिल हैं) की बात याद आती है।

  1. इस दृष्टिकोण के उपयोगकर्ता मानते हैं कि सामान्यता का आकलन 1.0 के पास एक शक्ति है।
  2. नॉनपामेट्रिक टेस्ट जैसे कि विलकॉक्सन, स्पीयरमैन और क्रुस्कल-वालिस की क्षमता 0.95 है अगर सामान्य स्थिति है।
  3. 2. एक को ध्यान में रखते हुए, एक गैर-पैरामीटर परीक्षण के उपयोग को पूर्व-निर्दिष्ट कर सकता है यदि कोई इस संभावना का भी मनोरंजन करता है कि डेटा सामान्य वितरण से उत्पन्न नहीं हो सकता है।
  4. YY

ध्यान दें कि 0.95 की दक्षता स्पर्शोन्मुख है : FWIW मुझे लगता है कि दक्षता विशिष्ट परिमित नमूना आकारों के लिए बहुत कम है ... (हालांकि माना जाता है कि मैंने इस अध्ययन को नहीं देखा है, न ही इसे स्वयं तलाशने की कोशिश की है)
बेन बोलकर

16

यह पूछने से पहले कि क्या सामान्यता के लिए कोई परीक्षण या किसी भी प्रकार का मोटा चेक "उपयोगी" है, आपको सवाल के पीछे के सवाल का जवाब देना होगा: "आप क्यों पूछ रहे हैं?"

उदाहरण के लिए, यदि आप केवल चारों ओर एक आत्मविश्वास सीमा रखना चाहता हूँ मतलब डेटा का एक सेट की, सामान्य से प्रस्थान या नहीं महत्वपूर्ण हो सकता है, आप कितना डेटा पर और कितना बड़ा प्रस्थान कर रहे हैं निर्भर करता है। हालांकि, सामान्यता से प्रस्थान महत्वपूर्ण हैं यदि आप भविष्यवाणी करना चाहते हैं कि भविष्य के अवलोकन या आपके द्वारा नमूना किए गए जनसंख्या में सबसे चरम मूल्य क्या होगा।


12

मुझे एक छोटी सी बात जोड़ने दें:
एक अल्फ़ाज़-त्रुटि को ध्यान में रखे बिना एक सामान्यता परीक्षण करने से अल्फ़ा-त्रुटि करने की आपकी समग्र संभावना बढ़ जाती है।

आप यह कभी नहीं भूलेंगे कि प्रत्येक अतिरिक्त परीक्षण यह तब तक करता है जब तक आप अल्फा-त्रुटि संचय के लिए नियंत्रण नहीं करते हैं। इसलिए, सामान्यता परीक्षण को खारिज करने का एक और अच्छा कारण है।


मुझे लगता है कि आप एक ऐसी स्थिति का जिक्र कर रहे हैं जहां कोई पहली बार एक सामान्य परीक्षण करता है, और फिर उस परीक्षण के परिणाम का उपयोग करके यह तय करता है कि आगे कौन सा परीक्षण करना है।
हार्वे मोटुलस्की

3
मैं सामान्यता परीक्षणों की सामान्य उपयोगिता का उल्लेख करता हूं जब यह निर्धारित करने के लिए विधि के रूप में उपयोग किया जाता है कि क्या एक निश्चित विधि का उपयोग करना उचित है या नहीं। यदि आप उन्हें इन मामलों में लागू करते हैं, तो यह अल्फा त्रुटि करने की संभावना के संदर्भ में, अल्फा त्रुटि संचय से बचने के लिए अधिक मजबूत परीक्षण करने के लिए बेहतर है।
हेनरिक

4
H0

3
एक अन्य तरीका है कि एक सामान्यता परीक्षण मैं टाइप त्रुटियों को बढ़ा सकता है अगर हम "अल्फा-त्रुटि के प्रदर्शन की समग्र संभावना" के बारे में बात कर रहे हैं। परीक्षण में स्वयं एक त्रुटि दर है, इसलिए कुल मिलाकर , त्रुटि होने की हमारी संभावना बढ़ जाती है। एक छोटी सी बात पर भी जोर देता हूं। मुझे लगता है ...
निक स्टीनर

2
@NickStauner यह वही है जो मैं बताना चाहता था। इस बिंदु को और भी स्पष्ट करने के लिए धन्यवाद।
हेनरिक

11

यहां उत्तर पहले ही कई महत्वपूर्ण बिंदुओं को संबोधित कर चुके हैं। संक्षेप में प्रस्तुत करने के लिए:

  • कोई सुसंगत परीक्षण नहीं है जो यह निर्धारित कर सकता है कि डेटा का एक सेट वास्तव में वितरण का पालन करता है या नहीं।
  • उच्च उत्तोलन, उच्च प्रभाव टिप्पणियों और मॉडलों पर उनके प्रभावों पर टिप्पणी करने के लिए डेटा और मॉडल का निरीक्षण करने के लिए टेस्ट कोई विकल्प नहीं हैं।
  • कई प्रतिगमन दिनचर्या के लिए मान्यताओं को अक्सर "डेटा" [अवशिष्ट] वितरित करने की आवश्यकता के रूप में गलत समझा जाता है और यह नौसिखिया सांख्यिकीविदों द्वारा व्याख्या की जाती है कि विश्लेषण के साथ आगे बढ़ने से पहले विश्लेषक औपचारिक रूप से कुछ अर्थों में इसका मूल्यांकन करते हैं।

मैं पहली बार अपने एक, व्यक्तिगत रूप से, सबसे अधिक बार एक्सेस किए गए और सांख्यिकीय लेखों को पढ़ने का हवाला देते हुए एक उत्तर जोड़ रहा हूं: लुमली एट द्वारा " बड़े सार्वजनिक स्वास्थ्य डेटासेट में सामान्यता मान्यताओं का महत्व "। अल। यह संपूर्णता में पढ़ने लायक है। सारांश बताता है:

टी-टेस्ट और सबसे कम वर्ग के रैखिक प्रतिगमन को पर्याप्त रूप से बड़े नमूनों में सामान्य वितरण की किसी भी धारणा की आवश्यकता नहीं है। पिछले सिमुलेशन अध्ययनों से पता चलता है कि "पर्याप्त रूप से बड़े" अक्सर 100 से कम है, और यहां तक ​​कि हमारे बेहद गैर-सामान्य चिकित्सा लागत डेटा के लिए यह 500 से कम है। इसका मतलब है कि सार्वजनिक स्वास्थ्य अनुसंधान में, जहां नमूने अक्सर इससे काफी बड़े होते हैं, टी। -स्टेस्ट और लीनियर मॉडल नॉर्मल डिस्ट्रिब्यूशन वाले ही नहीं, कई तरह के डेटा में अंतर और ट्रेंड का विश्लेषण करने के लिए उपयोगी डिफॉल्ट टूल्स हैं। सामान्यता के लिए औपचारिक सांख्यिकीय परीक्षण विशेष रूप से अवांछनीय हैं क्योंकि उनके पास छोटे नमूनों में कम शक्ति होगी जहां वितरण मायने रखता है और उच्च शक्ति केवल बड़े नमूनों में जहां वितरण महत्वहीन है।

जबकि रैखिक प्रतिगमन के बड़े-नमूना गुणों को अच्छी तरह से समझा जाता है, सामान्यता की धारणा के लिए आवश्यक नमूना आकारों में बहुत कम शोध हुआ है जो महत्वहीन है। विशेष रूप से, यह स्पष्ट नहीं है कि आवश्यक नमूना आकार मॉडल में भविष्यवक्ताओं की संख्या पर निर्भर करता है।

सामान्य वितरण पर ध्यान इन विधियों की वास्तविक मान्यताओं से विचलित कर सकता है। रैखिक प्रतिगमन यह मानता है कि परिणाम चर का विचरण लगभग स्थिर है, लेकिन दोनों विधियों पर प्राथमिक प्रतिबंध यह है कि वे मानते हैं कि परिणाम चर के माध्य में परिवर्तन की जांच करना पर्याप्त है। यदि वितरण का कुछ अन्य सारांश अधिक रुचि का है, तो टी-टेस्ट और रैखिक प्रतिगमन उचित नहीं हो सकता है।

संक्षेप में: सामान्यता आम तौर पर चर्चा के लायक नहीं होती है या किसी विशेष वैज्ञानिक प्रश्न का उत्तर देने के महत्व के विपरीत यह ध्यान आकर्षित करता है। यदि इच्छा डेटा में अंतर अंतर को संक्षेप में प्रस्तुत करना है , तो टी-टेस्ट और एनोवा या रैखिक प्रतिगमन को अधिक व्यापक अर्थों में उचित ठहराया जाता है। इन मॉडलों पर आधारित परीक्षण सही अल्फा स्तर के रहते हैं, तब भी जब वितरण संबंधी धारणाएं पूरी नहीं होती हैं, हालांकि बिजली प्रतिकूल रूप से प्रभावित हो सकती है।

जिन कारणों से सामान्य वितरण पर ध्यान दिया जाता है, वे शास्त्रीय कारणों से हो सकते हैं, जहां एन-परीक्षण के लिए एफ-वितरण और टी-परीक्षण के लिए छात्र-टी-वितरण पर सटीक परीक्षण प्राप्त किए जा सकते हैं। सच्चाई यह है कि, विज्ञान की कई आधुनिक प्रगति के बीच, हम आम तौर पर पहले की तुलना में बड़े डेटासेट से निपटते हैं। यदि कोई वास्तव में एक छोटे डेटासेट के साथ काम कर रहा है, तो जो डेटा आम तौर पर वितरित किए जाते हैं, वह डेटा उन डेटा से नहीं आ सकता है: बस पर्याप्त शक्ति नहीं है। अन्य अनुसंधान, प्रतिकृति, या यहां तक ​​कि माप की प्रक्रिया के जीव विज्ञान या विज्ञान पर भी, मेरी राय में, अवलोकन किए गए डेटा को अंतर्निहित संभावित संभावना मॉडल पर चर्चा करने के लिए एक अधिक न्यायसंगत दृष्टिकोण है।

इस कारण से, एक विकल्प के रूप में रैंक-आधारित परीक्षण का विकल्प पूरी तरह से चूक जाता है। हालाँकि, मैं इस बात से सहमत हूँ कि जैकनाइफ़ या बूटस्ट्रैप जैसे मजबूत विचरण आकलन का उपयोग करना महत्वपूर्ण कम्प्यूटेशनल विकल्प प्रदान करता है जो कि मॉडल विनिर्देश के अधिक महत्वपूर्ण उल्लंघनों, जैसे कि स्वतंत्रता या उन त्रुटियों के समान वितरण के तहत परीक्षण करने की अनुमति देता है।


10

मैं प्रयोग किया जाता है कि सामान्य की परीक्षण पूरी तरह से बेकार थे।

हालांकि, अब मैं अन्य शोधकर्ताओं के लिए परामर्श करता हूं। अक्सर, नमूने प्राप्त करना बेहद महंगा होता है, और इसलिए वे n = 8 के साथ अनुमान लगाना चाहेंगे।

ऐसे मामले में, गैर-पैरामीट्रिक परीक्षणों के साथ सांख्यिकीय महत्व मिलना बहुत मुश्किल है, लेकिन n = 8 के साथ टी-परीक्षण सामान्यता से विचलन के प्रति संवेदनशील हैं। तो हमें जो मिलता है वह यह है कि हम "अच्छी तरह से, सामान्यता की धारणा पर सशर्त, हम एक सांख्यिकीय महत्वपूर्ण अंतर पाते हैं" (चिंता न करें, ये आमतौर पर पायलट अध्ययन हैं ...)।

फिर हमें उस धारणा के मूल्यांकन के किसी तरीके की आवश्यकता है। मैं शिविर में आधे रास्ते में हूं कि भूखंड देखना एक बेहतर तरीका है, लेकिन सच कहा जाए तो इस बारे में बहुत अधिक मतभेद हो सकते हैं, जो कि आपके साथ असहमत लोगों में से एक होने पर बहुत समस्याग्रस्त हो सकता है। आपकी पांडुलिपि के समीक्षक।

कई मायनों में, मुझे अभी भी लगता है कि सामान्यता के परीक्षणों में बहुत सारी खामियां हैं: उदाहरण के लिए, हमें टाइप II से अधिक टाइप II त्रुटि के बारे में सोचना चाहिए। लेकिन उनके लिए एक आवश्यकता है।


ध्यान दें कि यहां तर्क यह है कि परीक्षण केवल सिद्धांत में बेकार हैं। सिद्धांत रूप में, हम हमेशा जितने चाहें उतने नमूने प्राप्त कर सकते हैं ... आपको यह साबित करने के लिए परीक्षणों की आवश्यकता होगी कि आपका डेटा कम से कम किसी तरह सामान्यता के करीब है।
लघुशंका

2
अच्छी बात। मुझे लगता है कि आप जो कर रहे हैं, और निश्चित रूप से मेरा मानना ​​है, यह है कि सामान्यता से विचलन का एक उपाय एक परिकल्पना परीक्षण से अधिक महत्वपूर्ण है।
क्लिफ एबी

जब तक वे फिर एक गैर पैरामीट्रिक परीक्षण पर स्विच नहीं करते हैं और पी-मानों की व्याख्या करने की कोशिश करते हैं (जो सशर्त पूर्व-परीक्षण द्वारा अमान्य हैं), शायद यह ठीक है ?!
ब्योर्न

2
सामान्यता के परीक्षण की शक्ति n = 8 पर बहुत कम होगी; विशेष रूप से, सामान्यता से विचलन जो एक परीक्षण के गुणों को महत्वपूर्ण रूप से प्रभावित करेगा, यह मानता है कि छोटे नमूना आकारों (चाहे परीक्षण द्वारा या नेत्रहीन) पर पता लगाना काफी कठिन हो सकता है।
Glen_b

1
@ गलेन_ बी: मैं सहमत हूं; मुझे लगता है कि यह भावना टाइप I के बजाय टाइप II त्रुटियों के बारे में अधिक देखभाल करने के अनुरूप है। मेरा कहना है कि सामान्य दुनिया को सामान्यता के लिए परीक्षण करने की आवश्यकता है। क्या हमारे मौजूदा उपकरण वास्तव में उस जरूरत को भरते हैं, यह एक अलग सवाल है।
एबी एबी

10

इसके लायक होने के लिए, मैंने एक बार काटे गए सामान्य वितरण के लिए एक तेज नमूना विकसित किया, और फ़ंक्शन को डीबग करने में सामान्यता परीक्षण (केएस) बहुत उपयोगी था। यह नमूना बहुत बड़े आकार के साथ परीक्षण पास करता है, लेकिन दिलचस्प बात यह है कि, जीएसएल का जिगगुरैट नमूना नहीं था।


8

आपने जो तर्क दिया वह एक राय है। मुझे लगता है कि सामान्यता परीक्षण का महत्व यह सुनिश्चित करना है कि डेटा सामान्य से गंभीर रूप से प्रस्थान नहीं करता है। मैं इसका उपयोग कभी-कभी अपनी अनुमान प्रक्रिया के लिए पैरामीट्रिक बनाम नॉनपैरेमेट्रिक परीक्षण का उपयोग करने के बीच निर्णय लेने के लिए करता हूं। मुझे लगता है कि परीक्षण मध्यम और बड़े नमूनों में उपयोगी हो सकता है (जब केंद्रीय सीमा प्रमेय खेलने में नहीं आता है)। मैं विल्क-शापिरो या एंडरसन-डार्लिंग परीक्षणों का उपयोग करता हूं, लेकिन एसएएस को चलाने से मुझे वे सभी मिलते हैं और वे आम तौर पर बहुत अच्छी तरह से सहमत होते हैं। एक अलग नोट पर मुझे लगता है कि QQ भूखंडों जैसे चित्रमय प्रक्रियाएं समान रूप से अच्छी तरह से काम करती हैं। एक औपचारिक परीक्षण का लाभ यह है कि यह वस्तुनिष्ठ है। छोटे नमूनों में यह सच है कि फिट परीक्षणों की इन अच्छाइयों में व्यावहारिक रूप से कोई शक्ति नहीं होती है और यह सहज ज्ञान युक्त होता है क्योंकि एक सामान्य वितरण से एक छोटा नमूना संयोगवश गैर-सामान्य दिख सकता है और इसका परीक्षण में हिसाब लगाया जाता है। इसके अलावा उच्च तिरछापन और कुर्तोसिस जो सामान्य वितरण से कई गैर-सामान्य वितरणों को अलग करते हैं, आसानी से छोटे नमूनों में नहीं देखे जाते हैं।


2
हालांकि यह निश्चित रूप से उस तरह से इस्तेमाल किया जा सकता है, मुझे नहीं लगता कि आप क्यूक्यू-प्लॉट के मुकाबले अधिक उद्देश्यपूर्ण होंगे। परीक्षणों के साथ व्यक्तिपरक हिस्सा यह तय करना है कि आपका डेटा गैर-सामान्य है। एक बड़े नमूने के साथ p = 0.05 पर अस्वीकार करने से बहुत अच्छी तरह से अत्यधिक हो सकता है।
एरिक

4
पूर्व-परीक्षण (जैसा कि यहां सुझाव दिया गया है) समग्र प्रक्रिया के प्रकार I त्रुटि दर को अमान्य कर सकता है; किसी को इस तथ्य को ध्यान में रखना चाहिए कि जो भी चयनित है उसके परिणामों की व्याख्या करते समय एक पूर्व-परीक्षण किया गया था। आम तौर पर, परिकल्पना परीक्षणों को अशक्त परिकल्पना के परीक्षण के लिए रखा जाना चाहिए जो वास्तव में परवाह करता है, यानी कि चर के बीच कोई संबंध नहीं है। अशक्त परिकल्पना कि डेटा बिल्कुल सामान्य है इस श्रेणी में नहीं आता है।
अतिथि

1
(+1) यहाँ उत्कृष्ट सलाह है। एरिक, "उद्देश्य" के उपयोग ने मुझे बहुत परेशान किया, जब तक कि मुझे माइकल के अधिकार का एहसास नहीं हुआ: एक ही डेटा पर एक ही परीक्षण को सही ढंग से करने वाले दो लोगों को हमेशा एक ही पी-मूल्य मिलेगा, लेकिन वे एक ही क्यूक्यू प्लॉट की अलग-अलग व्याख्या कर सकते हैं। अतिथि: टाइप I त्रुटि के बारे में सावधानी नोट के लिए धन्यवाद। लेकिन हमें डेटा वितरण की परवाह क्यों नहीं करनी चाहिए? अक्सर यह दिलचस्प और मूल्यवान जानकारी होती है। मैं कम से कम यह जानना चाहता हूं कि क्या डेटा उन मान्यताओं के अनुरूप है जो मेरे परीक्षण उनके बारे में बना रहे हैं!
whuber

1
मैं दृढ़ता से असहमत हूँ। दोनों लोगों को समान क्यूक्यू-प्लॉट और समान पी-मूल्य मिलता है। पी-मूल्य की व्याख्या करने के लिए आपको नमूने के आकार को ध्यान में रखना चाहिए और आपके परीक्षण के लिए सामान्यता का उल्लंघन विशेष रूप से संवेदनशील है। इसलिए अपने पी-वैल्यू के साथ क्या करना है यह तय करना केवल व्यक्तिपरक है। पी-वैल्यू को पसंद करने का कारण यह है कि आप मानते हैं कि डेटा एक सामान्य वितरण का पालन कर सकता है - अन्यथा यह सिर्फ एक सवाल है कि पी-मूल्य नमूना आकार के साथ कितनी जल्दी गिरता है। जो अधिक है, एक सभ्य नमूना आकार दिया गया क्यूक्यू-प्लॉट बहुत अधिक समान दिखता है और अधिक नमूनों के साथ स्थिर रहता है।
एरिक

1
एरिक, मैं मानता हूं कि परीक्षण के परिणाम और ग्राफिक्स की व्याख्या की आवश्यकता है। लेकिन परीक्षा परिणाम एक संख्या है और इसके बारे में कोई विवाद नहीं होगा। QQ प्लॉट, हालांकि, कई विवरणों को स्वीकार करता है। हालाँकि प्रत्येक वस्तु सही ढंग से सही हो सकती है, पर ध्यान देने के लिए क्या पसंद है ... एक विकल्प। यही "व्यक्तिपरक" का अर्थ है: परिणाम विश्लेषक पर निर्भर करता है, न कि केवल प्रक्रिया। यही कारण है कि, उदाहरण के लिए, नियंत्रण चार्ट और सरकारी नियमों के रूप में विविध रूप में, जहां "निष्पक्षता" महत्वपूर्ण है, मानदंड संख्यात्मक परीक्षणों और कभी ग्राफ़िकल परिणामों पर आधारित नहीं हैं।
whuber

7

मुझे लगता है कि अधिकतम एन्ट्रापी दृष्टिकोण यहाँ उपयोगी हो सकता है। हम एक सामान्य वितरण असाइन कर सकते हैं क्योंकि हमारा मानना ​​है कि डेटा "सामान्य रूप से वितरित" है (जो भी इसका मतलब है) या क्योंकि हम केवल उसी चुंबकत्व के विचलन को देखने की उम्मीद करते हैं। इसके अलावा, क्योंकि सामान्य वितरण के पास केवल दो पर्याप्त आँकड़े हैं, यह डेटा में परिवर्तन के लिए असंवेदनशील है जो इन मात्राओं में परिवर्तन नहीं करते हैं। तो एक तरह से आप एक सामान्य वितरण को "औसत" के रूप में एक ही पहले और दूसरे क्षण के साथ सभी संभावित वितरणों के बारे में सोच सकते हैं। यह एक कारण प्रदान करता है कि क्यों कम से कम वर्गों को काम करना चाहिए


अवधारणाओं का अच्छा विवरण। मैं यह भी मानता हूं कि ऐसे मामलों में जहां इस तरह के वितरण मायने रखते हैं, डेटा के बारे में सोचना कहीं अधिक रोशन करने वाला है । हम मिश्रित मॉडल को फिट करने में उस सिद्धांत को लागू करते हैं। दूसरी ओर सांद्रता या अनुपात हमेशा तिरछे होते हैं। मैं जोड़ सकता हूं कि "सामान्य ... परिवर्तनों के प्रति असंवेदनशील है" का अर्थ है कि आप आकार / पैमाने में परिवर्तन के लिए अपरिवर्तनीय हैं।
एडम

7

मैं यह नहीं कहूंगा कि यह बेकार है, लेकिन यह वास्तव में आवेदन पर निर्भर करता है। ध्यान दें, आप वास्तव में कभी नहीं जानते हैं कि डेटा किस वितरण से आ रहा है, और आपके पास सभी प्राप्ति का एक छोटा सा सेट है। आपका नमूना माध्य हमेशा नमूने में परिमित होता है, लेकिन कुछ प्रकार के प्रायिकता घनत्व कार्यों के लिए इसका मतलब अपरिभाषित या अनंत हो सकता है। आइए हम तीन प्रकार के लेवी स्थिर वितरणों पर विचार करें। सामान्य वितरण, लेवी वितरण और कॉची वितरण। आपके अधिकांश नमूनों में पूंछ पर बहुत सारे अवलोकन नहीं होते हैं (यानी नमूना से दूर)। इसलिए आनुभविक रूप से तीनों में अंतर करना बहुत कठिन है, इसलिए कॉची (अपरिभाषित माध्य) और लेवी (अनंत अर्थ) आसानी से एक सामान्य वितरण के रूप में बहक सकते हैं।


1
"... अनुभव यह बहुत मुश्किल है ..." बहस करने लगता है के खिलाफ बजाय, के लिए , वितरणात्मक परीक्षण। यह एक पैराग्राफ में पढ़ने के लिए अजीब है जिसका परिचय बताता है कि वितरण परीक्षण के लिए वास्तव में उपयोग किए जाते हैं। तब, क्या आप वास्तव में यहाँ कहने की कोशिश कर रहे हैं?
whuber

3
मैं इसके खिलाफ हूं, लेकिन मैं यह भी कहना चाहता हूं कि यह बेकार है क्योंकि मैं बेकार परिदृश्यों के पूरे सेट को नहीं जानता। कई परीक्षण हैं जो सामान्य धारणा पर निर्भर करते हैं। यह कहना कि सामान्य परीक्षण बेकार है, अनिवार्य रूप से ऐसे सभी सांख्यिकीय परीक्षणों को डिबैंक कर रहा है जैसा कि आप कह रहे हैं कि आप सुनिश्चित नहीं हैं कि आप सही काम कर रहे हैं / कर रहे हैं। उस मामले में आपको यह नहीं करना चाहिए, आपको आंकड़ों के इस बड़े हिस्से को नहीं करना चाहिए।
२०:१६ पर कोलोंल

धन्यवाद। उस टिप्पणी में टिप्पणी आपके मूल उत्तर की तुलना में प्रश्न पर बेहतर रूप से केंद्रित लगती है! आप अपनी राय और सलाह को अधिक स्पष्ट करने के लिए किसी बिंदु पर अपने उत्तर को अद्यतन करने पर विचार कर सकते हैं।
whuber

@ कोई बात नहीं। क्या आप किसी एडिट की सिफारिश कर सकते हैं?
२०:२१ पर कोलोंल

आप दो पदों के संयोजन से शुरू कर सकते हैं - उत्तर और आपकी टिप्पणी - और फिर बाहर निकालने के बारे में सोचें (या किसी परिशिष्ट या स्पष्टीकरण के लिए पुनः आरोपित करना) किसी भी सामग्री जो स्पर्शरेखा हो सकती है। उदाहरण के लिए, अपरिभाषित के संदर्भ के रूप में अभी तक सवाल पर कोई स्पष्ट असर नहीं है और इसलिए यह कुछ हद तक रहस्यमय बना हुआ है।
whuber

7

मुझे लगता है कि पहले 2 प्रश्नों का अच्छी तरह से उत्तर दिया गया है, लेकिन मुझे नहीं लगता कि प्रश्न 3 को संबोधित किया गया था। कई परीक्षण अनुभवजन्य वितरण की तुलना एक ज्ञात परिकल्पित वितरण से करते हैं। कोल्मोगोरोव-स्मिरनोव परीक्षण के लिए महत्वपूर्ण मूल्य एफ पूरी तरह से निर्दिष्ट होने पर आधारित है। यह अनुमानित मापदंडों के साथ एक पैरामीट्रिक वितरण के खिलाफ परीक्षण करने के लिए संशोधित किया जा सकता है। इसलिए यदि फजीर का अर्थ दो से अधिक मापदंडों का आकलन करना है तो प्रश्न का उत्तर हां है। इन परीक्षणों को 3 पैरामीटर परिवारों या अधिक लागू किया जा सकता है। कुछ परीक्षणों को वितरण के एक विशिष्ट परिवार के खिलाफ परीक्षण करते समय बेहतर शक्ति प्राप्त करने के लिए डिज़ाइन किया गया है। उदाहरण के लिए जब एंडरसन-डार्लिंग या शापिरो-विल्क परीक्षण की सामान्यता का परीक्षण किया जाता है, तो केएस या ची वर्ग की तुलना में अधिक शक्ति होती है, जब अशक्त परिकल्पित वितरण सामान्य होता है।


5

परीक्षण जहां विश्लेषण के लिए "कुछ" महत्वपूर्ण है, उच्च पी-मूल्यों द्वारा समर्थित है, क्या मुझे लगता है कि गलत नेतृत्व किया गया है। जैसा कि दूसरों ने बताया, बड़े डेटा सेट के लिए, 0.05 से नीचे का पी-वैल्यू आश्वासन दिया गया है। तो, परीक्षण अनिवार्य रूप से छोटे और फजी डेटा सेट के लिए "पुरस्कार" और सबूत की कमी के लिए "पुरस्कार"। Qq भूखंडों की तरह कुछ और अधिक उपयोगी हैं। इस तरह से चीजों को तय करने के लिए कठिन संख्याओं की इच्छा हमेशा (हाँ / नहीं सामान्य / सामान्य नहीं) याद आती है कि मॉडलिंग आंशिक रूप से एक कला है और वास्तव में परिकल्पना का समर्थन कैसे किया जाता है।


2
यह रहता है कि एक बड़ा नमूना जो लगभग सामान्य है, कम पी-मूल्य होगा जबकि एक छोटा नमूना जो लगभग सामान्य नहीं है अक्सर नहीं होगा। मुझे नहीं लगता कि बड़े पी-वैल्यू उपयोगी हैं। फिर, वे सबूत की कमी के लिए पुरस्कृत करते हैं। मेरे पास कई मिलियन डेटा बिंदुओं के साथ एक नमूना हो सकता है, और यह लगभग हमेशा इन परीक्षणों के तहत सामान्यता की धारणा को खारिज कर देगा, जबकि एक छोटा नमूना नहीं होगा। इसलिए, मुझे लगता है कि वे उपयोगी नहीं हैं। अगर मेरी सोच त्रुटिपूर्ण है, तो कृपया इस बिंदु पर कुछ कटौतीत्मक तर्क का उपयोग करके दिखाएं।
wvguy8258

इस सवाल का जवाब बिल्कुल नहीं है।
लघुशंका

-2

सामान्यता परीक्षण का एक अच्छा उपयोग जो मुझे नहीं लगता कि उल्लेख किया गया है, यह निर्धारित करना है कि क्या जेड-स्कोर का उपयोग करना ठीक है। मान लें कि आपने जनसंख्या से एक यादृच्छिक नमूना चुना है, और आप जनसंख्या से एक यादृच्छिक व्यक्ति का चयन करने की संभावना को खोजना चाहते हैं और 80 या उससे अधिक मूल्य प्राप्त करना चाहते हैं। यह केवल तभी किया जा सकता है जब वितरण सामान्य हो, क्योंकि जेड-स्कोर का उपयोग करने के लिए, धारणा यह है कि जनसंख्या वितरण सामान्य है।

लेकिन फिर मुझे लगता है कि मैं इसे भी तर्कपूर्ण देख सकता हूं ...


किस का मूल्य? मतलब, राशि, विचरण, एक व्यक्तिगत अवलोकन? केवल अंतिम वितरण की अनुमानित सामान्यता पर निर्भर करता है।
whuber

मेरा मतलब था अलग
Hotaka

2
धन्यवाद। हालांकि आपका जवाब इतना अस्पष्ट है, हालांकि, यह बताना मुश्किल है कि आप किन प्रक्रियाओं का उल्लेख कर रहे हैं और यह आकलन करना असंभव है कि आपके निष्कर्ष मान्य हैं।
whuber

2
इस उपयोग के साथ समस्या अन्य उपयोगों की तरह ही है: परीक्षण नमूना आकार पर निर्भर करेगा, इसलिए, यह अनिवार्य रूप से बेकार है। यह आपको नहीं बताता है कि क्या आप z स्कोर का उपयोग कर सकते हैं।
पीटर Flom
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.