क्या 20 नंबर का जादू है?


12

मेरे पास ऐसे संदर्भ हैं जो डेटा फिटिंग वितरण के लिए न्यूनतम 20 के नमूने के आकार पर विचार करने की सलाह देते हैं।

क्या इसमें कोई समझदारी है?

धन्यवाद


3
सामान्य तौर पर, विशिष्ट स्थितियों में हो सकता है। क्या आपके पास संदर्भ हैं और आपके लक्ष्य क्या हैं?
image_doctor

1
मैं @image_doctor से सहमत हूँ - कोई सामान्य कारण नहीं है कि 20 टिप्पणियों को न्यूनतम माना जाए; यह बहुत विशेष परिस्थितियों में मामला हो सकता है।
Glen_b -Reinstate Monica

3
एक एकल मान कुछ व्यावहारिक मामलों में काम करेगा, जैसे कि जब वितरण ज्ञात हो (निश्चितता के साथ) पॉइसन हो और अवलोकन एक बड़ी गिनती है। न केवल यह कि वितरण को फिट होने की अनुमति देता है, बल्कि इसके पैरामीटर के आकलन में संभावित त्रुटि का भी आकलन करता है।
व्हिबर er

1
मेरा मानना ​​है कि मैंने यह भी पढ़ा है कि सामान्य वितरण के लिए, 30 नियम-अंगूठा है। मुझे लगता है कि यह कुछ संबंधित था कि आजादी के 30 डिग्री के साथ एक छात्र का टी कितना सामान्य है। लेकिन यह सिर्फ एक नियम है। यह उसी अर्थ में जादू नहीं है कि का मूल्य है। e
वेन

1
हां, 20 एक जादू की संख्या है: en.wikipedia.org/wiki/Magic_number_%28physics%29
बिटवाइज़

जवाबों:


13

इसका अधिकांश भाग अपेक्षित वितरण और आपके शोध प्रश्न पर निर्भर करता है। अंगूठे के नियम के रूप में, आपको अंगूठे के नियमों से सावधान रहना चाहिए। यदि आप अपेक्षित वितरण जानते हैं, तो विभिन्न आकारों के कुछ सिमुलेशन चलाएं और निर्धारित करें कि नमूना सिमुलेशन वास्तविक वितरण को कितनी बार दर्शाते हैं। यह आपको अंतिम आवश्यक नमूना आकार के रूप में कुछ मार्गदर्शन देना चाहिए।


चरम और हठधर्मिता के स्पष्ट स्टीयरिंग के लिए +1।
whuber

1
+1 के कारण "अंगूठे के नियम के रूप में, आपको अंगूठे के नियमों से सावधान रहना चाहिए।"
वोल्फगैंग

7

मुझे लगा कि सैंपल साइज मैजिक नंबर 1,000 है। अमेरिका के अधिकांश राष्ट्रीय चुनावों में, लगभग 3% की त्रुटि का उत्पादन करने के लिए: , वास्तव में, प्रभावी प्रभावी आकार कम हैं 1,000 से अधिक, 700 या अधिक की तरह, चयन और गैर-प्रतिक्रिया समायोजन की असमान संभावना के कारण, 3.7% की त्रुटि के मार्जिन के लिए अग्रणी।

z0.9750.50.5/1000=1.960.158=0.031

सिर्फ 20 टिप्पणियों के साथ, आप तकनीकी रूप से तिरछापन और कुर्तोसिस के बहुत उच्च मूल्यों को प्राप्त नहीं कर सकते हैं (नमूना मानक विचलन द्वारा सामान्यीकृत, निश्चित रूप से):

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.
यदि आप क्षणों की विधि से वितरण का फिटिंग कर रहे हैं, तो आप स्पष्ट रूप से एक तार्किक वितरण नहीं कह सकते हैं जो कि 1 के बराबर लॉग के यथोचित विशिष्ट रूपांतर के साथ है (मध्यम-से-उच्च आय असमानता वाले देशों में आय वितरण; यूएस, ब्राजील, दक्षिण अफ्रीका; रूस में सभी में लॉग-इन आयतों का अधिक विचरण होता है), क्योंकि इसमें 111 का आश्चर्यजनक रूप से बड़ा कर्टोसिस है। बेशक, यह मूर्खतापूर्ण तरीके से क्षणों के वितरण द्वारा फिट किया जाएगा, लेकिन मैं सिर्फ यह दिखाना चाहता था कि कुछ वास्तविक दुनिया के इरादे होंगे संभावना 20 टिप्पणियों के साथ वर्णित की तुलना में अधिक जटिल हो सकती है।

वितरण फिटिंग पर एक और विचार कर्नेल घनत्व अनुमान के माध्यम से लिया जा सकता है: आकार के नमूने के लिए , सबसे लोकप्रिय नियम की बैंडविड्थ देता है जो गॉसियन कर्नेल का उपयोग करके पूरे वितरण को प्रभावी ढंग से फैलाता है। दूसरे शब्दों में, आकार 20 के अधिकांश नमूने सामान्य दिखेंगे यदि आप उनके चारों ओर कर्नेल घनत्व अनुमान लगाते हैं, जब तक कि उनके पास स्पष्ट रूप से एक उल्लेखनीय कर्टोसिस नहीं होता है (जिसका अर्थ होगा कि कुछ अवलोकनीय अवलोकन हैं जो कर्नेल घनत्व पर अलग धक्कों के रूप में दिखाई देंगे। भूखंड)।n=20

h=1.06σ^n1/5=0.58σ^

मैं नमूनों के क्षणों में सीमाओं की प्रासंगिकता का पालन नहीं करता हूं। बेशक आप एक नमूने में तिरछापन और कुर्तोसिस के बेहद उच्च अनुमान प्राप्त कर सकते हैं। यह प्रयास करें: जब नमूना मतलब है और नमूना एसडी, तो तिरछापन अनुमान जब एक lognormal वितरण में क्षणों मिलान है । एक बड़े ज्यामितीय एसडी ( काम करेगा) के साथ वितरण से का एक नमूना बनाएं और आपको तिरछा होने का बहुत बड़ा अनुमान मिलेगा। तो क्या होगा अगर कच्चा नमूना तिरछा छोटा है? s ( s / m ) ( 3 + ( s / m ) 2 ) 20 2ms(s/m)(3+(s/m)2)202
whuber

1
1000 के नमूने के आकार (प्रोग्रामिंग से संबंधित आंकड़ों के संदर्भ में, लेकिन यह कहीं और लागू होता है) के रूप में उपयोग करने के संदर्भ में "पावर-ऑफ-टेन सिंड्रोम" के लिए अप्रचलित लिंक
गैरी एस। वीवर्स

1
@ जब भी, आप बहुत चालाक हैं, कोई अपराध नहीं है। अधिकांश लोग तिरछापन की गणना डेटा के क्षण के रूप में करेंगे, न कि एक पैरामीट्रिक धारणा के माध्यम से जैसा आपने अभी किया था। अब, अगर मैंने कहा कि "मान लीजिए कि आप पियर्सन वितरण को क्षणों में विधि द्वारा फिट कर रहे हैं" - तो क्या यह तर्क प्रासंगिक होगा?
StasK

हां, यह कई मामलों में प्रासंगिक होगा। मैंने क्षणों की विधि का उपयोग करते हुए एक सामान्य वितरण को फिट करने के लिए आपके सुझाव का पालन किया और एक बड़ी विषमता प्राप्त की - कोई आश्चर्य नहीं। ऐसा इसलिए है क्योंकि मैंने केवल पहले दो क्षणों का मिलान किया था, तीसरे को ऐसा होने दिया। अगर मुझे दो या उससे कम मापदंडों के किसी भी वितरण परिवार के साथ एक ही प्रक्रिया का पालन करना था जो मनमाने ढंग से बड़े तीसरे क्षणों की अनुमति देता है, मुझे लगता है कि मैं एक ही घटना देखूंगा। पियर्सन परिवार के साथ, जिसमें दो से अधिक पैरामीटर हैं, हम संभवतः अनुभवजन्य तिरछीता से मेल खाने की कोशिश करेंगे, जिससे उनका मूल्य सीमित होगा।
whuber

2

नहीं। दूर से नहीं।

इसके बारे में इस तरह से सोचें: यदि आपके पास एक बिलियन-डायमेंशनल स्पेस (मानवता) था और आपने जो भी विधि (20 लोग) का उपयोग करके 20 सैंपल निकाले हैं, तो क्या आप जानकारी का उपयोग करके उन्हें ग्रह के हर व्यक्ति के बारे में अच्छी तरह समझ सकते हैं? दूर से नहीं। मिल्की वे आकाशगंगा में 100 बिलियन तारे हैं। उनमें से 20 (बेतरतीब ढंग से) उठाकर आप सभी को गेलेक्टिक खगोल विज्ञान समझ सकते हैं? बिल्कुल नहीं।

1-डी स्पेस में अंगूठे के कुछ मान्य नियम हैं, जो ज्यादातर वैध नियमों की मदद कर सकते हैं, जो यह वर्णन करते हैं कि आप कितने माप लेना चाहते हैं। उनमें उपयोगिता और औचित्य की अलग-अलग डिग्री शामिल हैं, लेकिन कुछ अर्थों में "20" की तुलना में अधिक अच्छी तरह से बचाव किया गया है। उनमें "आपके फिट समीकरण में प्रति चर 5 माप", "गाऊसी घनत्व फ़ंक्शन के कम से कम 35 नमूने", और "एक द्विपद फ़ंक्शन के कम से कम 300 नमूने" शामिल हैं। वास्तविक सांख्यिकीविद् और मेरे जैसा कोई बेवकूफ-बमवर्षक नहीं, विशेष सिद्धांतों और अनिश्चितताओं को पहले सिद्धांतों और एक कैलकुलेटर के बिना संबद्ध करने में सक्षम होगा।

यदि आप अपने फिट समीकरण में "प्रति पैरामीटर 5 माप" के नियम का उपयोग करते हैं और आप एक 2 डिमेन्सिवली कर्व्ड बाय-क्यूबिक सतह के संचयी घनत्व को ऊंचाइयों के वितरण के संदर्भ में फिट करना चाहते हैं, तो आपके पास एक अंतर्निहित सिस्टम है जो , एक घन से 5 वीं क्रम के बहुपद का अनुपात। इसमें 6 + 4 = 10 गुणांक होंगे। यदि आप प्रति पैरामीटर 2 मापों का उपयोग करके या 20 मापों का उपयोग करके अपने 10 पैरामीटर मानों को फिट करने की कोशिश कर रहे हैं, तो आप इस अनुमान का उल्लंघन करेंगे। यह अनुमानी न्यूनतम 10 * 5 = 50 माप की सिफारिश करता है।a3r3+a2r2+a1r+a0a1r+a0dr

कृपया याद रखें कि "सर्वश्रेष्ठ" एक अच्छा विचार है, जिसमें "अच्छाई का माप" नहीं है। सबसे अच्छा रास्ता क्या है? यदि आप अपने कयामत पर जा रहे हैं, तो शायद बहुत लंबा और सुखद। यदि आप अपने स्वयं के राज्याभिषेक के लिए जा रहे हैं, तो शायद एक छोटा और शानदार। यदि आप रेगिस्तान के माध्यम से चल रहे हैं, एक शांत छायादार। "सर्वश्रेष्ठ" नमूनों की संख्या क्या है? यह इतनी आश्चर्यजनक रूप से आपकी समस्या पर निर्भर है कि इससे पहले प्राधिकरण के साथ इसका जवाब नहीं दिया जा सकता है। उन सभी को? जितने हो सकते हैं? जो केवल थोड़ा सा समझ में आता है। हां यह आंशिक रूप से मृत या गर्भवती होने जैसा है। आंशिक रूप से निरर्थक होना एक बहुत ही कम परिभाषित समस्या का परिणाम है।

यदि आप एक विमान पर एयरफ्लो का सटीक पूर्वानुमान लगाने की कोशिश कर रहे हैं? बॉल-पार्क में जाने के लिए आपको कई मिलियन मापों की आवश्यकता हो सकती है। यदि आप जानना चाहते हैं कि आप कितने लंबे हैं, तो एक या दो काम कर सकते हैं।

यह "स्पेस को फैलाने" और "उन स्थानों पर नमूने लेने के महत्वपूर्ण बिंदुओं को नहीं लाता है जो पैरामीटर अनुमानों में विचरण को कम करते हैं" लेकिन सवाल यह है कि एक अधिक नए स्तर का उत्तर प्रासंगिक होगा। इन चीजों को लागू करने से पहले समस्या की प्रकृति के बारे में अधिक जानना आवश्यक है।

नोट: प्रति सुझावों में सुधार करने के लिए संपादित किया गया।


1
आपको लगता है कि "न्यूनतम" प्रश्न को "अधिकतम" या "पर्याप्त" के रूप में पढ़ा गया है। आपके द्वारा लिखा गया कुछ भी अंगूठे के न्यूनतम-नियम के विपरीत नहीं प्रतीत होता है।
whuber

2
@ शुभंकर, मैं उन लोगों के बीच काम करता हूं जो सोचते हैं कि अतिरिक्त माप महंगे हैं, और अगर मैं उन्हें "नमूनों की न्यूनतम संख्या" प्रदान करता हूं, तो वे इसे एक असमानता के रूप में नहीं मानते हैं जहां नमूनों की संभावित संख्या इससे अधिक है। वे इसे लागत को कम करने की एक अनुकूलन समस्या के लिए सीमा के रूप में सोचते हैं, और केवल उस मूल्य पर काम करने की कोशिश करते हैं। यह मेरे पर्यावरण का उत्पाद है।
एंग्रीस्टूडेंट

1

शायद उस संदर्भ के लिए जहां आप टी-टेस्ट या एनोवा कर रहे हैं - बुनियादी सांख्यिकीय अनुप्रयोगों में एक बहुत ही सामान्य संदर्भ - यह नमूना आकार के आसपास है जिसे आपको प्रत्येक समूह के लिए आवश्यक है ताकि प्रत्येक समूह के औसत होने में बहुत अधिक आत्मविश्वास हो। सामान्य रूप से वितरित (केंद्रीय सीमा प्रमेय के अनुसार) जब वितरण को कम या ज्यादा unimodal माना जा सकता है और अत्यंत चरम पर नहीं। बीस और उन्नीस या इक्कीस नहीं क्योंकि यह एक गोल संख्या है।


0

विषय पर कुछ लेख (पृष्ठ के मध्य में सलाह अनुभाग में) के लिए रसेल लैंथ के पावर एंड सैंपल साइज़ पेज की जाँच करें ।

आपके नमूने में व्यक्तियों की न्यूनतम संख्या जनसंख्या के आकार के अनुसार बेतहाशा भिन्न होती है, आयामों की संख्या (यदि आप श्रेणियों में डेटा को विभाजित कर रहे हैं) और उपाय (यदि आप नमूने के बारे में लगातार उपाय कर रहे हैं) जो आप ले रहे हैं, का आकार आपका ब्रह्मांड, विश्लेषण की तकनीक जिसे आप उपयोग करने का इरादा रखते हैं (यह एक बहुत ही महत्वपूर्ण बिंदु है - तकनीक को अध्ययन की योजना के दौरान या प्रयोगात्मक डिजाइन के दौरान परिभाषित किया गया है , कभी नहीं), और पिछले अध्ययनों द्वारा दिखाए गए जटिलता।

और 20 "दुर्लभ बीमारियों" और "प्रायोगिक मनोविज्ञान" (पॉपर के रूप में परिभाषित अपने काम में परिभाषित) के विषयों के बाहर किसी भी गंभीर शोध के लिए पर्याप्त नहीं है।

नीचे दिए गए टिप्पणियों के आधार पर उत्तर को परिष्कृत करना:

और 20 "दुर्लभ बीमारियों" और "प्रायोगिक मनोविज्ञान" (पॉपर के रूप में अपने काम में परिभाषित) के विषयों के बाहर किसी भी गंभीर शोध के लिए पर्याप्त नहीं है जिसमें एक संभावना वितरण शामिल है

और नहीं, आपको एक बड़े नमूने के आकार को प्राप्त करने के लिए लोगों को जहर नहीं रखना चाहिए। कॉमन सेंस और अनुक्रमिक टेस्ट आपको रोकने का आदेश देते हैं।


3
मुझे लगता है कि एक कंबल बयान देने के लिए यह बहुत चरम है कि 20 का एक नमूना "किसी भी गंभीर शोध के लिए पर्याप्त नहीं है।" यह आपके पहले के बयानों का खंडन करता है कि उपयुक्त नमूना आकार उद्देश्य, जनसंख्या, और इसी तरह बदलता रहता है। कुछ मामलों में एक गलत परिणाम पूरे सिद्धांत को मारने के लिए पर्याप्त है।
whuber

1
केस अध्ययन और गुणात्मक अनुसंधान 1-5 प्रतिभागियों के साथ ठीक कर सकते हैं।
बहकाद

ठीक है, "केस स्टडीज़" और "फ़ोकस ग्रुप्स" को सूची में जोड़ें :) ये उन बातों में शामिल हैं जिन्हें मैंने कहा था कि पॉपर को "प्रायोगिक मनोविज्ञान" थियो कहा जाता है।
लुकास गैलिंडो

4
आपने तब खगोल विज्ञान, चिकित्सा, जीव विज्ञान, रसायन विज्ञान को बेहतर ढंग से जोड़ा था ... दूसरे शब्दों में, यह कहना उतना ही बुरा है कि 20 "पर्याप्त नहीं है" जैसा कि यह कहना है कि यह काफी अच्छा है। दरअसल, यह शायद बदतर है। एक खाद्य सुरक्षा परीक्षण की कल्पना करें, जिसमें पहले आठ विषयों को पोषण के पूरक के रूप में प्रशासित किया गया था, जो अप्रत्याशित दुष्प्रभावों से मर गए। क्या आप अपने "20 पर्याप्त नहीं है" कथन के आधार पर परीक्षण जारी रखने की वकालत करेंगे?
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.