एक बड़े पर्याप्त नमूने के आकार के रूप में 30 का उपयोग करने के लिए किन संदर्भों का उल्लेख किया जाना चाहिए?


41

मैंने कई बार पढ़ा / सुना है कि कम से कम 30 इकाइयों के नमूने का आकार "बड़ा नमूना" माना जाता है (सामान्य अर्थ की धारणाएं आमतौर पर सीएलटी के कारण होती हैं, ...)। इसलिए, मेरे प्रयोगों में, मैं आमतौर पर 30 इकाइयों के नमूने उत्पन्न करता हूं। क्या आप मुझे कुछ संदर्भ दे सकते हैं जो नमूना आकार 30 का उपयोग करते समय उद्धृत किया जाना चाहिए?


2
उन मापदंडों की संख्या के संदर्भ के बिना जिन्हें आप अनुमान लगाने की कोशिश करते हैं, या समकक्ष जिस तरह के मॉडल के साथ आप काम कर रहे हैं, यह आपको स्पष्ट जवाब देने के बजाय कठिन लगता है।
CHL

2
छोटे और बड़े नमूनों की सीमा के रूप में n = 30 की स्वीकृति किसी भी सांख्यिकीय तकनीक द्वारा अच्छी तरह से समर्थित नहीं है।
जिबोल

जवाबों:


37

छोटे और बड़े नमूनों के बीच की सीमा के लिए n = 30 का विकल्प केवल अंगूठे का एक नियम है। बड़ी संख्या में किताबें हैं जो इस मूल्य को उद्धृत करती हैं (लगभग), उदाहरण के लिए, हॉग और टैनिस की संभाव्यता और सांख्यिकीय अनुमान (7e) "25 या 30 से अधिक" कहते हैं।

उस ने कहा, मुझे बताई गई कहानी यह थी कि केवल 30 को एक अच्छी सीमा माना गया था क्योंकि यह एक पृष्ठ पर अच्छी तरह से फिट होने के लिए पाठ्यपुस्तकों के पीछे स्टूडेंट की टी टेबल के लिए बनाई गई थी । कि, और महत्वपूर्ण मान (छात्र के टी और सामान्य के बीच ) केवल 0.25 तक ही बंद हो जाते हैं, वैसे भी, df = 30 से df = अनंत तक। हाथ की गणना के लिए अंतर वास्तव में मायने नहीं रखता था।

आजकल 15 दशमलव स्थानों पर सभी प्रकार की चीजों के लिए महत्वपूर्ण मानों की गणना करना आसान है। इसके शीर्ष पर हमारे पास पुनरुत्थान और क्रमपरिवर्तन के तरीके हैं, जिसके लिए हम पैरामीट्रिक जनसंख्या वितरण तक सीमित नहीं हैं।

व्यवहार में मैं कभी भी n = 30 पर भरोसा नहीं करता। डेटा प्लॉट करें। यदि आप चाहें, तो एक सामान्य वितरण का निपटान करें। सामान्य रूप से आकलन करें कि क्या एक सामान्य सन्निकटन उचित है (और पूछें कि क्या सन्निकटन की वास्तव में आवश्यकता है)। यदि अनुसंधान के लिए नमूने उत्पन्न करना और एक सन्निकटन अनिवार्य है, तो सन्निकटन को वांछित (या कम्प्यूटेशनल रूप से निकट के रूप में) के करीब बनाने के लिए पर्याप्त नमूना आकार उत्पन्न करें ।


13
यहाँ पर एक पृष्ठ है कि t वितरण का सामान्य सन्निकटन n = 30 के लिए कितना अच्छा है। johndcook.com/normal_approx_to_t.html
जॉन डी। कुक

41

दरअसल, "मैजिक नंबर" 30 एक पतन है। याकूब के कोहेन के रमणीय पेपर को देखें, चीजें जो मैंने सीखी हैं (बहुत दूर) (Am। Psych। दिसंबर 1990 45 # 12, पीपी 1304-1312) । यह मिथक उसका पहला उदाहरण है कि "कुछ चीजें जो आप सीखते हैं, वे इतनी नहीं हैं"।

[ओ] मेरे साथी डॉक्टरेट उम्मीदवारों ने प्रति समूह केवल २० मामलों का नमूना लेकर एक शोध प्रबंध किया है। ... [L] ater मैंने खोजा ... कि दो-स्वतंत्र-समूह-माध्य तुलना के लिए प्रति समूह के साथ पवित्र दो पूंछ स्तर पर, संभावना है कि एक मध्यम आकार के प्रभाव को लेबल किया जाएगा जितना महत्वपूर्ण ... एक टी परीक्षण केवल था । इस प्रकार, यह लगभग एक सिक्का फ्लिप था कि क्या कोई महत्वपूर्ण परिणाम प्राप्त करेगा, भले ही वास्तविकता में, प्रभाव का आकार सार्थक था। ... [मेरा मित्र] निरर्थक परिणामों के साथ समाप्त हुआ - जिसके साथ वह मनोविश्लेषणात्मक सिद्धांत की एक महत्वपूर्ण शाखा को ध्वस्त करने के लिए आगे बढ़ा।n=30.05.47


2
सुंदर संदर्भ - और प्रासंगिक पर हाजिर। धन्यवाद।
whuber

1
@whuber क्या आपको याद है कि यह कौन सा पेपर था? लिंक अब तक टूट गया है। हो सकता है कि यह psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , "चीजें मैंने सीखी हैं (बहुत दूर)"? टूटे हुए लिंक के URL में वर्ष एक से मेल खाता है।
अमीबा का कहना है कि मोनिका

1
@Amoeba जब मैंने इसे पढ़ा तो मैंने इस पेपर को सहेजा, इसलिए मैं पुष्टि कर सकता हूं कि आपने जो पाया है वह अभीष्ट है। मैंने आपके लिंक के साथ एक उद्धरण शामिल करने के लिए इस उत्तर को अपडेट किया है।
whuber

@Carlos Accioly मैंने इसे नए लिंक के साथ अपडेट किया है क्योंकि पिछले एक को तोड़ दिया गया था।
अक्षय बंसल

9

IMO, यह सब इस बात पर निर्भर करता है कि आप अपने नमूने का क्या उपयोग करना चाहते हैं। दो "मूर्खतापूर्ण" उदाहरणों का मतलब है कि मेरा क्या मतलब है: यदि आपको किसी मतलब का अनुमान लगाने की आवश्यकता है, तो 30 अवलोकन पर्याप्त से अधिक हैं। यदि आपको 100 भविष्यवाणियों के साथ एक रैखिक प्रतिगमन का अनुमान लगाने की आवश्यकता है, तो 30 अवलोकन पर्याप्त के करीब नहीं होंगे।


9

ज्यादातर मनमाने ढंग से शासन करना। यह कथन सत्य होने के लिए कई कारकों पर निर्भर करता है। उदाहरण के लिए डेटा के वितरण पर। यदि डेटा उदाहरण के लिए एक कॉची से आता है, तो भी 30 ^ 30 अवलोकनों का मतलब अनुमान लगाने के लिए पर्याप्त नहीं है (उस मामले में भी टिप्पणियों की एक अनंत संख्या पैदा करने के लिए पर्याप्त नहीं होगी अभिसार करना)। यह संख्या (30) भी गलत है यदि आपके द्वारा खींचे गए मूल्य एक दूसरे से फिर से स्वतंत्र नहीं हैं (फिर, आपके पास हो सकता है कि नमूना आकार की परवाह किए बिना कोई अभिसरण न हो)।μ¯(n)

आम तौर पर, CLT को धारण करने के लिए अनिवार्य रूप से दो स्तंभों की आवश्यकता होती है:

  1. यह यादृच्छिक चर स्वतंत्र हैं: कि आप किसी भी जानकारी को खोए बिना अपनी टिप्पणियों को फिर से आदेश दे सकते हैं *।
  2. यह rv दूसरे क्षणों के वितरण के साथ आता है: इसका मतलब है कि माध्य और sd के शास्त्रीय अनुमानक नमूना वृद्धि के रूप में अभिसरण करते हैं।

(इन दोनों स्थितियों को कुछ हद तक कमजोर किया जा सकता है, लेकिन मतभेद काफी हद तक सैद्धांतिक प्रकृति के हैं)


6
आपका उदाहरण मजबूत आंकड़ों के मूल्य को दर्शाता है। नमूना मंझला अच्छी तरह से एक कॉची वितरण का स्थान पैरामीटर का अनुमान है। एक तर्क दे सकता है कि 30 नमूनों के साथ एक टी-टेस्ट का उपयोग करने में सबसे कमजोर लिंक टी-टेस्ट है, न कि 30 नमूने।
जॉन डी। कुक

1
जॉन:> "कोई यह तर्क दे सकता है कि 30 नमूनों के साथ एक टी-टेस्ट का उपयोग करने में सबसे कमजोर लिंक टी-टेस्ट है, न कि 30 नमूने"। बहुत सच है, और यह भी धारणा है कि डेटा iid है । इसके अलावा, माध्य कॉले के लिए MLE है जिसका वितरण यादृच्छिक चर (और इसलिए कुशल) किया जाता है, लेकिन सामान्य तौर पर आपको अधिक अवलोकन की आवश्यकता हो सकती है।
user603

1
सीएलटी के सभी संस्करण पहचान योग्य रूप से वितरित होने पर निर्भर नहीं हैं, न ही स्वतंत्रता भी। बुनियादी तौर पर पढ़ाए जाने वाले बुनियादी काम अक्सर करते हैं, लेकिन ऐसे संस्करण हैं जो दोनों धारणाओं को नहीं बनाते हैं जैसे कि ल्यपुनोव सीएलटी स्वतंत्रता को मानता है लेकिन समान वितरण नहीं है, और स्वतंत्रता की स्थिति को भी आराम दिया जा सकता है, उदाहरण के लिए यहां देखें । वह as रीक्रोडिंग ’चीज भी आजादी जैसी नहीं है। निर्भरता के कुछ रूप आदेश पर निर्भर नहीं होते हैं।
ग्लेन_ बी

2
एक लॉग-सामान्य वितरण के माध्यम के लिए एक आत्मविश्वास अंतराल की गणना करने के लिए CLT के लिए एक नमूना आकार 50,000 अच्छी तरह से पर्याप्त काम करने के लिए अपर्याप्त है।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.