आपको यह पेपर मददगार लग सकता है (या कम से कम दिलचस्प):
http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf
UMass के शोधकर्ताओं ने वास्तव में एक अध्ययन किया जो आप पूछ रहे हैं। किस नमूने के आकार पर कुछ वितरित डेटा सीएलटी के कारण एक सामान्य वितरण का पालन करते हैं? जाहिरा तौर पर मनोविज्ञान प्रयोगों के लिए एकत्र किए गए बहुत सारे डेटा सामान्य रूप से वितरित किए जाने के आस-पास कहीं भी नहीं हैं, इसलिए अनुशासन उनके आंकड़ों पर कोई भी हस्तक्षेप करने के लिए CLT पर बहुत निर्भर करता है।
α = 0.05
Table 2. Percentage of replications that departed normality based on the KS-test.
Sample Size
5 10 15 20 25 30
Normal 100 95 70 65 60 35
Uniform 100 100 100 100 100 95
Bimodal 100 100 100 75 85 50
अजीब तरह से पर्याप्त है, सामान्य रूप से वितरित डेटा का 65 प्रतिशत 20 के एक नमूना आकार के साथ खारिज कर दिया गया था, और यहां तक कि 30, 35% के नमूने के आकार के साथ अभी भी खारिज कर दिया गया था।
फिर उन्होंने फ्लीशमैन की शक्ति विधि का उपयोग करते हुए कई भारी तिरछे वितरणों का परीक्षण किया:
Y= एक एक्स+ बी एक्स2+ सी एक्स3+ dएक्स4
X सामान्य वितरण से निकाले गए मूल्य का प्रतिनिधित्व करता है, जबकि a, b, c और d स्थिरांक हैं (ध्यान दें कि a = -c)।
उन्होंने 300 तक के नमूने के आकार के साथ परीक्षण चलाए
Skew Kurt A B C D
1.75 3.75 -0.399 0.930 0.399 -0.036
1.50 3.75 -0.221 0.866 0.221 0.027
1.25 3.75 -0.161 0.819 0.161 0.049
1.00 3.75 -0.119 0.789 0.119 0.062
उन्होंने पाया कि तिरछा और कर्ट (1.75 और 3.75) के उच्चतम स्तर पर जो कि 300 के नमूने के आकार का नमूना नहीं था, इसका मतलब है कि सामान्य वितरण के बाद।
दुर्भाग्य से, मुझे नहीं लगता कि यह वही है जो आप ढूंढ रहे हैं, लेकिन मैंने इस पर ठोकर खाई और इसे दिलचस्प पाया, और सोचा कि आप भी हो सकते हैं।