नमूना वितरण सिखाने के लिए रणनीतियाँ


30

Tl; डॉ। संस्करण आप एक प्रारंभिक स्नातक स्तर पर नमूना वितरण (उदाहरण के लिए, नमूना उदाहरण के लिए) को पढ़ाने के लिए कौन सी सफल रणनीति अपनाते हैं?

पृष्ठ - भूमि

सितंबर में मैं डेविड मूर द्वारा द बेसिक प्रैक्टिस ऑफ़ स्टैटिस्टिक्स का उपयोग करते हुए द्वितीय वर्ष के सामाजिक विज्ञान (मुख्यतः राजनीति विज्ञान और समाजशास्त्र) के छात्रों के लिए एक परिचयात्मक सांख्यिकी पाठ्यक्रम पढ़ा रहा हूँ । यह पांचवीं बार होगा जब मैंने यह पाठ्यक्रम पढ़ाया है और एक मुद्दा जो मैंने लगातार लिया है वह यह है कि छात्रों ने वास्तव में नमूना वितरण की धारणा के साथ संघर्ष किया है । यह अनुमान के लिए पृष्ठभूमि के रूप में कवर किया गया है और संभावना के लिए एक मूल परिचय का अनुसरण करता है जिसके साथ उन्हें कुछ प्रारंभिक हिचकी के बाद परेशानी नहीं लगती है (और बुनियादी रूप से, मेरा मतलब बुनियादी है- आखिरकार, इन छात्रों में से कई को एक विशिष्ट पाठ्यक्रम स्ट्रीम में स्व-चयनित किया गया है क्योंकि वे "गणित" के अस्पष्ट संकेत के साथ कुछ भी बचने की कोशिश कर रहे थे)। मुझे लगता है कि शायद 60% न्यूनतम समझ के बिना पाठ्यक्रम को छोड़ देते हैं, लगभग 25% सिद्धांत को समझते हैं, लेकिन अन्य अवधारणाओं के कनेक्शन नहीं, और शेष 15% पूरी तरह से समझते हैं।

मुख्य मुद्दा

छात्रों को जो परेशानी होती है, वह आवेदन के साथ है। यह बताना मुश्किल है कि सटीक मुद्दा यह कहने के अलावा क्या है कि वे इसे प्राप्त नहीं करते हैं। एक पोल से मैंने अंतिम सेमेस्टर का आयोजन किया और परीक्षा प्रतिक्रियाओं से, मुझे लगता है कि कठिनाई का हिस्सा दो संबंधित और समान लगने वाले वाक्यांशों (नमूना वितरण और नमूना वितरण) के बीच भ्रम है, इसलिए मैंने "नमूना वितरण" वाक्यांश का उपयोग नहीं किया है अब, लेकिन निश्चित रूप से यह कुछ ऐसा है, जो पहली बार में भ्रमित करते हुए, आसानी से थोड़े से प्रयास के साथ समझ में आता है और वैसे भी यह नमूना वितरण की अवधारणा के सामान्य भ्रम की व्याख्या नहीं कर सकता है।

(मुझे पता है कि यह मेरे और मेरे शिक्षण हो सकता है कि इस मुद्दे पर है! हालांकि मुझे लगता है कि इस बात की अनदेखी करना उचित है क्योंकि ऐसा करना उचित है क्योंकि कुछ छात्र इसे प्राप्त करने लगते हैं और कुल मिलाकर हर कोई काफी अच्छा लगता है ...)

मैंने क्या कोशिश की है

मुझे कंप्यूटर लैब में अनिवार्य सत्र शुरू करने के लिए हमारे विभाग में अंडरग्रेजुएट एडमिनिस्ट्रेटर के साथ बहस करनी थी, यह सोचकर कि बार-बार प्रदर्शन मददगार हो सकते हैं (इससे पहले कि मैं इस कोर्स को सिखाना शुरू करूं, कोई कंप्यूटिंग शामिल नहीं थी)। जबकि मुझे लगता है कि यह सामान्य रूप से पाठ्यक्रम सामग्री की समग्र समझ में मदद करता है, मुझे नहीं लगता कि यह इस विशिष्ट विषय के साथ मदद की है।

एक विचार जो मेरे पास है, वह यह है कि इसे बिल्कुल नहीं पढ़ाया जाए या इसे अधिक वजन न दिया जाए, कुछ के द्वारा वकालत की गई स्थिति (जैसे एंड्रयू गेलमैन )। मुझे यह विशेष रूप से संतोषजनक नहीं लगता, क्योंकि इसमें सबसे कम सामान्य भाजक को पढ़ाने की कवायद है और इससे अधिक महत्वपूर्ण रूप से मजबूत और प्रेरित छात्रों को नकारना है जो वास्तव में समझने से सांख्यिकीय आवेदन के बारे में अधिक सीखना चाहते हैं कि कैसे महत्वपूर्ण अवधारणाएं काम करती हैं (न केवल नमूना वितरण! )। दूसरी ओर, मंझला छात्र उदाहरण के लिए पी-मानों को समझ लेता है, इसलिए शायद उन्हें नमूना वितरण को समझने की आवश्यकता नहीं है।

प्रश्न

नमूना वितरण को सिखाने के लिए आप क्या रणनीति अपनाते हैं? मैं जानता हूं कि ऐसी सामग्री और चर्चाएं उपलब्ध हैं (जैसे यहां और यहां और यह कागज जो एक पीडीएफ फाइल खोलता है ) लेकिन मैं सोच रहा हूं कि क्या मैं लोगों के लिए काम करने के कुछ ठोस उदाहरण प्राप्त कर सकता हूं (या मुझे लगता है कि क्या काम नहीं करता है इसलिए मैं इसे आज़माना नहीं जानता!)। मेरी योजना अब, जैसा कि मैंने सितंबर के लिए अपने पाठ्यक्रम की योजना बनाई है, जेलमैन की सलाह का पालन करना है और नमूना वितरण को "डेम्पहाज़ीज़" करना है। मैं इसे सिखाऊंगा, लेकिन मैं छात्रों को आश्वस्त करूंगा कि यह एक प्रकार का FYI- केवल विषय है और एक परीक्षा में नहीं आएगा (शायद बोनस प्रश्न के रूप में छोड़कर!)। हालांकि, मैं वास्तव में उन अन्य दृष्टिकोणों को सुनने में दिलचस्पी रखता हूं जो लोगों ने उपयोग किए हैं।


केंद्रीय सीमा प्रमेय दिखाने के लिए आप गैर-सामान्य जनसंख्या वितरण के साथ भी ऐसा कर सकते हैं
user41270

खेद है कि यह मेरे जवाब पर नीचे टिप्पणी होनी चाहिए थी।
user41270

जवाबों:


23

मेरी राय में, सैंपलिंग डिस्ट्रीब्यूशन 101 के प्रमुख विचार हैं। आप इस मुद्दे को छोड़ सकते हैं और साथ ही कोर्स को छोड़ सकते हैं। हालांकि, मैं इस तथ्य से बहुत परिचित हूं कि छात्र इसे प्राप्त नहीं करते, प्रतीत होता है कि आप क्या करते हैं। मेरे पास रणनीतियों की एक श्रृंखला है। इनमें बहुत समय लग सकता है, लेकिन मैं अन्य विषयों को छोड़ने / संक्षिप्त करने की सलाह देता हूं, ताकि यह सुनिश्चित हो सके कि उन्हें नमूना वितरण का विचार प्राप्त हो। यहाँ कुछ युक्तियाँ हैं:

  • इसे अलग तरीके से कहें: मैं पहली बार स्पष्ट रूप से उल्लेख करता हूं कि 3 अलग-अलग वितरण हैं जो हम संबंधित हैं: जनसंख्या वितरण, नमूना वितरण और नमूना वितरण। मैं इसे पूरे पाठ में कहता हूं, और फिर पूरे पाठ्यक्रम में। जब भी मैं ये शब्द कहता हूं मैं विशिष्ट अंत पर जोर देता हूं: sam- ple , samp- ling । (हां, छात्र इससे बीमार हो जाते हैं; उन्हें अवधारणा भी मिल जाती है।)
  • चित्रों का उपयोग करें (आंकड़े): मेरे पास मानक आंकड़े हैं जो मैं इस बारे में बात करने के लिए हर बार उपयोग करता हूं। इसमें तीन वितरण विशिष्ट रूप से चित्रित किए गए हैं, और आमतौर पर लेबल किए गए हैं। (इस आंकड़े के साथ जाने वाले लेबल पावरपॉइंट स्लाइड पर हैं और इसमें संक्षिप्त विवरण शामिल हैं, इसलिए वे यहां दिखाई नहीं देते हैं, लेकिन जाहिर है: शीर्ष पर जनसंख्या, फिर नमूने, फिर नमूना वितरण।)
    यहां छवि विवरण दर्ज करें
  • छात्रों को गतिविधियाँ दें: पहली बार जब आप इस अवधारणा को पेश करते हैं, या तो निकल्स के रोल में लाएं (कुछ तिमाहियों में गायब हो सकते हैं) या 6-पक्षीय पासा का एक गुच्छा। छात्रों को छोटे समूहों में बनाएँ और 10 मानों का एक समूह बनाएँ और उन्हें औसत करें। फिर आप बोर्ड पर या एक्सेल के साथ एक हिस्टोग्राम बना सकते हैं।
  • एनिमेशन (सिमुलेशन) का उपयोग करें: मैं डेटा उत्पन्न करने और कार्रवाई में प्रदर्शित करने के लिए R में कुछ (हास्य रूप से अक्षम) कोड लिखता हूं। जब आप केंद्रीय सीमा प्रमेय को समझाने के लिए संक्रमण करते हैं तो यह भाग विशेष रूप से सहायक होता है। ( Sys.sleep()बयानों पर ध्यान दें, ये चरण मुझे यह समझाने के लिए एक पल देते हैं कि प्रत्येक चरण में क्या हो रहा है।)
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • पूरे सेमेस्टर में इन अवधारणाओं को फिर से लिखें: मैं नमूना वितरण के विचार को हर बार फिर से लाता हूं जब हम अगले विषय के बारे में बात करते हैं (यद्यपि आमतौर पर केवल बहुत संक्षेप में)। इसके लिए सबसे महत्वपूर्ण स्थान वह है जब आप एनोवा सिखाते हैं, क्योंकि अशक्त परिकल्पना का मामला वास्तव में ऐसी स्थिति है जिसमें आप एक ही जनसंख्या वितरण से कई बार नमूना लेते हैं, और आपके समूह का सेट वास्तव में एक अनुभवजन्य नमूना वितरण है। (इसका एक उदाहरण के लिए, मेरा जवाब यहां देखें: मानक त्रुटि कैसे काम करती है? )

1
यह एक अच्छा उत्तर (+1) है। मुझे विशेष रूप से लगता है कि इस विषय को पढ़ाने के लिए गतिविधियाँ और सिमुलेशन बहुत उपयोगी हैं। एक परिचयात्मक पाठ्यक्रम में, मैंने कुछ बार पढ़ाया कि हमने एक वेब एपलेट का उपयोग किया, जिससे छात्रों को यह कल्पना करने की अनुमति मिली कि कैसे नमूना से आँकड़ों की गणना की जाती है और नमूना वितरण का हिस्टोग्राम आकार लेने लगता है जब आप इसे कई बार दोहराते हैं। मुझे लगता है कि जब मैंने नमूना वितरण वितरण को समझने की बात की तो छात्रों ने जो कुछ भी कहा, उससे कहीं अधिक गतिविधि में मदद मिली :)
मैक्रो

+1 धन्यवाद गंग, यह एक बहुत अच्छा जवाब है! "मुझे कोडज़ भेजने के लिए" भी धन्यवाद (nb। मैक उपयोगकर्ताओं के windows(...)साथ बदलें quartz(...))। सेमेस्टर भर में अवधारणा को फिर से लागू करने के बारे में आपकी बात विशेष रूप से उपयोगी है। मुझे लगता है कि इन दिशानिर्देशों का पालन करना वास्तव में उपयोगी होगा।
स्माइलीग

(+1) "3-वितरण" मंत्र के लिए, और संबंधपरक चित्र के लिए। कोई भी किसी अवधारणा को पहली समझ के बिना नहीं समझ सकता है कि यह वास्तव में एक अलग अवधारणा है।
एलेकोस पापाडोपोलोस

मैंने इसके लिए सैंपल वितरण पर राइस यूनिवर्सिटी के " ऑनलाइन स्टेट बुक " पेज को बहुत उपयोगी पाया है। मूल संस्करण, कई साल पुराना है, एक जावा एप्लेट को चित्रित किया गया है, लेकिन मुझे खुशी है कि उन्होंने हाल ही में इसे जावास्क्रिप्ट में रीमेक किया है। जिस तरह से यह काम करता है वह अनिवार्य रूप से आपके आरेख के समान है।
सिल्वरफिश

8

मुझे छात्रों को याद दिलाने के साथ कुछ किस्मत मिली है कि नमूना वितरण एक यादृच्छिक नमूने के आधार पर परीक्षण सांख्यिकीय का वितरण है । मेरे पास छात्रों को लगता है कि नमूना प्रक्रिया में क्या होगा स्वयं पक्षपाती था - चरम मामलों पर ध्यान केंद्रित करना। उदाहरण के लिए, "नमूना वितरण" कैसा दिखेगा यदि हमारी नमूना प्रक्रिया हमेशा एक ही (विशेष) सबसेट को चुने। तब मैं इस बात पर विचार करूंगा कि "नमूना वितरण" कैसा दिखेगा यदि हमारी नमूना प्रक्रिया ने केवल दो विशिष्ट (विशेष) सबसेट (प्रत्येक संभावना 1/2 के साथ) को चुना। ये सैंपल माध्य (विशेषकर अंतर्निहित आबादी के लिए "विशेष" के विशेष विकल्पों के लिए) के साथ काम करने के लिए बहुत सरल हैं।

मुझे लगता है कि कुछ (स्पष्ट रूप से सभी नहीं) छात्रों के लिए यह इस विचार के साथ मदद करता है कि नमूना वितरण जनसंख्या वितरण से बहुत अलग हो सकता है। मैंने केंद्रीय सीमा प्रमेय उदाहरण का भी उपयोग किया है जो माइकल चेरिक ने कुछ सफलता के साथ उल्लेख किया है - विशेष रूप से वितरण के साथ जो स्पष्ट रूप से सामान्य नहीं हैं (सिमुलेशन वास्तव में मदद करने लगते हैं)।


ग्राहम कुकसन के पास एक अच्छा कक्षा अभ्यास है जो एक जवाब के रूप में पोस्ट किया गया है "एक कठिन सांख्यिकीय अवधारणा के लिए आपके पसंदीदा आम आदमी की व्याख्या क्या है?" - एक समुदाय विकि।
shoda

+1, गैर-यादृच्छिक नमूनों का नमूना वितरण क्या होगा, इस बारे में बात करना एक अच्छा विचार है।
गंग -

+1 सबसे अच्छा विचार सब्मिट चयन के बारे में! मुझे लगता है कि यह वह कड़ी है जिसका आप @shoda से जिक्र कर रहे हैं: आंकड़े.stackexchange.com/a/554/9249
smillig

7

मैं संभावना के शिक्षण के साथ वापस शुरू करता हूं। मैं बहुत सी औपचारिक परिभाषाओं और नियमों में नहीं जाता (बस पर्याप्त समय नहीं है), लेकिन अनुकरण द्वारा संभावना दिखाते हैं। मोंटी हॉल समस्या का उपयोग करने के लिए एक शानदार उदाहरण है, मैं सिमुलेशन के माध्यम से दिखाता हूं (और फिर तर्क के साथ अनुवर्ती) कि स्विच करने की रणनीति जीतने की उच्च संभावना देती है। मैं बताता हूं कि सिमुलेशन द्वारा हम रणनीतियों का मूल्यांकन करने के लिए कई बार (जोखिम या इनाम के बिना) खेल खेलने में सक्षम थे और इससे हम बेहतर रणनीति चुन सकते हैं (यदि हम उस स्थिति में हैं)। बेहतर रणनीति का चयन एक जीत नहीं है, लेकिन यह हमें एक बेहतर मौका देता है और रणनीतियों के बीच चयन करने में मदद करता है। मैं फिर इंगित करता हूं कि यह शेष पाठ्यक्रम पर कैसे लागू होगा, यह हमें उन रणनीतियों को चुनने में मदद करेगा जहां एक यादृच्छिक घटक है,

फिर जब मैं नमूना वितरण शुरू करता हूं तो मैं फिर से सिमुलेशन के साथ शुरू करता हूं और कहता हूं कि हम रणनीति विकसित करना चाहते हैं। मोंटी हॉल समस्या की तरह, वास्तविक जीवन में हम केवल 1 नमूना लेने में सक्षम होंगे, लेकिन हम एक रणनीति विकसित करने में मदद करने के लिए नमूनों का एक गुच्छा अनुकरण कर सकते हैं। मैं तब एक ही जनसंख्या (इस मामले में ज्ञात जनसंख्या) से कई नमूनों के सिमुलेशन दिखाता हूं और उन रिश्तों को दिखाता हूं जो हम सिमुलेशन (नमूना साधन का हिस्टोग्राम) से सीखते हैं, अर्थात नमूना का मतलब सही अर्थ के आसपास क्लस्टर किया गया है (मतलब का मतलब है) , बड़े नमूनों के लिए नमूना वितरण के छोटे मानक विचलन, बड़े नमूनों के लिए अधिक सामान्य। पूरे समय मैं रणनीतियों का चयन करने के लिए सिमुलेशन के विचारों को दोहराने के बारे में बात करता हूं, बस मोंटी हॉल समस्या के रूप में एक ही विचार गेम शो के बजाय नमूना साधनों पर लागू होता है। मैं फिर आधिकारिक नियम दिखाता हूं और कहता हूं कि सिमुलेशन के अलावा उन्हें गणितीय रूप से साबित किया जा सकता है, लेकिन मैं पूरी कक्षा पर सबूत नहीं डालूंगा। मैं पेशकश करता हूं कि अगर वे वास्तव में गणितीय प्रमाण देखना चाहते हैं तो वे एक कार्यालय समय पर आ सकते हैं और मैं उन्हें गणित दिखाऊंगा (इंट्रो कक्षाओं में से किसी ने भी मुझे अभी तक इस पर नहीं लिया है)।

फिर जब हम अनुमान लगाते हैं तो मैं कहता हूं कि हम केवल वास्तविक दुनिया में 1 नमूना ले पाएंगे, जैसे हम केवल 1 बार (अधिकतम) खेल खेलते हैं, लेकिन हम उन रणनीतियों का उपयोग कर सकते हैं जो हमने अनुकरण से सीखे थे एक रणनीति विकसित करने के लिए कई नमूने (जेड-टेस्ट, टी-टेस्ट या सीआई फॉर्मूला) जो हमें चुने गए गुणों (सही होने का मौका) देगा। खेल के साथ की तरह, हम शुरू होने से पहले नहीं जानते हैं कि हमारा अंतिम निष्कर्ष सही होगा (और आमतौर पर हम अभी भी बाद में नहीं जानते हैं), लेकिन हम सिमुलेशन और नमूना वितरण से जानते हैं कि दीर्घकालिक संभावना क्या उपयोग कर रही है वह रणनीति।

क्या 100% छात्रों को एक सही समझ है? नहीं, लेकिन मुझे लगता है कि उनमें से अधिक को सामान्य विचार मिलता है कि हम सिमुलेशन और गणित के नियमों का उपयोग कर सकते हैं (कि उन्हें खुशी है कि उन्हें देखने की ज़रूरत नहीं है, बस एक रणनीति / सूत्र चुनने के लिए पुस्तक / प्रशिक्षक पर भरोसा करें) वांछित गुण।


+1 इस सलाह को साझा करने के लिए धन्यवाद। मुझे लगता है कि आपने इसे इस समस्या के साथ जोड़ा था कि नमूना वितरण क्या है, इसके बारे में हम क्या सिखा सकते हैं, जो कि एकल नमूने से अनुमान के अतिरिक्त कैसे हो सकते हैं। जैसा कि आपने (और अन्य लोगों ने) सुझाव दिया है, इस अवधारणा को पूरे पाठ्यक्रम में बार-बार जारी रखना महत्वपूर्ण है, लेकिन अक्सर ऐसा नहीं किया जाता है (कम से कम मेरे द्वारा नहीं, शायद इसलिए क्योंकि मुझे पहले से ही यह कठिन लगता है कि मैं हर चीज में फिट होना चाहता हूं,) पहले से ही कवर की गई अवधारणाओं को वापस लौटने दें!)।
स्माइलिग

3

यह आपकी ओर से एक बहुत महत्वपूर्ण और सुविचारित मुद्दा है। मुझे लगता है कि नमूना वितरण की अवधारणा समझ को समझने के लिए बुनियादी है और निश्चित रूप से सिखाई जानी चाहिए।

मैंने विशेष रूप से बायोस्टैटिस्टिक्स में कई परिचयात्मक सांख्यिकी पाठ्यक्रम पढ़ाए हैं। मैं नमूना वितरण की अवधारणा सिखाता हूं और दृष्टिकोण रखता हूं कि मुझे लगता है कि अच्छे हैं लेकिन वास्तव में यह निर्धारित करने के लिए अच्छी प्रतिक्रिया नहीं है कि मैं उनके साथ कितना सफल रहा हूं। वैसे भी यहाँ मैं क्या कर रहा हूँ।

पहले मैं एक सरल परिभाषा देने की कोशिश करता हूं। नमूना वितरण वह वितरण है जो नमूना प्रक्रिया को कई बार दोहराए जाने पर परीक्षण आँकड़ा होता है। यह जनसंख्या वितरण पर निर्भर करता है कि डेटा कहां से उत्पन्न होता है।

हालांकि मुझे लगता है कि यह सरल परिभाषा के बारे में है जैसा कि मैं दे सकता हूं मुझे एहसास है कि यह बहुत सरल नहीं है और अवधारणा की समझ ज्यादातर मामलों में तुरंत नहीं आएगी। तो इसे एक मूल उदाहरण के साथ पालन करें जो परिभाषा के साथ कही गई बातों को पुष्ट करता है।

मैं जिस उदाहरण का उपयोग करता हूं वह आकार n का एक नमूना है जो स्वतंत्र है और पहचान के साथ सामान्य वितरण के रूप में वितरित किया जाता है मतलब μ और विचरण sample तो नमूना का मतलब है जो कि अर्थ के लिए एक बिंदु अनुमान के रूप में उपयोग किया जाता है या परीक्षण सांख्यिकीय बनाने के लिए उपयोग किया जाता है मतलब के लिए एक नमूना वितरण है जो औसत μ और विचरण mean / n के साथ सामान्य है ।22

फिर मैं एक महत्वपूर्ण एप्लिकेशन, केंद्रीय सीमा प्रमेय के साथ इसका पालन करूंगा। सरलतम शब्दों में, केंद्रीय सीमा प्रमेय का कहना है कि कई वितरणों के लिए जो नमूना के लिए नमूना वितरण सामान्य नहीं हैं, नमूना आकार n बड़ा होने पर सामान्य वितरण के करीब होगा। यह वर्णन करने के लिए कि वर्दी की तरह वितरण को लें (एक बिमोडल वितरण भी देखने में अच्छा होगा) और यह दर्शाएं कि माध्य के लिए नमूना वितरण 3, 4, 5, 10 और 100 के नमूने के लिए कैसा दिखता है। छात्र यह देख सकता है कि कैसे वितरण की आकृति ऐसी चीज़ से बदलती है जो छोटे n के लिए बिल्कुल भी सामान्य नहीं लगती है जो कि बड़े n के लिए सामान्य वितरण की तरह बहुत कुछ दिखती है।

छात्र को यह समझाने के लिए कि इन नमूनों के वितरण में वास्तव में ये आकृतियाँ हैं, छात्रों ने विभिन्न आकारों के कई नमूनों की गणना करके सिमुलेशन का संचालन किया है और नमूना साधनों की गणना की है। तब उन्होंने माध्य के इन अनुमानों के लिए हिस्टोग्राम तैयार किए हैं। मैं एक भौतिक प्रदर्शन को लागू करने का सुझाव भी दूंगा जिसमें बताया गया है कि यह कैसे एक क्विनक्स बोर्ड का उपयोग करता है। यह करते समय आप इंगित करते हैं कि कैसे डिवाइस स्वतंत्र बर्नौली परीक्षणों के योग के नमूने उत्पन्न करता है जहां प्रत्येक स्तर पर बाएं या दाएं जाने की संभावना 1/2 के बराबर होती है। तल पर परिणामी ढेर इस नमूना वितरण (द्विपद) के लिए एक हिस्टोग्राम का प्रतिनिधित्व करते हैं और इसके आकार को क्विंक्स के तल पर बड़ी संख्या में गेंदों की भूमि के बाद लगभग सामान्य दिखने के लिए देखा जा सकता है,


बहुमूल्य सुझावों के लिए धन्यवाद। मैं वास्तव में एक वास्तविक शारीरिक प्रदर्शन के विचार को पसंद करता हूं और निश्चित रूप से कुछ इस तरह से लागू करने की कोशिश करूंगा (यह मानते हुए कि मैं उन्हें फेसबुक से लंबे समय तक विचलित कर सकता हूं ...), हालांकि स्वतंत्र बर्नौली परीक्षणों के योग का संबंध संभवतः उनके ऊपर थोड़ा सा है सिर! धन्यवाद।
स्माइलीग

1
लेकिन प्रयोग से सामान्य वितरण आकृति को देखना वास्तव में आंख खोलना है। मैंने पहली बार शिकागो में विज्ञान संग्रहालय में इनमें से एक को देखा था जब मैं एक बच्चा था (लगभग 10 वर्ष)। आँकड़ों के बारे में कुछ नहीं पता था, लेकिन कभी नहीं भूल गया वक्र।
माइकल आर। चेरिक

1

मुझे लगता है कि संख्याओं की 'आबादी' को एक बैग में रखना अच्छा होगा (उदाहरण के लिए 1-10 से)। आप अपनी खुद की टाइलें बना सकते हैं, या सिक्के, खेल कार्ड आदि का उपयोग कर सकते हैं।

छात्रों को समूहों में बैठने के लिए (5 या अधिक) और प्रत्येक बैग से एक नंबर चुनें। प्रत्येक समूह तब अपने समूह के लिए माध्य मान की गणना करता है। उन्हें बताएं कि पहले आपने आबादी का मतलब निकाला था, इसे हिस्टोग्राम पर प्लॉट किया था और प्रत्येक समूह के एक सदस्य को आने के लिए और इसके चारों ओर एक इतिहासग्राम पर अपने नमूने का मतलब बनाने के लिए प्राप्त किया था। उन्हें इस अंश को 'हिस्टोग्राम बनाने' के लिए कुछ समय के लिए प्राप्त करें।

फिर आप जनसंख्या के मतलब के आसपास नमूना साधनों में भिन्नता को रेखांकन करने में सक्षम होंगे। जनसंख्या के साधनों की तुलना में नमूने के विभिन्न प्रकारों में कार्य करना। मुझे लगता है कि छात्र इस तरह के एक व्यावहारिक अभ्यास को करने के लिए अलग से याद करते हैं और नमूना भिन्नता की अवधारणा परिणाम के रूप में और अधिक आसानी से उनके पास वापस आ जाएगी। यह थोड़ा बचकाना लग सकता है लेकिन छात्रों को कभी-कभी कुछ सक्रिय करने के लिए एक बदलाव की तरह होता है .... आंकड़ों में ऐसा करने के कई अवसर नहीं हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.