सामान्य तौर पर, सीएलटी सन्निकटन अच्छा होने के लिए प्रत्येक नमूने का आकार 5 से अधिक होना चाहिए । अंगूठे का एक नियम आकार 30 या अधिक का एक नमूना है । लेकिन, आपके पहले उदाहरण की आबादी के साथ, 5 ठीक है।
pop <- c(4, 3, 5, 6, 5, 3, 4, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 5
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")
आपके दूसरे उदाहरण में, जनसंख्या वितरण के आकार के कारण (एक बात के लिए, यह बहुत अधिक तिरछा है; आदमी और Glen_b bellow द्वारा टिप्पणी पढ़ें ), यहां तक कि आकार 30 नमूने आपको वितरण के लिए एक अच्छा अनुमान नहीं देंगे नमूना CLT का उपयोग करता है।
pop <- c(4, 3, 5, 6, 5, 3, 10000000, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 30
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")
लेकिन, इस दूसरी आबादी के साथ, कहते हैं, आकार 100 ठीक हैं।
pop <- c(4, 3, 5, 6, 5, 3, 10000000, 2, 5, 4, 3, 6, 5)
N <- 10^5
n <- 100
x <- matrix(sample(pop, size = N*n, replace = TRUE), nrow = N)
x_bar <- rowMeans(x)
hist(x_bar, freq = FALSE, col = "cyan")
f <- function(t) dnorm(t, mean = mean(pop), sd = sd(pop)/sqrt(n))
curve(f, add = TRUE, lwd = 2, col = "red")