मेरे पास मॉडल है
जहाँ निर्भर चर है, और व्याख्यात्मक चर हैं, और पैरामीटर हैं और एक त्रुटि शब्द है। मेरे पास और पैरामीटर अनुमान हैं और इन अनुमानों का एक सहसंयोजक मैट्रिक्स है। अगर और काफी अलग हैं तो मैं कैसे परीक्षण करूं ?
मेरे पास मॉडल है
जहाँ निर्भर चर है, और व्याख्यात्मक चर हैं, और पैरामीटर हैं और एक त्रुटि शब्द है। मेरे पास और पैरामीटर अनुमान हैं और इन अनुमानों का एक सहसंयोजक मैट्रिक्स है। अगर और काफी अलग हैं तो मैं कैसे परीक्षण करूं ?
जवाबों:
इस परिकल्पना का आकलन करना कि और अलग हैं, null परिकल्पना (विकल्प के विपरीत ) 0 ) के परीक्षण के बराबर है ।
निम्नलिखित विश्लेषण presumes यह आप अनुमान लगाने के लिए के लिए उचित है के रूप में
का विचरण सहप्रसरण मैट्रिक्स के रूप में व्यक्त किया जा सकता है के के रूप में
जब है कम से कम वर्गों के साथ अनुमान है, एक आम तौर पर एक "टी परीक्षण," का उपयोग करता है वह यह है कि के वितरण
विशिष्ट होने के लिए, टी परीक्षण के पी-मूल्य द्वारा दिया जाता है
जहाँ छात्र t (संचयी) वितरण कार्य है। यह "पूंछ क्षेत्र:" का मौका है कि एक छात्र t चर ( डिग्री की स्वतंत्रता के) बराबर होता है या परीक्षण सांख्यिकीय के आकार से अधिक होता है,
आम तौर पर, संख्या के लिए और आप किसी भी परिकल्पना का परीक्षण करने के लिए बिल्कुल एक ही दृष्टिकोण का उपयोग कर सकते हैं
दो तरफा विकल्प के खिलाफ। (यह एक विशेष लेकिन व्यापक मामले शामिल हैं "विपरीत" ।) का उपयोग करें अनुमानित विचरण-सहप्रसरण मैट्रिक्स के विचरण का अनुमान लगाने के और आँकड़ों के लिए फार्म
पूर्वगामी मामला है और
यह सलाह सही है, यह जांचने के लिए, मैंने R
इस मॉडल के अनुसार डेटा बनाने के लिए निम्न कोड चलाया (सामान्य रूप से वितरित त्रुटियों के साथ e
), उन्हें फिट करें, और कई बार के मूल्यों की गणना करें । जांच यह है कि की संभावना की साजिश (माना गया छात्र टी वितरण के आधार पर) विकर्ण का बारीकी से अनुसरण करता है। यहाँ आकार के अनुकरण में है कि साजिश है जहाँ (एक बहुत छोटा डाटासेट, चुना क्योंकि वितरण सामान्य से दूर है) और
यहाँ कोड है।
#
# Specify the true parameters.
#
set.seed(17)
a <- -1/2
b <- -1/2
sigma <- 0.25 # Variance of the errors
n <- 5 # Sample size
n.sim <- 500 # Simulation size
#
# Specify the hypothesis.
#
H.0 <- c(1, -1) # Coefficients of `a` and `b`.
mu <- 0
#
# Provide x and z values in terms of their logarithms.
#
log.x <- log(rexp(n))
log.z <- log(rexp(n))
#
# Compute y without error.
#
y.0 <- exp(a * log.x + b * log.z)
#
# Conduct a simulation to estimate the sampling distribution of the t statistic.
#
sim <- replicate(n.sim, {
#
# Add the errors.
#
e <- rnorm(n, 0, sigma)
df <- data.frame(log.x=log.x, log.z=log.z, y.0, y=y.0 + e)
#
# Guess the solution.
#
fit.ols <- lm(log(y) ~ log.x + log.z - 1, subset(df, y > 0))
start <- coefficients(fit.ols) # Initial values of (a.hat, b.hat)
#
# Polish it using nonlinear least squares.
#
fit <- nls(y ~ exp(a * log.x + b * log.z), df, list(a=start[1], b=start[2]))
#
# Test a hypothesis.
#
cc <- vcov(fit)
s <- sqrt((H.0 %*% cc %*% H.0))
(crossprod(H.0, coef(fit)) - mu) / s
})
#
# Display the simulation results.
#
summary(lm(sort(sim) ~ 0 + ppoints(length(sim))))
qqplot(qt(ppoints(length(sim)), df=n-2), sim,
pch=21, bg="#00000010", col="#00000040",
xlab="Student t reference value",
ylab="Test statistic")
abline(0:1, col="Red", lwd=2)