इस प्रकार की स्थिति को नेस्टेड मॉडल के लिए एक मानक एफ-परीक्षण द्वारा नियंत्रित किया जा सकता है । चूंकि आप तय मापदंडों के साथ एक अशक्त मॉडल के खिलाफ दोनों मापदंडों का परीक्षण करना चाहते हैं, आपकी परिकल्पनाएं हैं:
H0:β=[01]HA:β≠[01].
एफ-परीक्षण में दोनों मॉडल फिट करना और उनके अवशिष्ट योगों की तुलना करना शामिल है, जो हैं:
SSE0=∑i=1n(yi−xi)2SSEA=∑i=1n(yi−β^0−β^1xi)2
परीक्षण आँकड़ा है:
F≡F(y,x)=n−22⋅SSE0−SSEASSEA.
संबंधित पी-मान है:
p≡p(y,x)=∫F(y,x)∞F-Dist(r|2,n−2) dr.
आर में कार्यान्वयन: मान लीजिए कि आपका डेटा एक डेटा-फ़्रेम में है जिसे बुलाया DATA
चर के साथ बुलाया जाता है y
और x
। F-test को निम्न कोड के साथ मैन्युअल रूप से किया जा सकता है। मेरे द्वारा उपयोग किए गए नकली नकली डेटा में, आप देख सकते हैं कि अनुमानित गुणांक शून्य परिकल्पना में लोगों के करीब हैं, और परीक्षण का पी-मूल्य शून्य परिकल्पना को गलत साबित करने के लिए कोई महत्वपूर्ण सबूत नहीं दिखाता है कि सच्चा प्रतिगमन कार्य है पहचान समारोह।
#Generate mock data (you can substitute your data if you prefer)
set.seed(12345);
n <- 1000;
x <- rnorm(n, mean = 0, sd = 5);
e <- rnorm(n, mean = 0, sd = 2/sqrt(1+abs(x)));
y <- x + e;
DATA <- data.frame(y = y, x = x);
#Fit initial regression model
MODEL <- lm(y ~ x, data = DATA);
#Calculate test statistic
SSE0 <- sum((DATA$y-DATA$x)^2);
SSEA <- sum(MODEL$residuals^2);
F_STAT <- ((n-2)/2)*((SSE0 - SSEA)/SSEA);
P_VAL <- pf(q = F_STAT, df1 = 2, df2 = n-2, lower.tail = FALSE);
#Plot the data and show test outcome
plot(DATA$x, DATA$y,
main = 'All Residuals',
sub = paste0('(Test against identity function - F-Stat = ',
sprintf("%.4f", F_STAT), ', p-value = ', sprintf("%.4f", P_VAL), ')'),
xlab = 'Dataset #1 Normalized residuals',
ylab = 'Dataset #2 Normalized residuals');
abline(lm(y ~ x, DATA), col = 'red', lty = 2, lwd = 2);
summary
उत्पादन और plot
इस तरह इस डेटा देखने के लिए:
summary(MODEL);
Call:
lm(formula = y ~ x, data = DATA)
Residuals:
Min 1Q Median 3Q Max
-4.8276 -0.6742 0.0043 0.6703 5.1462
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.02784 0.03552 -0.784 0.433
x 1.00507 0.00711 141.370 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.122 on 998 degrees of freedom
Multiple R-squared: 0.9524, Adjusted R-squared: 0.9524
F-statistic: 1.999e+04 on 1 and 998 DF, p-value: < 2.2e-16
F_STAT;
[1] 0.5370824
P_VAL;
[1] 0.5846198