मैंने mbq के उत्तर पर निर्माण किया जो सभी संभावनाओं को खोज रहा था। इसके अलावा, मैं यह करता हूं:
- गुणांक महत्वपूर्ण हैं यह सुनिश्चित करने के लिए दो टुकड़ा मॉडल के महत्व के लिए जाँच करें
- पूर्ण मॉडल के लिए चुकता अवशिष्ट के योग के अंतर की जाँच करें
- मेरे मॉडल की पुष्टि करें (सुनिश्चित करें कि यह कुछ बकवास नहीं है)
क्यों महत्व की जाँच करें? ऐसा इसलिए है क्योंकि न्यूनतम एसएसई के साथ बिंदु व्यर्थ है यदि दोनों में से कोई भी टुकड़ा-टुकड़ा मॉडल डेटा को बहुत खराब तरीके से फिट करता है। यह स्पष्ट ब्रेकपॉइंट के बिना दो अत्यधिक सहसंबद्ध चर के लिए हो सकता है जहां ढलान बदलते हैं।
आइए इस सरल दृष्टिकोण को एक आसान परीक्षण के मामले में देखें:
x <- c(-50:50)
y <- abs(x)
plot(x,y,pch=19)
ब्रेकपॉइंट स्पष्ट रूप से शून्य है। निम्नलिखित आर स्क्रिप्ट का उपयोग करें:
f <- function(x, y)
{
d <- data.frame(x=x, y=y)
d <- d[order(x),]
r <- data.frame(k=rep(0,length(x)-4), sums=rep(0,length(x)-4))
plm <- function(i)
{
d1 <- head(d,i)
d2 <- tail(d,-i)
# Make sure we've divided the region perfectly
stopifnot(nrow(d1)+nrow(d2) == nrow(d))
m1 <- lm(y~x, data=d1)
m2 <- lm(y~x, data=d2)
r <- list(m1, m2)
r
}
lapply(2:(nrow(d)-3), function(i)
{
r$k[i-2] <<- d[i,]$x
# Fit two piecewise linear models
m <- plm(i)
# Add up the sum of squares for residuals
r$sums[i-2] <<- sum((m[[1]]$residuals)^2) + sum((m[[2]]$residuals)^2)
})
b <- r[which.min(r$sums),]
b
}
सभी संभावित संयोजनों के लिए उपयुक्त टुकड़े-टुकड़े रैखिक मॉडल:
f(x,y)
k sums
0 0
यदि हम दो इष्टतम मॉडल के लिए गुणांक की जांच करते हैं, तो वे अत्यधिक महत्वपूर्ण होंगे। उनकी R2 भी बहुत अधिक होगी।