चर और रैखिक रूप से स्वतंत्र नहीं हैं। तो भले ही कोई द्विघात प्रभाव जोड़ने है, मॉडल के लिए की अनुमानित प्रभाव को संशोधित करेगा ।एक्स 2 एक्स 2 एक्सएक्सएक्स2एक्स2एक्स
चलो एक बहुत ही सरल सिमुलेशन के साथ एक नज़र है।
> x <- runif(1e3)
> y <- x + rnorm(length(x))
> summary(lm(y~x))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.03486 0.06233 -0.559 0.576
x 1.05843 0.10755 9.841 <2e-16 ***
अब फिट होने के लिए मॉडल में एक द्विघात शब्द के साथ।
> summary(lm(y~x+I(x^2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.03275 0.09528 0.344 0.731
x 0.65742 0.44068 1.492 0.136
I(x^2) 0.39914 0.42537 0.938 0.348
बेशक ओम्निबस परीक्षण अभी भी महत्वपूर्ण है, लेकिन मुझे लगता है कि हम जो परिणाम देख रहे हैं वह यह नहीं है। समाधान ऑर्थोगोनल पॉलीओनियम्स का उपयोग करना है।
> summary(lm(y~poly(x,2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.49744 0.03098 16.059 <2e-16 ***
poly(x, 2)1 9.63943 0.97954 9.841 <2e-16 ***
poly(x, 2)2 0.91916 0.97954 0.938 0.348
ध्यान दें कि x
पहले मॉडल और poly(x,2)1
दूसरे मॉडल में गुणांक समान नहीं हैं, और यहां तक कि इंटरसेप्ट भी अलग हैं। ऐसा इसलिए है क्योंकि poly
ऑर्थोनॉमिक वेक्टर्स उद्धार करते हैं, जो वेक्टर के लिए ऑर्थोगोनल भी हैं rep(1, length(x))
। इसलिए poly(x,2)1
नहीं x
बल्कि (x -mean(x))/sqrt(sum((x-mean(x))**2))
...
एक महत्वपूर्ण बिंदु यह है कि वाल्ड परीक्षण, इस अंतिम मॉडल में, स्वतंत्र हैं। आप ऑर्थोगोनल पॉलीओनियम्स का उपयोग यह तय करने के लिए कर सकते हैं कि आप किस हद तक जाना चाहते हैं, बस वाल्ड टेस्ट को देखकर: यहां आप नहीं बल्कि रखने का फैसला करते हैं । बेशक आप पहले दो फिट मॉडल की तुलना करके एक ही मॉडल पाएंगे, लेकिन यह इस तरह से सरल है - यदि आप उच्च डिग्री तक जाने पर विचार करते हैं, तो यह वास्तव में बहुत सरल है।एक्स 2एक्सएक्स2
एक बार जब आप तय कर लेते हैं कि कौन सी शर्तें रखनी हैं, तो आप व्याख्या के लिए या भविष्यवाणी के लिए कच्चे बहुपद और वापस जाना चाह सकते हैं ।एक्स 2एक्सएक्स2