मुझे लगता है कि इनमें से कई जवाब पूरी तरह से याद आते हैं। हाइताओ का जवाब कच्चे पॉलीओनियम्स को ढंकने के साथ कम्प्यूटेशनल समस्याओं को संबोधित करता है , लेकिन यह स्पष्ट है कि ओपी दो दृष्टिकोणों के बीच सांख्यिकीय अंतरों के बारे में पूछ रहा है । यही है, अगर हमारे पास एक संपूर्ण कंप्यूटर था जो सभी मूल्यों का प्रतिनिधित्व कर सकता है, तो हम दूसरे पर एक दृष्टिकोण क्यों पसंद करेंगे?
R2XYX=0X=0X
data("iris")
#Raw:
fit.raw <- lm(Petal.Length ~ Petal.Width + I(Petal.Width^2) +
I(Petal.Width^3), data = iris)
summary(fit.raw)
#> Coefficients:
#> Estimate Std. Error t value Pr(>|t|)
#> (Intercept) 1.1034 0.1304 8.464 2.50e-14 ***
#> Petal.Width 1.1527 0.5836 1.975 0.05013 .
#> I(Petal.Width^2) 1.7100 0.5487 3.116 0.00221 **
#> I(Petal.Width^3) -0.5788 0.1408 -4.110 6.57e-05 ***
#> ---
#> Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#>
#> Residual standard error: 0.3898 on 146 degrees of freedom
#> Multiple R-squared: 0.9522, Adjusted R-squared: 0.9512
#> F-statistic: 969.9 on 3 and 146 DF, p-value: < 2.2e-16
#Orthogonal
fit.orth <- lm(Petal.Length ~ stats::poly(Petal.Width, 3), data = iris)
#Marginal effect of X at X=0 from orthogonal model
library(margins)
summary(margins(fit.orth, variables = "Petal.Width",
at = data.frame(Petal.Width = 0)))
#> Warning in check_values(data, at): A 'at' value for 'Petal.Width' is
#> outside observed data range (0.1,2.5)!
#> factor Petal.Width AME SE z p lower upper
#> Petal.Width 0.0000 1.1527 0.5836 1.9752 0.0482 0.0089 2.2965
2019-10-25 को रेप्रेक्स पैकेज (v0.3.0) द्वारा बनाया गया
Petal.Width
ऑर्थोगोनल फिट से 0 पर सीमांत प्रभाव और इसकी मानक त्रुटि कच्चे बहुपद फिट से बिल्कुल समान हैं। ऑर्थोगोनल बहुपद का उपयोग करने से दो मॉडलों के बीच समान मात्रा के अनुमानों की सटीकता में सुधार नहीं होता है।
YXYX
library(jtools)
data("iris")
fit.raw3 <- lm(Petal.Length ~ Petal.Width + I(Petal.Width^2) +
I(Petal.Width^3), data = iris)
fit.raw1 <- lm(Petal.Length ~ Petal.Width, data = iris)
round(summ(fit.raw3, part.corr = T)$coef, 3)
#> Est. S.E. t val. p partial.r part.r
#> (Intercept) 1.103 0.130 8.464 0.000 NA NA
#> Petal.Width 1.153 0.584 1.975 0.050 0.161 0.036
#> I(Petal.Width^2) 1.710 0.549 3.116 0.002 0.250 0.056
#> I(Petal.Width^3) -0.579 0.141 -4.110 0.000 -0.322 -0.074
round(summ(fit.raw1, part.corr = T)$coef, 3)
#> Est. S.E. t val. p partial.r part.r
#> (Intercept) 1.084 0.073 14.850 0 NA NA
#> Petal.Width 2.230 0.051 43.387 0 0.963 0.963
fit.orth3 <- lm(Petal.Length ~ stats::poly(Petal.Width, 3),
data = iris)
fit.orth1 <- lm(Petal.Length ~ stats::poly(Petal.Width, 3)[,1],
data = iris)
round(summ(fit.orth3, part.corr = T)$coef, 3)
#> Est. S.E. t val. p partial.r part.r
#> (Intercept) 3.758 0.032 118.071 0 NA NA
#> stats::poly(Petal.Width, 3)1 20.748 0.390 53.225 0 0.975 0.963
#> stats::poly(Petal.Width, 3)2 -3.015 0.390 -7.735 0 -0.539 -0.140
#> stats::poly(Petal.Width, 3)3 -1.602 0.390 -4.110 0 -0.322 -0.074
round(summ(fit.orth1, part.corr = T)$coef, 3)
#> Est. S.E. t val. p partial.r part.r
#> (Intercept) 3.758 0.039 96.247 0 NA NA
#> stats::poly(Petal.Width, 3)[, 1] 20.748 0.478 43.387 0 0.963 0.963
2019-10-25 को रेप्रेक्स पैकेज (v0.3.0) द्वारा बनाया गया
0.0010.0030.0050.9270.9270.0200.0050.927। ऑर्थोगोनल बहुपद मॉडल से लेकिन कच्चे बहुपद मॉडल से नहीं, हम जानते हैं कि परिणाम में समझाया गया अधिकांश विचरण रैखिक शब्द के कारण होता है, जिसमें वर्ग शब्द बहुत कम होता है और घन शब्द से भी कम। कच्चे बहुपद मूल्य उस कहानी को नहीं बताते हैं।
अब, यदि आप चाहते हैं कि मॉडल के गुणांकों को समझने में सक्षम होने के अंतरिम लाभ पर यह व्याख्यात्मक लाभ हो, तो आपको रूढ़िवादी बहुपद का उपयोग करना चाहिए। यदि आप गुणांक को देखना पसंद करते हैं और वास्तव में जानते हैं कि उनका क्या मतलब है (हालांकि मुझे संदेह है कि आमतौर पर एक करता है), तो आपको कच्चे बहुपद का उपयोग करना चाहिए। यदि आप परवाह नहीं करते हैं (यानी, आप केवल भ्रमित या अनुमानित मूल्यों को नियंत्रित करना चाहते हैं), तो यह वास्तव में कोई फर्क नहीं पड़ता; दोनों रूप उन लक्ष्यों के संबंध में समान जानकारी रखते हैं। मैं यह भी तर्क दूंगा कि नियमितीकरण में ऑर्थोगोनल पॉलीओनियम्स को प्राथमिकता दी जानी चाहिए (उदाहरण के लिए, लासो), क्योंकि उच्च-क्रम की शर्तों को हटाने से निचले क्रम की शर्तों के गुणांक प्रभावित नहीं होते हैं, जो कच्चे बहुपद के साथ सच नहीं है
poly
ऑर्थोगोनल पॉलिनोमिअल्स के साथ कुछ करना है और मैं (एक्स ^ 2) नहीं करता (हालांकि मुझे विवरण नहीं पता है) - लेकिन फिर भी, आईएसएलआर के लेखक फिर ऐसी विधि की सिफारिश करेंगे जो काम न करे ? यह बहुत ही भ्रामक लगता है यदि दोनों कमांड ऐसा ही करते हैं, लेकिन वास्तव में केवल एक ही ठीक है।