कच्चा या रूढ़िवादी बहुपद प्रतिगमन?


22

मैं पर एक चर करना चाहता हूं । क्या मुझे कच्चे या रूढ़िवादी बहुपद का उपयोग करना चाहिए? मैंने इनसे निपटने वाली साइट पर प्रश्न देखा, लेकिन मुझे वास्तव में समझ नहीं आया कि इनका उपयोग करने में क्या अंतर है। yx,x2,,x5

क्यों मैं सिर्फ गुणांक पाने के लिए एक "सामान्य" प्रतिगमन ऐसा नहीं कर सकते की y = Σ 5 मैं = 0 β मैं एक्स मैंβiy=i=05βixi (पी मूल्यों और सभी अन्य अच्छा सामान के साथ) और बदले चिंता है कि कच्चे या रूढ़िवादी बहुपद का उपयोग कर रहे हैं? यह चुनाव मुझे लगता है कि मैं जो करना चाहता हूं, उसके दायरे से बाहर हूं।

वर्तमान में मैं जिस स्टेट बुक में पढ़ रहा हूं (टिबशिरानी एट अल द्वारा आईएसएलआर) इन बातों का उल्लेख नहीं किया गया था। दरअसल, उन्हें एक तरह से नीचा दिखाया गया था।
इसका कारण AFAIK है, कि lm()R में फ़ंक्शन में, y ~ poly(x, 2)ऑर्थोगोनल पॉलीओनियम्स का उपयोग y ~ x + I(x^2)करने के लिए मात्रा का उपयोग करना और कच्चे लोगों का उपयोग करने के लिए मात्रा का उपयोग करना है। लेकिन पीपी 116 पर लेखक कहते हैं कि हम पहले विकल्प का उपयोग करते हैं क्योंकि उत्तरार्द्ध "बोझिल" है जो कोई संकेत नहीं छोड़ता है कि ये आदेश वास्तव में पूरी तरह से अलग चीजों के लिए हैं (और परिणाम के रूप में अलग-अलग आउटपुट हैं)।
(तीसरा प्रश्न) आईएसएलआर के लेखक अपने पाठकों को इस तरह भ्रमित क्यों करेंगे?


1
@ साइकोरेक्स मुझे पता है कि polyऑर्थोगोनल पॉलिनोमिअल्स के साथ कुछ करना है और मैं (एक्स ^ 2) नहीं करता (हालांकि मुझे विवरण नहीं पता है) - लेकिन फिर भी, आईएसएलआर के लेखक फिर ऐसी विधि की सिफारिश करेंगे जो काम न करे ? यह बहुत ही भ्रामक लगता है यदि दोनों कमांड ऐसा ही करते हैं, लेकिन वास्तव में केवल एक ही ठीक है।
l7ll7

1
@gung मैंने polyइस समस्या के दस्तावेज़ीकरण को देखा और पहले से ही कुछ समय बिताया, लेकिन मैं यह पता नहीं लगा सकता कि पाली (x, 2) और x + I (x ^ 2) से क्या फर्क पड़ता है? क्या आप मुझे टिप्पणी में यहाँ बता सकते हैं, यदि प्रश्न ऑफटॉपिक है?
l7ll7

1
@ गुंग ने मैंने अपने प्रश्न का पूरा पुन: संपादन किया। यह पसंद कच्ची / रूढ़िवादी मुझे और भी भ्रमित कर रही है - पहले मैंने सोचा था कि यह सिर्फ एक छोटी सी Rतकनीकी थी, जो मुझे समझ में नहीं आई, लेकिन अब यह एक फुलब्लॉक स्टेट समस्या लगती है जो मुझे एक प्रतिगमन कोडिंग करने में बाधा डालती है जो कि नहीं होनी चाहिए कोड करना मुश्किल है।
l7ll7

2
@ गुंग ने वास्तव में मेरी मदद की तुलना में इसे अधिक भ्रमित किया। पहले मैंने सोचा था कि मुझे सिर्फ ऑर्थोगोनल पॉलीओनियम्स के साथ जाना चाहिए, क्योंकि यह सही तरीका प्रतीत होता है, लेकिन उस उत्तर में कच्चे पॉलीमोनियल का उपयोग किया जाता है। आश्चर्यजनक रूप से, नेट पर हर कोई "आरटीएफएम" चिल्ला रहा है, लेकिन वास्तव में स्पष्ट उत्तर नहीं है कि कब क्या उपयोग करना है। (आपका लिंक भी इसका जवाब नहीं देता, बस एक उदाहरण है, जब ऑर्थ। पोल। गलत हो)
l7ll7

2
जब तक आप कुछ भौतिक या इंजीनियरिंग डोमेन में काम कर रहे हैं, जो बताता है कि प्रतिक्रिया क्विंटिक बहुपद होगी, लगभग निश्चित रूप से सही दृष्टिकोण पहली जगह में बहुपद प्रतिगमन करने के लिए नहीं है। स्वतंत्रता की अपनी सीमा को एक ऐसी सीमा या किसी ऐसी चीज में निवेश करें जो बहुपदीय फिट की तुलना में कहीं अधिक लचीली और स्थिर हो।
whuber

जवाबों:


10

मेरा मानना ​​है कि उत्तर संख्यात्मक स्थिरता के बारे में कम है (हालांकि यह एक भूमिका निभाता है) और सहसंबंध को कम करने के बारे में अधिक है।

संक्षेप में - यह मुद्दा इस तथ्य पर उबलता है कि जब हम उच्च क्रम के बहुपदों के एक समूह के खिलाफ फिर से संगठित होते हैं, तो हम जिस कोविरेट्स के खिलाफ उच्च सहसंबद्ध हो जाते हैं। नीचे दिए गए उदाहरण कोड:

x = rnorm(1000)
raw.poly = poly(x,6,raw=T)
orthogonal.poly = poly(x,6)
cor(raw.poly)
cor(orthogonal.poly)

यह काफी महत्वपूर्ण है। जैसा कि कोवरिएट्स अधिक सहसंबद्ध हो जाते हैं, हमारी निर्धारित करने की क्षमता जो महत्वपूर्ण हैं (और उनके प्रभावों का आकार क्या है) तेजी से मिटता है। इसे आमतौर पर मल्टीकोलिनरिटी की समस्या के रूप में जाना जाता है। सीमा पर, अगर हमारे पास दो चर थे जो पूरी तरह से सहसंबद्ध थे, जब हम उन्हें किसी चीज के खिलाफ फिर से हासिल करते हैं, तो दोनों के बीच अंतर करना असंभव है - आप इसे समस्या का चरम संस्करण मान सकते हैं, लेकिन यह समस्या हमारे अनुमानों को प्रभावित करती है सहसंबंध की कम डिग्री भी। इस प्रकार एक वास्तविक अर्थ में - भले ही संख्यात्मक अस्थिरता एक समस्या नहीं थी - उच्च क्रम के बहुपद से संबंध हमारे अनुमान रूटीन को जबरदस्त नुकसान पहुंचाता है। यह बड़े मानक त्रुटियों (और इस तरह छोटे टी-आँकड़े) के रूप में प्रकट होगा जिसे आप अन्यथा देखेंगे (नीचे उदाहरण प्रतिगमन देखें)।

y = x*2 + 5*x**3 - 3*x**2 + rnorm(1000)
raw.mod = lm(y~poly(x,6,raw=T))
orthogonal.mod = lm(y~poly(x,6))
summary(raw.mod)
summary(orthogonal.mod)

यदि आप इस कोड को चलाते हैं, तो व्याख्या एक स्पर्श कठिन है क्योंकि गुणांक सभी बदल जाते हैं और इसलिए चीजों की तुलना करना कठिन है। टी-आँकड़ों को देखते हुए, हम देख सकते हैं कि गुणांक निर्धारित करने की क्षमता ऑर्थोगोनल पॉलीओनियम्स के साथ बड़ी थी। 3 प्रासंगिक गुणांकों के लिए, मुझे ऑर्थोगोनल मॉडल के लिए (560,21,449) के टी-आँकड़े मिले, और कच्चे बहुपद मॉडल के लिए केवल (28, -38,121)। यह एक साधारण मॉडल के लिए केवल कुछ अपेक्षाकृत कम क्रम बहुपद शब्दों के साथ एक बड़ा अंतर है जो मायने रखता है।

यह कहना नहीं है कि यह लागत के बिना आता है। ध्यान में रखने के लिए दो प्राथमिक लागत हैं। 1) हम ऑर्थोगोनल पॉलीओनियम्स के साथ कुछ व्याख्या खो देते हैं। हम यह समझ सकते हैं कि गुणांक का x**3मतलब क्या है, लेकिन गुणांक की व्याख्या करना x**3-3x(तीसरा हेर्माइट पॉली - जरूरी नहीं कि आप क्या उपयोग करेंगे) बहुत कठिन हो सकता है। दूसरा - जब हम कहते हैं कि ये बहुपद हैं तो ऑर्थोगोनल हैं - हमारा मतलब है कि वे ऑर्थोगोनल हैं जो दूरी के कुछ माप के संबंध में हैं। आपकी स्थिति के लिए प्रासंगिक दूरी का एक उपाय चुनना मुश्किल हो सकता है। हालांकि, यह कहते हुए कि, मेरा मानना ​​है कि polyफ़ंक्शन को इस तरह के चुनने के लिए डिज़ाइन किया गया है कि यह सहसंयोजक के संबंध में ऑर्थोगोनल है - जो रैखिक रेजिमेंट्स के लिए उपयोगी है।


3
-1। निचले क्रम के गुणांक पर आपके द्वारा देखी जाने वाली बड़ी मानक त्रुटियां एक लाल हेरिंग है। आपके दो मॉडलों में निचले क्रम गुणांक पूरी तरह से अलग चीजों का अनुमान लगा रहे हैं, इसलिए उनकी मानक त्रुटियों की तुलना करना कोई मतलब नहीं है। उच्चतम आदेश गुणांक दोनों मॉडलों में एक ही बात का अनुमान लगाने वाला है, और आप देखेंगे कि टी स्टेटिस्टिक समान है कि क्या बहुपद ओर्थोगोनल हैं या नहीं। आपके दो मॉडल फिट किए गए मूल्यों, आर ^ 2, आदि के संदर्भ में सांख्यिकीय रूप से समकक्ष हैं, वे मुख्य रूप से गुणांक की व्याख्या में भिन्न होते हैं
जेक वेस्टफॉल

@JakeWestfall, मुझे नहीं लगता कि मैं आपसे सहमत हूँ। सबसे पहले, कोड को चलाने से उन मूल्यों का उत्पादन होता है जो बहुपद के सभी आदेशों के लिए अलग-अलग होते हैं, सभी नहीं बल्कि एक - एक के रूप में यह बहुपद लेता है और उस पर पीसीए करता है। दूसरे, और अधिक महत्वपूर्ण बात, टी-आँकड़े काफी भिन्न हैं - मेरे उत्तर में कोड को चलाने से यह पुष्टि होगी कि - कार्यात्मक रूप से हम बहु-विषयक समस्या का समाधान कर रहे हैं। आप सही हैं कि फिट किए गए मान, आर ^ 2, एफ-परीक्षण आदि नहीं बदलते हैं। यह वास्तव में रूढ़िवादी होने का एक कारण है - यह बहुपद शब्दों का पता लगाने की हमारी क्षमता को छोड़कर कुछ भी नहीं बदलता है ।
user5957401

1
पुन: पहला बिंदु, क्षमा करें, मेरा मतलब उच्चतम-ऑर्डर अवधि की टी-स्टेट को संदर्भित करना था, न कि इसके गुणांक को। उस भविष्यवक्ता को मॉडल के बीच ढाल दिया जाता है + स्थानांतरित किया जाता है, इसलिए हाँ कोफ बदल जाता है, लेकिन यह उसी मूल प्रभाव का परीक्षण करता है, जैसा कि टी
जेक वेस्टफॉल

पुन: दूसरे बिंदु, कारण "टी-आँकड़े काफी भिन्न हैं" निचले-क्रम की शर्तों के लिए फिर से है, क्योंकि वे दो मॉडलों में पूरी तरह से अलग चीजों का अनुमान लगा रहे हैं। रैखिक प्रभाव पर विचार करें: raw.modइसमें x = 0 पर वक्र के ढलान का अनुमान है, orthogonal.modयह सीमांत ढलान का अनुमान लगाता है (यानी, lm(y ~ poly(x,1))जहां उच्च-क्रम की शर्तों को छोड़ दिया जाता है)। कोई कारण नहीं है कि इन पूरी तरह से अलग-अलग अनुमानों के अनुमानों में तुलनीय मानक त्रुटियां होनी चाहिए। एक आसानी से एक काउंटर-उदाहरण का निर्माण कर सकता है जहां raw.modबहुत अधिक टी-आँकड़े हैं
जेक वेस्टफॉल

@JakeWestfall। मुझे अभी भी लगता है कि आप मल्टीकोलिनरिटी को याद कर रहे हैं। हालाँकि, हम एक-दूसरे से बात करते हुए प्रतीत होते हैं, और शायद एक समाधान है। आप कहते हैं कि आप आसानी से एक काउंटर-उदाहरण का निर्माण कर सकते हैं, कृपया। मुझे लगता है कि आपके मन में जो dgp है उसे देखकर मेरे लिए बहुत कुछ स्पष्ट होगा। फिलहाल मैं केवल वही चीजें ले सकता हूं जिनके साथ आप व्यवहार कर सकते हैं जैसा कि आप वर्णन करते हैं कि इसमें गंभीर मॉडल मिसकैरेज शामिल है।
user5957401

8

मैं गुणांक प्राप्त करने के लिए सिर्फ "सामान्य" प्रतिगमन क्यों नहीं कर सकता?

क्योंकि यह संख्यात्मक रूप से स्थिर नहीं है। याद रखें कि कंप्यूटर फ्लोट संख्या का प्रतिनिधित्व करने के लिए बिट की निश्चित संख्या का उपयोग कर रहा है। विवरण के लिए IEEE754 की जांच करें , आप आश्चर्यचकित हो सकते हैं कि सरल संख्या , कंप्यूटर को इसे 0.4000000059604644775390625 के रूप में संग्रहीत करने की आवश्यकता है । आप यहाँ अन्य संख्याएँ आज़मा सकते हैं0.40.4000000059604644775390625

कच्चे बहुपद का उपयोग करने से समस्या होगी क्योंकि हमारे पास बड़ी संख्या होगी। यहाँ एक छोटा सा सबूत है: हम कच्चे और ऑर्थोगोनल बहुपद के साथ मैट्रिक्स स्थिति संख्या की तुलना कर रहे हैं ।

> kappa(model.matrix(mpg~poly(wt,10),mtcars))
[1] 5.575962
> kappa(model.matrix(mpg~poly(wt,10, raw = T),mtcars))
[1] 2.119183e+13

आप एक उदाहरण के लिए यहां मेरे उत्तर की जांच भी कर सकते हैं।

उच्च-क्रम बहुपद के लिए बड़े गुणांक क्यों हैं


6
आप एकल परिशुद्धता फ़्लोट्स का उपयोग कर रहे हैं और उन्हें सटीक परिशुद्धता के लिए उद्धृत कर रहे हैं! ये कैसे हो गया? जीपीयू को छोड़कर, लगभग सभी सांख्यिकीय गणना में कम से कम दोहरी परिशुद्धता का उपयोग होता है। जैसे, Rके आउटपुट में print(0.4, digits=20)है 0.40000000000000002
whuber

6

मुझे लगता है कि इनमें से कई जवाब पूरी तरह से याद आते हैं। हाइताओ का जवाब कच्चे पॉलीओनियम्स को ढंकने के साथ कम्प्यूटेशनल समस्याओं को संबोधित करता है , लेकिन यह स्पष्ट है कि ओपी दो दृष्टिकोणों के बीच सांख्यिकीय अंतरों के बारे में पूछ रहा है । यही है, अगर हमारे पास एक संपूर्ण कंप्यूटर था जो सभी मूल्यों का प्रतिनिधित्व कर सकता है, तो हम दूसरे पर एक दृष्टिकोण क्यों पसंद करेंगे?

R2XYX=0X=0X

data("iris")

#Raw:
fit.raw <- lm(Petal.Length ~ Petal.Width + I(Petal.Width^2) +
                  I(Petal.Width^3), data = iris)
summary(fit.raw)

#> Coefficients:
#>                  Estimate Std. Error t value Pr(>|t|)    
#> (Intercept)        1.1034     0.1304   8.464 2.50e-14 ***
#> Petal.Width        1.1527     0.5836   1.975  0.05013 .  
#> I(Petal.Width^2)   1.7100     0.5487   3.116  0.00221 ** 
#> I(Petal.Width^3)  -0.5788     0.1408  -4.110 6.57e-05 ***
#> ---
#> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#> 
#> Residual standard error: 0.3898 on 146 degrees of freedom
#> Multiple R-squared:  0.9522, Adjusted R-squared:  0.9512 
#> F-statistic: 969.9 on 3 and 146 DF,  p-value: < 2.2e-16

#Orthogonal
fit.orth <- lm(Petal.Length ~ stats::poly(Petal.Width, 3), data = iris)

#Marginal effect of X at X=0 from orthogonal model
library(margins)
summary(margins(fit.orth, variables = "Petal.Width", 
                at = data.frame(Petal.Width = 0)))
#> Warning in check_values(data, at): A 'at' value for 'Petal.Width' is
#> outside observed data range (0.1,2.5)!
#>       factor Petal.Width    AME     SE      z      p  lower  upper
#>  Petal.Width      0.0000 1.1527 0.5836 1.9752 0.0482 0.0089 2.2965

2019-10-25 को रेप्रेक्स पैकेज (v0.3.0) द्वारा बनाया गया

Petal.Widthऑर्थोगोनल फिट से 0 पर सीमांत प्रभाव और इसकी मानक त्रुटि कच्चे बहुपद फिट से बिल्कुल समान हैं। ऑर्थोगोनल बहुपद का उपयोग करने से दो मॉडलों के बीच समान मात्रा के अनुमानों की सटीकता में सुधार नहीं होता है।

YXYX

library(jtools)
data("iris")

fit.raw3 <- lm(Petal.Length ~ Petal.Width + I(Petal.Width^2) +
                  I(Petal.Width^3), data = iris)
fit.raw1 <- lm(Petal.Length ~ Petal.Width, data = iris)

round(summ(fit.raw3, part.corr = T)$coef, 3)
#>                    Est.  S.E. t val.     p partial.r part.r
#> (Intercept)       1.103 0.130  8.464 0.000        NA     NA
#> Petal.Width       1.153 0.584  1.975 0.050     0.161  0.036
#> I(Petal.Width^2)  1.710 0.549  3.116 0.002     0.250  0.056
#> I(Petal.Width^3) -0.579 0.141 -4.110 0.000    -0.322 -0.074

round(summ(fit.raw1, part.corr = T)$coef, 3)
#>              Est.  S.E. t val. p partial.r part.r
#> (Intercept) 1.084 0.073 14.850 0        NA     NA
#> Petal.Width 2.230 0.051 43.387 0     0.963  0.963

fit.orth3 <- lm(Petal.Length ~ stats::poly(Petal.Width, 3), 
               data = iris)
fit.orth1 <- lm(Petal.Length ~ stats::poly(Petal.Width, 3)[,1], 
               data = iris)

round(summ(fit.orth3, part.corr = T)$coef, 3)
#>                                Est.  S.E.  t val. p partial.r part.r
#> (Intercept)                   3.758 0.032 118.071 0        NA     NA
#> stats::poly(Petal.Width, 3)1 20.748 0.390  53.225 0     0.975  0.963
#> stats::poly(Petal.Width, 3)2 -3.015 0.390  -7.735 0    -0.539 -0.140
#> stats::poly(Petal.Width, 3)3 -1.602 0.390  -4.110 0    -0.322 -0.074

round(summ(fit.orth1, part.corr = T)$coef, 3)
#>                                    Est.  S.E. t val. p partial.r part.r
#> (Intercept)                       3.758 0.039 96.247 0        NA     NA
#> stats::poly(Petal.Width, 3)[, 1] 20.748 0.478 43.387 0     0.963  0.963

2019-10-25 को रेप्रेक्स पैकेज (v0.3.0) द्वारा बनाया गया

0.0010.0030.0050.9270.9270.0200.0050.927। ऑर्थोगोनल बहुपद मॉडल से लेकिन कच्चे बहुपद मॉडल से नहीं, हम जानते हैं कि परिणाम में समझाया गया अधिकांश विचरण रैखिक शब्द के कारण होता है, जिसमें वर्ग शब्द बहुत कम होता है और घन शब्द से भी कम। कच्चे बहुपद मूल्य उस कहानी को नहीं बताते हैं।

अब, यदि आप चाहते हैं कि मॉडल के गुणांकों को समझने में सक्षम होने के अंतरिम लाभ पर यह व्याख्यात्मक लाभ हो, तो आपको रूढ़िवादी बहुपद का उपयोग करना चाहिए। यदि आप गुणांक को देखना पसंद करते हैं और वास्तव में जानते हैं कि उनका क्या मतलब है (हालांकि मुझे संदेह है कि आमतौर पर एक करता है), तो आपको कच्चे बहुपद का उपयोग करना चाहिए। यदि आप परवाह नहीं करते हैं (यानी, आप केवल भ्रमित या अनुमानित मूल्यों को नियंत्रित करना चाहते हैं), तो यह वास्तव में कोई फर्क नहीं पड़ता; दोनों रूप उन लक्ष्यों के संबंध में समान जानकारी रखते हैं। मैं यह भी तर्क दूंगा कि नियमितीकरण में ऑर्थोगोनल पॉलीओनियम्स को प्राथमिकता दी जानी चाहिए (उदाहरण के लिए, लासो), क्योंकि उच्च-क्रम की शर्तों को हटाने से निचले क्रम की शर्तों के गुणांक प्रभावित नहीं होते हैं, जो कच्चे बहुपद के साथ सच नहीं है


1
उत्कृष्ट योगदान। मैं आपके सीमांत परिणामों को दोहरा नहीं सकता (मार्जिन फ़ंक्शन पॉली के बारे में एक त्रुटि उत्पन्न करता है जब मैं आपके पहले कोड को चलाने की कोशिश करता हूं - मैं मार्जिन पैकेज से परिचित नहीं हूं) - लेकिन वे ठीक वही हैं जो मैं उम्मीद करता हूं। एक छोटे सुझाव के रूप में - आपको कच्चे मॉडल पर मार्जिन विश्लेषण के आउटपुट को भी शामिल करना चाहिए। सारांश से लेकर मार्जिन फ़ंक्शंस तक के पी-वैल्यू में बदलाव से हमारे तर्क को कम (थोड़ा) कम किया जा रहा है (हमारे निष्कर्षों को कम नहीं बदलना!) - जो वितरण के बजाय एक सामान्य का उपयोग करने के कारण प्रतीत होता है। आपका नियमितीकरण बिंदु उत्कृष्ट है।
user5957401

1
आपके दयालु शब्द के लिए धन्यवाद। मुझे लगता है कि आप शामिल करना है stats::करने के लिए कॉल में poly()में lm()के लिए marginsयह पहचान करने के लिए (जो मूर्ख है)। मैं अपने तर्क को बिंदु अनुमानों और मानक त्रुटियों पर ध्यान केंद्रित करना चाहता था, और मुझे पता है कि प्रस्तुत की गई बहुत अधिक बाहरी और विचलित करने वाली जानकारी है, लेकिन मुझे आशा है कि पाठ मेरे बिंदुओं को दिखाता है।
नूह

यह वह नहीं है। मैंने आपका कोड बिल्कुल कॉपी किया है, और आप उपयोग करते हैं stats::poly()। त्रुटि कहती है 'degree' must be less than number of unique points- जो मुझे बहुत मदद नहीं करता है। फिर भी, margin()साबित बयानों का समर्थन कर रहा है, इसलिए यह महत्वपूर्ण नहीं है।
user5957401

4

मैं @ user5957401 से उत्कृष्ट प्रतिक्रिया को पुष्टि करता हूं और प्रक्षेप, एक्सट्रपलेशन और रिपोर्टिंग पर टिप्पणियां जोड़ता हूं।

स्थिर पैरामीटर मानों के डोमेन में भी, ऑर्थोगोनल पॉलीओनियल्स द्वारा तैयार किए गए गुणांक / पैरामीटर में कच्चे मापदंडों द्वारा तैयार किए गए गुणांक / मापदंडों की तुलना में काफी छोटी मानक त्रुटियां होंगी। मूल रूप से, ऑर्थोगोनल पॉलीओनियम्स शून्य-सहसंयोजक विवरणकों का एक नि: शुल्क सेट है। कि मुक्त करने के लिए पीसीए है!

एकमात्र संभावित दोष यह है कि वह किसी को समझाए, जो शून्य-कोविरियन वर्णनों के गुण को नहीं समझता है। गुणांक पहले क्रम (वेग-जैसे) या दूसरे क्रम (त्वरण-जैसे) प्रभावों के संदर्भ में तुरंत व्याख्या करने योग्य नहीं हैं । यह व्यवसाय सेटिंग में काफी नुकसानदेह हो सकता है।

10dR2adj R2

तो मैं कच्चे की तुलना में ऑर्थोगोनल मॉडल की रिपोर्ट करने वाले अधिक आत्मविश्वास के "परिमाण के आदेश" होगा। अभ्यास में, मैं होता अंतर्वेशन या तो मॉडल के साथ है, लेकिन मैं होता एक्सट्रपलेशन केवल ओर्थोगोनल एक के साथ।


1

मैंने इसका उल्लेख करने के लिए सिर्फ टिप्पणी की होगी, लेकिन मेरे पास पर्याप्त प्रतिनिधि नहीं हैं, इसलिए मैं एक उत्तर में विस्तार करने की कोशिश करूंगा। आपको यह देखने में रुचि हो सकती है कि लैब खंड 7.8.1 में "सांख्यिकीय शिक्षा का परिचय" (जेम्स एट अल।, 2017, 8 वीं प्रिंटिंग को सही किया गया), वे ऑर्थोगोनल पॉलीओनियम्स का उपयोग करने या न करने के बीच कुछ अंतरों पर चर्चा करते हैं, जो उपयोग कर रहा है raw=TRUEया raw=FALSEमें poly()कार्य करते हैं। उदाहरण के लिए, गुणांक के अनुमान बदल जाएंगे, लेकिन फिट किए गए मूल्य नहीं हैं:

# using the Wage dataset in the ISLR library
fit1 <- lm(wage ~ poly(age, 4, raw=FALSE), data=Wage)
fit2 <- lm(wage ~ poly(age, 4, raw=TRUE), data=Wage)
print(coef(fit1)) # coefficient estimates differ
print(coef(fit2))
all.equal(predict(fit1), predict(fit2)) #returns TRUE    

पुस्तक में यह भी चर्चा की गई है कि जब ऑर्थोगोनल पॉलीओनियम्स का उपयोग किया जाता है, तो anova()नेस्टेड एफ-टेस्ट का उपयोग करके प्राप्त पी-वैल्यू (यह पता लगाने के लिए कि किस डिग्री बहुपद को वारंट किया जा सकता है) मानक टी-टेस्ट, आउटपुट द्वारा उपयोग करते समय प्राप्त किए गए समान हैं summary(fit)। यह दर्शाता है कि एफ-स्टेटिस्टिक कुछ स्थितियों में टी-स्टेटिस्टिक के वर्ग के बराबर है।


आपकी प्रतिष्ठा की संख्या की परवाह किए बिना टिप्पणियों को कभी भी उत्तर के रूप में उपयोग नहीं किया जाना चाहिए।
माइकल आर। चेर्निक

अपने अंतिम बिंदु के बारे में, यह गैर-रूढ़िवादी बहुपद का भी सच है। गुणांक टी-टेस्ट एफ-टेस्ट के बराबर है जिसमें एक गुणांक की तुलना की गई है और यह प्रतिगमन में सभी गुणांक के बिना एक मॉडल है (एक समय में एक लिया गया)।
नूह
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.