डीवियन और जीएलएम
औपचारिक रूप से, व्यक्ति दो संभावित मॉडल के बीच की दूरी के रूप में भक्ति देख सकता है; जीएलएम संदर्भ में, यह दो नेस्टेड मॉडल बीच संभावना के लॉग अनुपात का दो गुना है, जहां "छोटा" मॉडल है; जैसा कि @suncoolsu ने कहा है कि मॉडल मापदंडों पर एक रेखीय प्रतिबंध (cf. द नेमन-पियर्सन लेम्मा ) है। जैसे, इसका उपयोग मॉडल तुलना करने के लिए किया जा सकता है । इसे ओएलएस आकलन (एनोवा, रिग्रेशन) में इस्तेमाल आरएसएस के सामान्यीकरण के रूप में भी देखा जा सकता है, क्योंकि यह अशक्त मॉडल (केवल अवरोधन) की तुलना में मूल्यांकन किए जाने वाले मॉडल की अच्छाई-की-फिट का एक माप प्रदान करता है । यह LM के साथ भी काम करता है:ℓ1/ℓ0ℓ0
> x <- rnorm(100)
> y <- 0.8*x+rnorm(100)
> lm.res <- lm(y ~ x)
अवशिष्ट एसएस (RSS) की गणना में की जाती है, जिसे आसानी से प्राप्त किया जाता है:ε^टीε^
> t(residuals(lm.res))%*%residuals(lm.res)
[,1]
[1,] 98.66754
या (अनधिकृत)आर2
> summary(lm.res)
Call:
lm(formula = y ~ x)
(...)
Residual standard error: 1.003 on 98 degrees of freedom
Multiple R-squared: 0.4234, Adjusted R-squared: 0.4175
F-statistic: 71.97 on 1 and 98 DF, p-value: 2.334e-13
चूँकि जहाँ कुल विचरण है। ध्यान दें कि यह सीधे एक एनोवा तालिका में उपलब्ध है, जैसेआर2= 1 - आरएसएस / टीएसएसटीएसएस
> summary.aov(lm.res)
Df Sum Sq Mean Sq F value Pr(>F)
x 1 72.459 72.459 71.969 2.334e-13 ***
Residuals 98 98.668 1.007
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
अब, विचलन को देखो:
> deviance(lm.res)
[1] 98.66754
वास्तव में, रैखिक मॉडल के लिए अवमूल्यन आरएसएस के बराबर होता है (आप याद कर सकते हैं कि ऐसे मामले में ओएलएस और एमएल अनुमान मेल खाते हैं)।
Deviance और CART
हम CART को पहले से ही लेबल वाले व्यक्तियों को मनमानी कक्षाओं (एक वर्गीकरण संदर्भ में) में आवंटित करने के तरीके के रूप में देख सकते हैं । पेड़ों को व्यक्तियों की वर्ग सदस्यता के लिए संभाव्यता मॉडल प्रदान करने के रूप में देखा जा सकता है। इसलिए, प्रत्येक नोड पर, कक्षाओं में हमारे पास प्रायिकता वितरण । यहां जो महत्वपूर्ण है वह यह है कि पेड़ की पत्तियां हमें द्वारा निर्दिष्ट वितरण से एक यादृच्छिक नमूना । इस प्रकार, हम सभी पत्तियों के योग के रूप में एक पेड़, की भक्ति को परिभाषित कर सकते हैंnipiknikpikD
Di=−2∑kniklog(pik),
वेनबल्स और रिप्ले के नोटेशन ( MASS , स्प्रिंगर 2002, 4th एड।) के बाद। यदि आपके पास आर उपयोगकर्ताओं (आईएमएचओ) के लिए इस आवश्यक संदर्भ तक पहुंच है, तो आप स्वयं जांच कर सकते हैं कि नोड्स को विभाजित करने और अवलोकन डेटा के लिए पेड़ को फिटिंग करने के लिए इस तरह के दृष्टिकोण का उपयोग कैसे किया जाता है (पी। 255 एफएफ।); मूल रूप से, विचार यह है कि पेड़ को काटकर, जहां पेड़ में नोड्स की संख्या है । यहां हम लागत-जटिलता व्यापार बंद को पहचानते हैं । यहाँ, , नोड अशुद्धता की अवधारणा के बराबर है (अर्थात, किसी दिए गए नोड पर वितरण की विविधता) जो एन्ट्रापी या सूचना प्राप्त करने के उपाय पर आधारित है, या रूप में परिभाषित प्रसिद्ध गिनी सूचकांक,D+α#(T)#(T)TD1−∑kp2ik (अज्ञात अनुपात नोड अनुपात से अनुमानित हैं)।
एक प्रतिगमन पेड़ के साथ, विचार काफी समान है, और हम उस व्यक्ति के लिए परिभाषित वर्गों के योग के रूप में अवमूल्यन की अवधारणा कर सकते हैं, जिसके द्वाराj
Di=∑j(yj−μi)2,
सभी पत्तियों पर अभिव्यक्त। यहाँ, प्रायिकता मॉडल जो प्रत्येक पत्ती के भीतर माना जाता है, एक । वेनबल्स और रिप्ले (पी। 256) का हवाला देते हुए, " एक गाऊसी जीएलएम के लिए सामान्य रूप से फैला हुआ विचलन है। हालांकि, पेड़ के आंतरिक नोड्स पर वितरण फिर सामान्य वितरण का मिश्रण है, और इसलिए पत्तियों पर ही उपयुक्त है। ट्री-कंस्ट्रक्शन प्रक्रिया को संभाव्यता मॉडल के पदानुक्रमित शोधन के रूप में देखा जाना चाहिए , जो प्रतिगमन में फॉरवर्ड वेरिएबल के समान है । " धारा 9.2 कार्यान्वयन के बारे में और विस्तृत जानकारी प्रदान करता है , लेकिन आप पहले से ही इसके लिए कार्य देख सकते हैंN(μi,σ2)DDirpart
residuals()
rpart
ऑब्जेक्ट, जहां "अवशिष्ट अवशिष्ट" की गणना फिटेड मॉडल के लघुगणक से दो बार माइनस के वर्गमूल के रूप में की जाती है।
एटकिंसन और थर्नेओ द्वारा राउटर रूटीन का उपयोग करके पुनरावर्ती विभाजन का एक परिचय भी एक अच्छी शुरुआत है। अधिक सामान्य समीक्षा (बैगिंग सहित) के लिए, मैं सुझाऊंगा