आर - अवशिष्ट शब्दावली पर उलझन


34
  • मीन वर्ग त्रुटि को रूट करें
  • वर्गों का अवशिष्ट योग
  • अवशिष्ट मानक त्रुटि
  • मतलब चुकता त्रुटि
  • परीक्षण त्रुटि

मुझे लगता था कि मैं इन शर्तों को समझता था, लेकिन जितना अधिक मैं सांख्यिकीय समस्याओं को करता हूं उतना ही मैंने खुद को भ्रमित कर लिया है जहां मैं खुद को अनुमान लगाता हूं। मैं कुछ फिर से आश्वासन और एक ठोस उदाहरण चाहूंगा

मैं समीकरणों को आसानी से ऑनलाइन पा सकता हूं, लेकिन मुझे इन शर्तों के 'जैसे मैं 5 का समझाता हूं' का वर्णन करने में परेशानी हो रही है, इसलिए मैं अपने सिर के अंतर को क्रिस्टलीकृत कर सकता हूं और एक दूसरे को कैसे आगे बढ़ा सकता हूं।

अगर कोई भी इस कोड को नीचे ले जा सकता है और बता सकता है कि मैं इनमें से हर एक शब्द की गणना कैसे करूंगा। आर कोड महान होगा ..

नीचे इस उदाहरण का उपयोग:

summary(lm(mpg~hp, data=mtcars))

मुझे R कोड में दिखाएं कि कैसे खोजें:

rmse = ____
rss = ____
residual_standard_error = ______  # i know its there but need understanding
mean_squared_error = _______
test_error = ________

I की व्याख्या के लिए बोनस अंक 5 इन दोनों के बीच अंतर / समानताएं हैं। उदाहरण:

rmse = squareroot(mss)

2
क्या आप वह संदर्भ दे सकते हैं जिसमें आपने " परीक्षण त्रुटि " शब्द सुना है ? क्योंकि 'टेस्ट एरर' नाम की कोई चीज होती है, लेकिन मुझे यकीन नहीं है कि यह वही है जो आप खोज रहे हैं ... (यह एक टेस्ट सेट और ट्रेनिंग सेट के संदर्भ में उत्पन्न होता है - जो किसी भी ध्वनि से परिचित है? )
स्टीव एस

हां - इसके लिए मेरी समझ यह है कि यह परीक्षण सेट पर लागू प्रशिक्षण सेट पर उत्पन्न मॉडल है। परीक्षण त्रुटि मॉडल की y- परीक्षण y या (मॉडलिंग की y - परीक्षण y की) ^ 2 या (मॉडलिंग की y की परीक्षा y की) ^ 2 /// DF (या N?) या ((मॉडलिंग की y- परीक्षा y की) ^ 2 / है? एन) ^ 5?
user3788557

जवाबों:


60

जैसा कि अनुरोध किया गया है, मैं mtcarsडेटा का उपयोग करके एक साधारण प्रतिगमन का उपयोग करके वर्णन करता हूं :

fit <- lm(mpg~hp, data=mtcars)
summary(fit)

Call:
lm(formula = mpg ~ hp, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.7121 -2.1122 -0.8854  1.5819  8.2360 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.09886    1.63392  18.421  < 2e-16 ***
hp          -0.06823    0.01012  -6.742 1.79e-07 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 3.863 on 30 degrees of freedom
Multiple R-squared:  0.6024,    Adjusted R-squared:  0.5892 
F-statistic: 45.46 on 1 and 30 DF,  p-value: 1.788e-07

मतलब वर्ग त्रुटि (एमएसई) बच के वर्ग का मध्यमान है:

# Mean squared error
mse <- mean(residuals(fit)^2)
mse
[1] 13.98982

मूल मतलब चुकता त्रुटि (RMSE) तब MSE का वर्गमूल है:

# Root mean squared error
rmse <- sqrt(mse)
rmse
[1] 3.740297

वर्गों का अवशिष्ट योग (आरएसएस) वर्ग के अवशेषों का योग है:

# Residual sum of squares
rss <- sum(residuals(fit)^2)
rss
[1] 447.6743

अवशिष्ट मानक त्रुटि (आरएसई) (आरएसएस / स्वतंत्रता की डिग्री) का वर्गमूल है:

# Residual standard error
rse <- sqrt( sum(residuals(fit)^2) / fit$df.residual ) 
rse
[1] 3.862962

एक ही गणना, सरलीकृत क्योंकि हमने पहले गणना की है rss:

sqrt(rss / fit$df.residual)
[1] 3.862962

प्रतिगमन (और अन्य भविष्य कहनेवाला तकनीकों) के संदर्भ में शब्द परीक्षण त्रुटि आमतौर पर आपके प्रशिक्षण डेटा से अलग, परीक्षण डेटा पर एक परीक्षण सांख्यिकीय की गणना करने के लिए संदर्भित करता है।

दूसरे शब्दों में, आप अपने डेटा के एक हिस्से (अक्सर एक 80% नमूना) का उपयोग करके एक मॉडल का अनुमान लगाते हैं और फिर होल्ड-आउट नमूने का उपयोग करके त्रुटि की गणना करते हैं। फिर, मैं mtcars80% नमूने के साथ इस बार का उपयोग करके वर्णन करता हूं

set.seed(42)
train <- sample.int(nrow(mtcars), 26)
train
 [1] 30 32  9 25 18 15 20  4 16 17 11 24 19  5 31 21 23  2  7  8 22 27 10 28  1 29

मॉडल का अनुमान लगाएं, फिर होल्ड-आउट डेटा के साथ भविष्यवाणी करें:

fit <- lm(mpg~hp, data=mtcars[train, ])
pred <- predict(fit, newdata=mtcars[-train, ])
pred
 Datsun 710     Valiant  Merc 450SE  Merc 450SL Merc 450SLC   Fiat X1-9 
   24.08103    23.26331    18.15257    18.15257    18.15257    25.92090 

डेटा फ्रेम में मूल डेटा और भविष्यवाणी को मिलाएं

test <- data.frame(actual=mtcars$mpg[-train], pred)
    test$error <- with(test, pred-actual)
test
            actual     pred      error
Datsun 710    22.8 24.08103  1.2810309
Valiant       18.1 23.26331  5.1633124
Merc 450SE    16.4 18.15257  1.7525717
Merc 450SL    17.3 18.15257  0.8525717
Merc 450SLC   15.2 18.15257  2.9525717
Fiat X1-9     27.3 25.92090 -1.3791024

अब सामान्य तरीके से अपने परीक्षण के आँकड़ों की गणना करें। मैं MSE और RMSE का उदाहरण देता हूं:

test.mse <- with(test, mean(error^2))
test.mse
[1] 7.119804

test.rmse <- sqrt(test.mse)
test.rmse
[1] 2.668296

ध्यान दें कि यह उत्तर टिप्पणियों के भार को अनदेखा करता है।


इस जवाब के लिए धन्यवाद, इसने वास्तव में मुझे समझने में मदद की। मॉडल फिट पर डेटासैम्प के पाठ को करने में आरएमएसई के लिए आपकी तुलना में एक अलग सूत्र का वर्णन किया गया है। मुझे यह पृष्ठ Google खोज के बाद मिला । RMSE के लिए आपके द्वारा दिया गया फॉर्मूला सहज ज्ञान युक्त है और समझने में आसान है। RMSE के लिए उनकी गणना में भाजक में स्वतंत्रता की डिग्री शामिल है। इसके अलावा, अगर मैं उनकी पोस्ट को सही ढंग से पढ़ता हूं तो वे कहते हैं कि R RMSE को अवशिष्ट मानक त्रुटि कहता है लेकिन आपके उत्तर से ये अलग मूल्यांकन मीट्रिक हैं। विचार?
डॉग

22

मूल पोस्टर ने "मुझे 5 समझाता है" जैसे उत्तर के लिए कहा। मान लीजिए कि आपके स्कूल के शिक्षक, शिक्षक की टेबल की चौड़ाई का अनुमान लगाने में आपकी और आपके स्कूल के साथियों को आमंत्रित करते हैं। कक्षा में 20 छात्रों में से प्रत्येक एक उपकरण (शासक, स्केल, टेप या यार्डस्टिक) चुन सकता है और कई बार तालिका को मापने की अनुमति दी जाती है। आप सभी को बार-बार एक ही नंबर पढ़ने से बचने के लिए डिवाइस पर अलग-अलग शुरुआती स्थानों का उपयोग करने के लिए कहा जाता है; शुरुआती रीडिंग को अंत में एक चौड़ाई माप प्राप्त करने के लिए अंतिम रीडिंग से घटाया जाना चाहिए (आपने हाल ही में उस प्रकार के गणित को कैसे सीखा जाए)।

कक्षा द्वारा ली गई कुल 200 चौड़ाई माप में थे (20 छात्र, 10 माप प्रत्येक)। टिप्पणियों को शिक्षक को सौंप दिया जाता है जो संख्याओं को क्रंच करेंगे। प्रत्येक छात्र के अवलोकनों को संदर्भ मूल्य से घटाकर एक और 200 की संख्या में परिणामित किया जाएगा, जिसे विचलन कहा जाता है । शिक्षक प्रत्येक छात्र के नमूने को अलग-अलग औसत करता है, 20 साधन प्राप्त करता है । प्रत्येक छात्र की टिप्पणियों को उनके अलग-अलग साधनों से घटा देने से, औसत से 200 विचलन हो जाएंगे, जिन्हें अवशिष्ट कहा जाता है । यदि प्रत्येक नमूने के लिए औसत अवशिष्ट की गणना की जानी थी, तो आप देखेंगे कि यह हमेशा शून्य है। यदि इसके बजाय हम प्रत्येक अवशिष्ट को वर्ग करते हैं, तो उन्हें औसत करें, और अंत में वर्ग को पूर्ववत करें, हम मानक विचलन प्राप्त करते हैं। (वैसे, हम उस अंतिम गणना को वर्गमूल कहते हैं (किसी दिए गए वर्ग के आधार या पक्ष को खोजने के बारे में सोचते हैं), इसलिए पूरे ऑपरेशन को अक्सर रूट-मीन-स्क्वायर कहा जाता है , संक्षेप में; टिप्पणियों का मानक विचलन बराबर होता है। अवशिष्टों का मूल-माध्य-वर्ग।)

लेकिन शिक्षक पहले से ही सही टेबल की चौड़ाई जानता था, यह इस बात पर आधारित था कि इसे किस तरह से डिजाइन और निर्मित किया गया था और कारखाने में जाँच की गई थी। इसलिए, एक और 200 नंबर, जिसे त्रुटियां कहा जाता है , की गणना वास्तविक चौड़ाई के संबंध में टिप्पणियों के विचलन के रूप में की जा सकती है। प्रत्येक छात्र के नमूने के लिए एक मतलबी त्रुटि की गणना की जा सकती है। इसी तरह, त्रुटि के 20 मानक विचलन , या मानक त्रुटि , टिप्पणियों के लिए गणना की जा सकती है। अधिक 20 रूट-मीन-स्क्वायर त्रुटिमूल्यों की गणना भी की जा सकती है। 20 मानों के तीन सेट sqrt से संबंधित हैं (me ^ 2 + se ^ 2) = rmse, उपस्थिति के क्रम में। Rmse के आधार पर, शिक्षक न्याय कर सकता है जिसका छात्र तालिका की चौड़ाई के लिए सबसे अच्छा अनुमान प्रदान करता है। इसके अलावा, 20 माध्य त्रुटियों और 20 मानक त्रुटि मानों में अलगाव देखने से, शिक्षक प्रत्येक छात्र को अपने रीडिंग को बेहतर बनाने का निर्देश दे सकता है।

एक जाँच के रूप में, शिक्षक ने प्रत्येक त्रुटि को उनके संबंधित माध्य त्रुटि से घटाया, जिसके परिणामस्वरूप एक और 200 नंबर, जिसे हम अवशिष्ट त्रुटि कहेंगे (जो अक्सर नहीं होता है)। इसके बाद के संस्करण के रूप में, मतलब अवशिष्ट त्रुटि शून्य है, इसलिए अवशिष्ट त्रुटियों के मानक विचलन या मानक अवशिष्ट त्रुटि रूप में ही है मानक त्रुटि , और वास्तव में है, इसलिए है रूट मतलब वर्ग अवशिष्ट त्रुटि भी। (विवरण के लिए नीचे देखें।)

अब यहाँ शिक्षक के लिए कुछ दिलचस्पी है। हम प्रत्येक छात्र की कक्षा के बाकी हिस्सों (20 का मतलब कुल) के साथ तुलना कर सकते हैं। जैसे हमने इन बिंदु मानों से पहले परिभाषित किया है:

  • m: माध्य (टिप्पणियों का),
  • s: मानक विचलन (टिप्पणियों का)
  • मुझे: मतलब त्रुटि (टिप्पणियों का)
  • se: मानक त्रुटि (टिप्पणियों का)
  • rmse: रूट-मीन-स्क्वायर त्रुटि (टिप्पणियों का)

हम भी अब परिभाषित कर सकते हैं:

  • मिमी: साधन का मतलब है
  • sm: माध्य का मानक विचलन
  • मेम: मतलब की त्रुटि
  • एसईएम, मतलब की मानक त्रुटि
  • rmsem: root-mean-square error of the माध्य

केवल अगर छात्रों के वर्ग को निष्पक्ष कहा जाता है, अर्थात, यदि मेम = 0 है, तो sem = sm = rmsem; अर्थात, माध्य की मानक त्रुटि, माध्य का मानक विचलन, और जड़-माध्य-वर्ग त्रुटि, माध्य समान हो सकता है बशर्ते कि माध्य की त्रुटि शून्य हो।

यदि हमने केवल एक नमूना लिया था, अर्थात, यदि कक्षा में केवल एक छात्र था, तो टिप्पणियों के मानक विचलन का मतलब (एसएम) के मानक विचलन का अनुमान लगाने के लिए इस्तेमाल किया जा सकता है, जैसा कि sm ^ 2 ~ s ^ 2 / n, जहां n = 10 नमूना आकार (प्रति छात्र पढ़ने की संख्या) है। नमूना आकार बढ़ने पर दोनों बेहतर तरीके से सहमत होंगे (n = 10,11, ..., प्रति छात्र अधिक रीडिंग) और नमूनों की संख्या बढ़ती है (n '= 20,21, ..., कक्षा में अधिक छात्र)। (एक चेतावनी: एक अयोग्य "मानक त्रुटि" अधिक बार माध्य की मानक त्रुटि को संदर्भित करती है, न कि टिप्पणियों के मानक त्रुटि को।)

इसमें शामिल गणनाओं के कुछ विवरण दिए गए हैं। सही मूल्य को टी माना जाता है।

सेट-टू-पॉइंट ऑपरेशन:

  • माध्य: MEAN (X)
  • मूल-माध्य-वर्ग: RMS (X)
  • मानक विचलन: SD (X) = RMS (X-MEAN (X))

इंट्रा-सैम्पल सेट्स:

  • अवलोकन (दिए गए), X = {x_i}, i = 1, 2, ..., n = 10।
  • विचलन: एक निश्चित बिंदु के संबंध में एक सेट का अंतर।
  • अवशिष्ट: उनके माध्य से टिप्पणियों का विचलन, आर = एक्सएम।
  • त्रुटियाँ: सही मान से अवलोकन का विचलन, E = Xt।
  • अवशिष्ट त्रुटियां: उनके माध्य से त्रुटियों का विचलन, RE = E-MEAN (E)

इंट्रा-सैम्पल अंक (तालिका 1 देखें):

  • m: माध्य (टिप्पणियों का),
  • s: मानक विचलन (टिप्पणियों का)
  • मुझे: मतलब त्रुटि (टिप्पणियों का)
  • se: अवलोकनों की मानक त्रुटि
  • rmse: रूट-मीन-स्क्वायर त्रुटि (टिप्पणियों का)

तालिका एक

INTER-SAMPLE (ENSEMBLE) सेट्स:

  • का अर्थ है, M = {m_j}, j = 1, 2, ..., n '= 20।
  • माध्य के अवशिष्ट: उनके माध्य से साधनों का विचलन, RM = M-mm।
  • माध्य की त्रुटियां: "सत्य", ईएम = माउंट से साधनों का विचलन।
  • माध्य की अवशिष्ट त्रुटियां: उनके माध्य से माध्य की त्रुटियों का विचलन, REM = EM-MEAN (EM)

INTER-SAMPLE (ENSEMBLE) अंक (तालिका 2 देखें):

  • मिमी: साधन का मतलब है
  • sm: माध्य का मानक विचलन
  • मेम: मतलब की त्रुटि
  • एसईएम, मतलब की मानक त्रुटि)
  • rmsem: root-mean-square error of the माध्य

तालिका 2


0

मुझे यह भी लगता है कि सभी शब्द बहुत भ्रमित करने वाले हैं। मुझे दृढ़ता से लगता है कि यह स्पष्ट करना आवश्यक है कि हमारे पास ये कई मीट्रिक क्यों हैं।

यहाँ SSE और RMSE पर मेरा नोट है:

पहली मीट्रिक: स्क्वायड एरर्स (SSE) का योग। अन्य नाम, वर्ग के अवशेष (आरएसएस), वर्ग के अवशेष (एसएसआर) के योग।

यदि हम अनुकूलन समुदाय में हैं, तो SSE का व्यापक रूप से उपयोग किया जाता है। ऐसा इसलिए है क्योंकि यह अनुकूलन में उद्देश्य है, जहां अनुकूलन है

छोटा करनाβ एक्सβ-y2

और अवशिष्ट / त्रुटि शब्द , और , जिसे स्क्वायर्ड एरर्स (SSE) का योग कहा जाता है।2 = टी=एक्सβ-y2=टी

दूसरी मीट्रिक: रूट-मीन-स्क्वायर त्रुटि (RMSE) । अन्य नाम, रूट-मीन-स्क्वायर विचलन।

RMSE है

1एन(एक्सβ-y)=1एनटी

जहां डेटा बिंदुओं की संख्या है।एन

यहाँ क्यों हम इस SSric के अलावा हम ऊपर बात की थी मीट्रिक है। आरएमएसई मीट्रिक का लाभ यह है कि यह अधिक "सामान्यीकृत" है। विशेष रूप से, एसएसई डेटा की मात्रा पर निर्भर करेगा। एमएसई डेटा की मात्रा पर निर्भर नहीं करेगा, लेकिन आरएमएसई भी उसी इकाइयों में त्रुटि को रूप में व्यक्त करता है ।y

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.