समायोजित आर-वर्ग के लिए R में प्रयुक्त सटीक सूत्र क्या है lm()
? मैं इसकी व्याख्या कैसे कर सकता हूं?
समायोजित r-squared सूत्र
समायोजित आर-वर्ग की गणना करने के लिए कई सूत्र मौजूद हैं।
- हैरी सूत्र:
- मैकनेमर का सूत्र:
- भगवान का सूत्र:
- स्टीन का सूत्र:
पाठ्यपुस्तक विवरण
- फ़ील्ड की पाठ्यपुस्तक के अनुसार, आर (2012, पी। 273) का उपयोग करके सांख्यिकी का पता लगाने के लिए आर व्हेरे के समीकरण का उपयोग करता है, जो बताता है कि "यदि मॉडल से जनसंख्या ली गई थी, जिसमें नमूना लिया गया था, तो वाई में कितना विचरण होगा इसका हिसाब दिया जाएगा"। वह व्हेरी के लिए सूत्र नहीं देता है। वह स्टीन के फार्मूले (हाथ से) का उपयोग करके यह जांचने की सलाह देता है कि मॉडल क्रॉस-वैलिड कितनी अच्छी तरह से जाँच करता है।
- क्लेबर / जीलीस, एप्लाइड इकोनोमेट्रिक्स विथ आर (2008, पी। 59) का दावा है कि यह "Theil's समायोजित R-squared" है और ठीक-ठीक यह मत कहो कि इसकी व्याख्या कई R- वर्ग से कैसे भिन्न होती है।
- डलागार्ड, आर के साथ परिचयात्मक सांख्यिकी (2008, पृष्ठ 113) लिखते हैं कि "यदि आप [% R- चुकता] को 100% से गुणा करते हैं, तो इसे '% विचरण कमी' के रूप में व्याख्या किया जा सकता है।" वह यह नहीं कहता कि यह किस सूत्र से मेल खाता है।
मैंने पहले सोचा था, और व्यापक रूप से पढ़ा, कि मॉडल में अतिरिक्त चर जोड़ने के लिए आर-वर्ग दंडित करता है। अब इन विभिन्न सूत्रों का उपयोग विभिन्न व्याख्याओं के लिए कहता है। मैंने स्टैक ओवरफ्लो पर एक संबंधित प्रश्न को भी देखा ( एकाधिक आर-स्क्वेर्ड और एडजस्टेड आर-स्क्वेर के बीच अंतर एक एकल-कम से कम वर्गों के प्रतिगमन में क्या है? ) और यूपीर्न में व्हार्टन स्कूल के सांख्यिकीय शब्दकोश ।
प्रशन
- R द्वारा समायोजित r-square के लिए कौन सा सूत्र प्रयोग किया जाता है
lm()
? - मैं इसकी व्याख्या कैसे कर सकता हूं?
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
सारांश से। lm (): जहाँ ans $ r.squared = R ^ 2; n = n, rdf = अवशिष्ट df, df.int = अवरोधन df (0 या 1)।