हम प्रतिगमन विश्लेषण का उपयोग उन मॉडलों को बनाने के लिए करते हैं जो प्रतिक्रिया चर पर भविष्यवक्ता चर में भिन्नता के प्रभाव का वर्णन करते हैं। कभी-कभी यदि हमारे पास हां / नहीं या पुरुष / महिला आदि जैसे मूल्यों के साथ एक श्रेणीबद्ध चर है, तो साधारण प्रतिगमन विश्लेषण, श्रेणीगत चर के प्रत्येक मूल्य के लिए कई परिणाम देते हैं। इस तरह के परिदृश्य में, हम पूर्वानुमेय चर के साथ-साथ इसका उपयोग करके श्रेणीगत चर के प्रभाव का अध्ययन कर सकते हैं और श्रेणीगत चर के प्रत्येक स्तर के लिए प्रतिगमन लाइनों की तुलना कर सकते हैं। इस तरह के विश्लेषण को कोवरियन के विश्लेषण के रूप में भी जाना जाता है जिसे एएनसीओवीए भी कहा जाता है।
उदाहरण अंतर्निहित डेटा सेट
पर विचार करें । इसमें हम मानते हैं कि क्षेत्र ट्रांसमिशन (ऑटो या मैनुअल) के प्रकार का प्रतिनिधित्व करता है। यह 0 और 1. मानों वाला एक श्रेणीगत चर है। कार के प्रति गैलन मूल्य ( ) का मान उस पर भी निर्भर कर सकता है, इसके अलावा घोड़े की शक्ति ( ) का मूल्य भी । हम और के बीच प्रतिगमन पर मूल्य के प्रभाव का अध्ययन करते हैं । यह फ़ंक्शन का उपयोग करके और उसके बाद किया जाता हैR
mtcars
am
mpg
hp
am
mpg
hp
aov()
anova()
कई रजिस्टरों की तुलना करने के लिए ।
इनपुट डेटा
एक डेटा फ्रेम बनाएं जिसमें फ़ील्ड हों mpg
, hp
और am
डेटा सेट से mtcars
। यहां हम mpg
प्रतिसाद चर के hp
रूप में और am
श्रेणीबद्ध चर के रूप में प्रतिक्रिया चर के रूप में लेते हैं ।
input <- mtcars[,c("am","mpg","hp")]
head(input)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है:
am mpg hp
Mazda RX4 1 21.0 110
Mazda RX4 Wag 1 21.0 110
Datsun 710 1 22.8 93
Hornet 4 Drive 0 21.4 110
Hornet Sportabout 0 18.7 175
Valiant 0 18.1 105
ANCOVA विश्लेषण
हम एक प्रतिगमन मॉडल लेने बनाने के hp
भविष्यवक्ता चर के रूप में और mpg
प्रतिक्रिया चर के बीच बातचीत को ध्यान में रखते रूप में am
और hp
।
श्रेणीगत चर और भविष्य कहनेवाला चर के बीच बातचीत के साथ मॉडल
प्रतिगमन मॉडल बनाएं 1
result1 <- aov(mpg~hp*am,data=mtcars)
summary(result1)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है:
Df Sum Sq Mean Sq F value Pr(>F)
hp 1 678.4 678.4 77.391 1.50e-09 ***
am 1 202.2 202.2 23.072 4.75e-05 ***
hp:am 1 0.0 0.0 0.001 0.981
Residuals 28 245.4 8.8
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
इस परिणाम से पता चलता है कि घोड़े की शक्ति और ट्रांसमिशन दोनों प्रकार का मील प्रति गैलन पर महत्वपूर्ण प्रभाव पड़ता है क्योंकि दोनों मामलों में पी-मूल्य 0.05 से कम है। लेकिन इन दोनों चरों के बीच की बातचीत महत्वपूर्ण नहीं है क्योंकि पी-वैल्यू 0.05 से अधिक है।
श्रेणीगत चर और भविष्य कहनेवाला चर के बीच बातचीत के बिना मॉडल
प्रतिगमन मॉडल 2 बनाएं
result2 <- aov(mpg~hp+am,data=mtcars)
summary(result2)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है:
Df Sum Sq Mean Sq F value Pr(>F)
hp 1 678.4 678.4 80.15 7.63e-10 ***
am 1 202.2 202.2 23.89 3.46e-05 ***
Residuals 29 245.4 8.5
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
इस परिणाम से पता चलता है कि घोड़े की शक्ति और ट्रांसमिशन दोनों प्रकार का मील प्रति गैलन पर महत्वपूर्ण प्रभाव पड़ता है क्योंकि दोनों मामलों में पी-मूल्य 0.05 से कम है।
दो मॉडलों की तुलना
अब हम दो मॉडलों की तुलना यह निष्कर्ष निकालने के लिए कर सकते हैं कि क्या चर की बातचीत वास्तव में महत्वहीन है। इसके लिए हम anova()
फंक्शन का उपयोग करते हैं।
anova(result1,result2)
Model 1: mpg ~ hp * am
Model 2: mpg ~ hp + am
Res.Df RSS Df Sum of Sq F Pr(>F)
1 28 245.43
2 29 245.44 -1 -0.0052515 6e-04 0.9806
जैसा कि पी-मान 0.05 से अधिक है, हम निष्कर्ष निकालते हैं कि घोड़े की शक्ति और ट्रांसमिशन प्रकार के बीच बातचीत महत्वपूर्ण नहीं है। तो प्रति गैलन माइलेज ऑटो और मैनुअल ट्रांसमिशन मोड में कार की हॉर्स पावर पर समान तरीके से निर्भर करेगा।