यह सराहना करना दिलचस्प होगा कि विचलन चर के प्रकार में है , और विशेष रूप से व्याख्यात्मक चर के प्रकार । विशिष्ट एनोवा में हमारे पास अलग-अलग समूहों के साथ एक श्रेणीबद्ध चर है , और हम यह निर्धारित करने का प्रयास करते हैं कि क्या समूहों के बीच एक सतत चर का माप अलग है। दूसरी ओर, ओएलएस को मुख्य रूप से एक निरंतर प्रतिगमन या प्रतिक्रिया चर और एक या एक से अधिक रजिस्टरों या व्याख्यात्मक चर के बीच संबंधों का आकलन करने का प्रयास माना जाता है । इस अर्थ में प्रतिगमन को एक अलग तकनीक के रूप में देखा जा सकता है, जो प्रतिगमन रेखा के आधार पर मूल्यों की भविष्यवाणी करने के लिए उधार देता है।
हालाँकि , यह अंतर एनोवा के विस्तार के बाकी वर्णमाला वर्णमाला सूप (ANCOVA, MANOVA, MANCOVA) के विस्तार के लिए नहीं है; या OLS प्रतिगमन में डमी-कोडेड चर का समावेश। मैं विशिष्ट ऐतिहासिक स्थलों के बारे में स्पष्ट नहीं हूं, लेकिन यह ऐसा है जैसे दोनों तकनीकों ने तेजी से जटिल मॉडलों से निपटने के लिए समानांतर अनुकूलन विकसित किया है।
उदाहरण के लिए, हम देख सकते हैं कि डमी (या श्रेणीबद्ध) चर (बातचीत के साथ दोनों मामलों में) के साथ ANCOVA बनाम OLS के बीच अंतर कॉस्मेटिक सबसे अधिक हैं। कृपया अपने प्रश्न के शीर्षक में सीमांतों से मेरे प्रस्थान का बहाना करें, कई रैखिक प्रतिगमन के बारे में।
दोनों मामलों में, मॉडल अनिवार्य रूप से बात करने के लिए समान है कि आर में है समारोह ANCOVA बाहर ले जाने के लिए किया जाता है । हालांकि, इसे प्रतिगमन मॉडल में कारक (या श्रेणीबद्ध) चर के पहले स्तर (या समूह) के अनुरूप एक अवरोधन को शामिल करने के संबंध में अलग-अलग रूप में प्रस्तुत किया जा सकता है।lm
एक संतुलित मॉडल (समान रूप से समूहों में, ) और केवल एक कोवरिएट (मैट्रिक्स प्रस्तुति को सरल बनाने के लिए) में, ANCOVA में मॉडल मैट्रिक्स का कुछ भिन्नता के रूप में सामना किया जा सकता है:एन 1 , 2 , ⋯मैंn1 , 2 , ⋯मैं
एक्स= ⎡⎣⎢1n10001n20001n3एक्सn1000एक्सn2000एक्सn3⎤⎦⎥
के लिए कारक चर के समूह, ब्लॉक मैट्रिक्स के रूप में व्यक्त किया।3
यह रैखिक मॉडल से मेल खाती है:
α मैं β
y= αमैं+ β1एक्सn1+ β2एक्सn2+ β3एक्सn3+ ϵमैं
साथ एक एनोवा में अलग समूह साधन के बराबर मॉडल, जबकि विभिन्न के समूह में से प्रत्येक के लिए कोवरिएट के ढलान हैं।
αमैंβ
प्रतिगमन क्षेत्र में और विशेष रूप से आर में एक ही मॉडल की प्रस्तुति, एक समूह में से एक के अनुरूप एक समग्र अवरोधन मानती है, और मॉडल मैट्रिक्स को निम्न रूप में प्रस्तुत किया जा सकता है:
एक्स= ⎡⎣⎢⎢⎢⋮जम्मू3 एन , 1⋮01n20001n3⋮एक्स⋮0000एक्सn2000एक्सn3⎤⎦⎥⎥⎥
OLS समीकरण के:
y= β0+ μमैं+β1एक्सn1+β2एक्सn2+ β3एक्सn3+ϵमैं
।
इस मॉडल में, समग्र अवरोधन को प्रत्येक समूह स्तर पर द्वारा संशोधित किया जाता है , और समूह में बहुत अधिक ढलान होते हैं।μ मैंβ0μमैं
जैसा कि आप मॉडल मैट्रिसेस से देख सकते हैं, प्रस्तुति विचलन के विश्लेषण और विश्लेषण के बीच वास्तविक पहचान को प्रमाणित करती है।
मुझे कोड की कुछ पंक्तियों और आर में मेरे पसंदीदा डेटा सेट केmtcars
साथ इसे सत्यापित करना पसंद है । मैं यहाँlm
उपलब्ध बेन बोल्कर के कागज के अनुसार ANCOVA के लिए उपयोग कर रहा हूँ ।
mtcars$cyl <- as.factor(mtcars$cyl) # Cylinders variable into factor w 3 levels
D <- mtcars # The data set will be called D.
D <- D[order(D$cyl, decreasing = FALSE),] # Ordering obs. for block matrices.
model.matrix(lm(mpg ~ wt * cyl, D)) # This is the model matrix for ANCOVA
सवाल के भाग के रूप में क्या विधि का उपयोग करने के लिए (आर के साथ प्रतिगमन!) आप इस पोस्ट पर लिखते हुए इस ऑन-लाइन कमेंट्री को चकित कर सकते हैं ।