प्रतिगमन और PCA में अवरोधन से डेटा को कैसे केंद्रित किया जाता है?


39

मैं ऐसे उदाहरणों के बारे में पढ़ता रहता हूं जहां हम डेटा को केंद्र में रखते हैं (उदाहरण के लिए, नियमितीकरण या पीसीए के साथ) ताकि इंटरसेप्ट को हटा दिया जाए (जैसा कि इस प्रश्न में वर्णित है )। मुझे पता है कि यह सरल है, लेकिन मुझे यह समझने में मुश्किल समय आ रहा है। किसी को अंतर्ज्ञान या एक संदर्भ प्रदान कर सकता हूं जिसे मैं पढ़ सकता हूं?


2
यह एक बहुत ही विशेष मामला है जो अन्य प्रकारों के लिए "नियंत्रित करना" है (जैसा कि कई मायनों में) आँकड़े.स्टैकएक्सचेंज . com / questions / 17336/… पर समझाया गया है । "वैरिएबल" के लिए नियंत्रित किया जा रहा है स्थिर (अवरोधन) शब्द।
whuber

जवाबों:


65

क्या ये तस्वीरें मदद कर सकती हैं?

पहले 2 चित्र प्रतिगमन के बारे में हैं। डेटा को केंद्रित करने से प्रतिगमन रेखा के ढलान में परिवर्तन नहीं होता है, लेकिन यह अवरोधन को समान 0 बनाता है।

यहाँ छवि विवरण दर्ज करें

1

यहाँ छवि विवरण दर्ज करें


1


1
y¯X¯β

16
PCA is maximizing varianceयह आम तौर पर सच नहीं है। PCA (1 PC द्वारा) मूल से अधिकतम वर्ग विचलन को अधिकतम करता है। केवल अगर डेटा प्रारंभिक केंद्रित थे (खुद को पीसीए का हिस्सा नहीं है) तो यह विचरण को अधिकतम करने के लिए बदल जाता है।
ttnphns

3
PS ध्यान दें कि सहसंयोजकों या सहसंबंधों की गणना का अर्थ है
ttnphns

1
> PS ध्यान दें कि सहसंयोजकों या सहसंबंधों की गणना का अर्थ है - 11:47 पर ttnphns अगस्त 27 '12, जबकि मैं आपकी अन्य टिप्पणियों से सहमत हूं, सहसंयोजक और सहसंबंध दोनों ही केंद्रित नहीं हैं। जब डेटा में एक योगात्मक स्थिरांक लगाया जाता है, तो न तो कोर और न ही कोवर परिवर्तन मूल्य।
टीपीएम

1
यह पीछे की तरफ है। Additive स्थिरांक वास्तव में सहसंबंधों को प्रभावित नहीं करते हैं, लेकिन ऐसा इसलिए है क्योंकि उन्हें गणना में घटाया जाता है, जैसा कि @ttphs ने बताया है। एक तरफ, यह एक नया जवाब नहीं है, लेकिन एक टिप्पणी है। हम समझते हैं कि आपके पास अभी तक टिप्पणी करने के लिए पर्याप्त प्रतिष्ठा नहीं है, इसलिए यह होगा, मुझे विश्वास है, एक उपयोगकर्ता द्वारा पर्याप्त प्रतिष्ठा के साथ स्थानांतरित करने के बाद मुझे इसे ध्वजांकित किया जाएगा।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.