स्थानांतरण / स्केलिंग चर प्रतिक्रिया के साथ उनके सहसंबंध को प्रभावित नहीं करेंगे
क्यों यह सच है यह देखने के लिए, मान लीजिए कि बीच संबंध और है । फिर और बीच संबंध हैYXρY(X−a)/b
cov(Y,(X−a)/b)SD((X−a)/b)⋅SD(Y)=cov(Y,X/b)SD(X/b)⋅SD(Y)=1b⋅cov(Y,X)1bSD(X)⋅SD(Y)=ρ
जो सहसंबंध और तीन तथ्यों की परिभाषा से आता है :
cov(Y,X+a)=cov(Y,X)+cov(Y,a)=0=cov(Y,X)
cov(Y,aX)=acov(Y,X)
SD(aX)=a⋅SD(X)
इसलिए, मॉडल फिट (उदाहरण के लिए या फिट किए गए मान) के संदर्भ में , अपने चर को शिफ्ट या स्केल करना (जैसे कि उन्हें उसी पैमाने पर रखना) मॉडल को नहीं बदलेगाR2 , क्योंकि रैखिक प्रतिगमन गुणांक चर के बीच सहसंबंध से संबंधित हैं। यह केवल आपके प्रतिगमन गुणांक के पैमाने को बदल देगा , जिसे तब ध्यान में रखना चाहिए जब आप आउटपुट की व्याख्या कर रहे हों यदि आप अपने भविष्यवाणियों को बदलना चाहते हैं।
संपादित करें: ऊपर ने मान लिया है कि आप इंटरसेप्ट के साथ साधारण प्रतिगमन के बारे में बात कर रहे हैं । इससे संबंधित कुछ और बिंदु (धन्यवाद @ साभार):
अवरोधन तब बदल सकता है जब आप अपने चरों को बदलते हैं, और जैसा कि टिप्पणियों में @ कार्डिनल बताते हैं, जब आप मॉडल से अवरोधन को छोड़ते हैं तो गुणांक बदल जाएंगे, यदि मैं मानता हूं कि आप ऐसा नहीं कर रहे हैं एक अच्छा कारण (उदाहरण के लिए यह उत्तर देखें )।
यदि आप किसी तरह से अपने गुणांक को नियमित कर रहे हैं (उदाहरण के लिए लासो, रिज रिग्रेशन), तो केंद्र केंद्रित / स्केलिंग फिट पर प्रभाव डालेगा। उदाहरण के लिए, यदि आप (रिज रिग्रेशन पेनल्टी) को दंडित कर रहे हैं, तो आप मानकीकरण के बाद एक बराबर फिट नहीं पा सकते हैं जब तक कि सभी चर पहले स्थान पर समान पैमाने पर नहीं थे, अर्थात कोई लगातार एक से अधिक नहीं है जो एक ही जुर्माना वसूल करेगा।∑β2i
कब / क्यों एक शोधकर्ता भविष्यवक्ताओं को बदलना चाह सकता है
एक सामान्य परिस्थिति (@Paul द्वारा बाद के उत्तर में चर्चा की गई) यह है कि शोधकर्ता अपने भविष्यवाणियों को मानकीकृत करेंगे ताकि सभी गुणांक समान पैमाने पर होंगे। उस स्थिति में, बिंदु अनुमानों का आकार एक मोटा विचार दे सकता है, जिससे पूर्वसूचक के संख्यात्मक परिमाण को मानकीकृत करने के बाद भविष्यवक्ताओं का सबसे बड़ा प्रभाव पड़ता है।
एक अन्य कारण यह है कि एक शोधकर्ता बहुत बड़े चर को मापना पसंद कर सकता है ताकि प्रतिगमन गुणांक एक अत्यंत छोटे पैमाने पर न हो। उदाहरण के लिए, यदि आप अपराध दर पर किसी देश के जनसंख्या आकार के प्रभाव को देखना चाहते हैं (बेहतर उदाहरण के बारे में नहीं सोच सकते हैं), तो आप गुणांक के बाद से इसकी मूल इकाइयों के बजाय लाखों में जनसंख्या आकार को मापना चाह सकते हैं। की तरह कुछ हो सकता है ।.00000001