रैखिक प्रतिगमन में मानकीकृत व्याख्यात्मक चर का उपयोग कब और कैसे करें


37

मेरे पास रेखीय प्रतिगमन के बारे में 2 सरल प्रश्न हैं:

  1. व्याख्यात्मक चरों को मानकीकृत करने की सलाह कब दी जाती है?
  2. एक बार मानकीकृत मूल्यों के साथ आकलन किया जाता है, तो कोई नए मूल्यों के साथ कैसे भविष्यवाणी कर सकता है (नए मूल्यों का मानकीकरण कैसे किया जाना चाहिए)?

कुछ संदर्भ सहायक होंगे।


3
यदि आपका सॉफ़्टवेयर अच्छी तरह से लिखा गया है तो यह संख्यात्मक परिशुद्धता समस्याओं से बचने के लिए आंतरिक रूप से मानकीकृत है। आपको कुछ विशेष नहीं करना चाहिए।
whuber

1
ध्यान दें कि निम्नलिखित धागा संबंधित है, और ब्याज का होगा: आपको अपना डेटा कब केंद्र में रखना चाहिए और कब मानकीकृत करना चाहिए?
गंग - मोनिका

जवाबों:


26

यद्यपि शब्दावली एक विवादास्पद विषय है, मैं "व्याख्यात्मक" चर, "भविष्यवक्ता" चर कहना पसंद करता हूं।

भविष्यवक्ताओं को कब मानकीकृत करना है:

  • कई रैखिक प्रतिगमन प्रदर्शन के लिए बहुत सारे सॉफ़्टवेयर मानकीकृत गुणांक प्रदान करेंगे जो कि अनियंत्रित गुणांक के समतुल्य हैं जहाँ आप भविष्यवाणियों और प्रतिक्रिया चर को मैन्युअल रूप से मानकीकृत करते हैं (बेशक, ऐसा लगता है कि आप केवल मानकीकृत भविष्यवक्ताओं के बारे में बात कर रहे हैं)।
  • मेरी राय है कि प्रतिगमन समीकरणों को अधिक सार्थक बनाने के लिए मानकीकरण एक उपयोगी उपकरण है। यह उन मामलों में विशेष रूप से सच है जहां चर के मीट्रिक में प्रतिगमन समीकरण (जैसे एक मनमाना मीट्रिक पर एक मनोवैज्ञानिक पैमाने) की व्याख्या करने वाले व्यक्ति के लिए अर्थ का अभाव है। इसका उपयोग भविष्यवक्ता चर के सापेक्ष महत्व की तुलना को सुविधाजनक बनाने के लिए भी किया जा सकता है (हालांकि रिश्तेदार महत्व का आकलन करने के लिए अन्य अधिक परिष्कृत दृष्टिकोण मौजूद हैं ; चर्चा के लिए मेरी पोस्ट देखें )। ऐसे मामलों में जहां प्रतिगमन समीकरण की व्याख्या करने वाले व्यक्ति के लिए मीट्रिक का अर्थ होता है, अनियंत्रित गुणांक अक्सर अधिक जानकारीपूर्ण होते हैं।
  • मुझे यह भी लगता है कि मानकीकृत चर पर निर्भर इस तथ्य से ध्यान हटा सकते हैं कि हमने इस बारे में नहीं सोचा है कि चर के मीट्रिक को पाठक के लिए अधिक सार्थक कैसे बनाया जाए।

  • एंड्रयू गेलमैन के विषय पर कहने के लिए एक उचित सा है। उदाहरण के लिए मानकीकरण पर उसका पृष्ठ देखें और विशेष रूप से जेलमैन (2008, स्टैट्स मेड, फ्री पीडीएफ)

स्टैंडराइजेशन पर आधारित भविष्यवाणी:

  • मैं भविष्यवाणी के लिए मानकीकृत प्रतिगमन गुणांक का उपयोग नहीं करेगा।
  • यदि आप मूल नमूने में पूर्वसूचक चर के माध्य और मानक विचलन को जानते हैं तो आप हमेशा मानकीकृत गुणांक को अस्वास्थ्यकर गुणांक में बदल सकते हैं।

3
+1, लेकिन आप भविष्यवाणी के लिए अनियंत्रित प्रतिगमन गुणांक का उपयोग क्यों नहीं करेंगे?
OneStop

1
(+1) परिवर्तनीय महत्व का आकलन करने के बारे में, मुझे लगता है कि रिलेम्पो आर पैकेज एक अच्छा काम करता है (लेकिन देखिए आधुनिक दृष्टिकोण से प्रतिगमन के साथ शुरुआत करना )। डेविड वी। बुडेस्कु द्वारा प्रभुत्व विश्लेषण (अनुरोध पर स्वतंत्र रूप से उपलब्ध) द्वारा एक अच्छा पेपर भी था ।
chl

@onestep उफ़। टाइपो। अब बदल गया है।
जेरोमे एंग्लीम

1
@Jeromy, क्या आप इस बात पर विस्तार से बता सकते हैं कि आप भविष्यवाणी के लिए मानकीकृत प्रतिगमन गुणांक का उपयोग क्यों नहीं करेंगे?
माइकल बिशप

3
@MichaelBishop मैं उन संदर्भों के बारे में सोच रहा हूं जहां आप अपने प्रतिगमन मॉडल को लेते हैं और इसे नमूना डेटा से बाहर की भविष्यवाणी करने के लिए लागू करते हैं। सामान्य तौर पर, आप अनियोजित पूर्वानुमान चाहते हैं। इसके अलावा, साधन और मानक विचलन नमूनों में बदल सकते हैं; इस प्रकार अनियंत्रित भविष्यवक्ताओं का उपयोग करने से अधिक सार्थक परिणाम प्राप्त होने चाहिए।
जेरोमे एंग्लीम

-4

मुझे पहले से लिखे गए उत्कृष्ट उत्तर के साथ एक संक्षिप्त उत्तर आटे के साथ उत्तर दें।

  1. हमेशा स्टैंडराइज़ करें, जो आपको प्रतिगमन की व्याख्या करने की अनुमति देता है, विशेष रूप से प्रतिगमन के गुणांक बेहतर।

  2. नए डेटा के लिए, जो स्टैंडराइज़ नहीं है, मैं आपको उन मूल्यों को संग्रहीत करने के लिए पुनर्संयोजित करता हूं, जिनका उपयोग आपने प्रत्येक चर के लिए उपयोग किए जाने वाले मूल्यों को संग्रहीत करने के लिए किया है, जैसे कि अधिकतम और न्यूनतम, और फिर वही परिवर्तन करें जो आपने पहले होल डेटासेट में किया था लेकिन इसके लिए बस एक घटना।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.