कैसे शामिल करें


9

मैं और उसके वर्ग (भविष्यवक्ता चर) शब्द को एक प्रतिगमन में शामिल करना चाहता हूं क्योंकि मैं मानता हूं कि निम्न मूल्यों पर निर्भर चर पर सकारात्मक प्रभाव पड़ता है और उच्च मूल्यों पर नकारात्मक प्रभाव पड़ता है। उच्च मूल्यों के प्रभाव पर कब्जा करना चाहिए। इसलिए मुझे उम्मीद है कि का गुणांक सकारात्मक होगा और का गुणांक ऋणात्मक होगा। अलावा , मैं अन्य भविष्यवाणियों को भी शामिल करता हूं।xx2xx2xx2x

मैंने यहाँ कुछ पोस्टों में पढ़ा कि इस मामले में चरों को केंद्रित करना एक अच्छा विचार है ताकि बहुसंस्कृति से बचा जा सके। कई प्रतिगमन का संचालन करते समय, आपको अपने भविष्यवक्ता चर को कब केंद्रित करना चाहिए और कब उन्हें मानकीकृत करना चाहिए?

  1. क्या मुझे दोनों चर (मतलब में) को केंद्र में रखना चाहिए या क्या मुझे केवल केंद्र में रखना चाहिए और फिर वर्ग लेना चाहिए या क्या मुझे केवल केंद्र में रखना चाहिए और मूल शामिल करना चाहिए ?xx2x

  2. क्या यह एक समस्या है अगर एक गणना चर है?x

को एक गिनती चर होने से बचने के लिए , मैंने इसे सैद्धांतिक रूप से परिभाषित क्षेत्र द्वारा विभाजित करने के बारे में सोचा, उदाहरण के लिए 5 वर्ग किलोमीटर। यह एक बिंदु घनत्व गणना के समान थोड़ा सा होना चाहिए।x

हालांकि, मुझे डर है कि इस स्थिति में गुणांक के संकेत के बारे में मेरी प्रारंभिक धारणा अब नहीं होगी, जब औरx=2x²=4

x=2/5 km2 =0.4 km2

लेकिन तब छोटा होगा क्योंकि ।x2x2=(2/5)2=0.16


1
आपका प्रतिगमन सॉफ़्टवेयर स्वचालित रूप से संख्यात्मक मुद्दों का ध्यान रखेगा - विशेष रूप से, यह आपके डेटा को आंतरिक रूप से केंद्र और मानकीकृत करने की अत्यधिक संभावना है। केंद्र के बारे में अपने सवालों के जवाब देने के लिए कैसे आप गुणांक की व्याख्या करना चाहते हैं नीचे आता है।
whuber

जवाबों:


4

आपका प्रश्न वास्तव में कई उप-प्रश्नों से युक्त है, जिन्हें मैं अपनी समझ के अनुसार सबसे अच्छा करने की कोशिश करूंगा।

  • एक प्रतिगमन पर कम और उच्च मूल्यों की निर्भरता को कैसे भेद करें?

और को ध्यान में रखते हुए इसे करने का एक तरीका है, लेकिन क्या आप सुनिश्चित हैं कि आपका परीक्षण निर्णायक है? क्या आप प्रतिगमन के सभी संभावित परिणामों के लिए कुछ उपयोगी निष्कर्ष निकाल पाएंगे? मुझे लगता है कि प्रश्न को पहले से स्पष्ट रूप से प्रस्तुत करना मदद कर सकता है, और समान और संबंधित प्रश्न पूछना भी मदद कर सकता है। उदाहरण के लिए, आप की एक सीमा पर विचार कर सकते हैं जिसके लिए प्रतिगमन ढलान अलग हैं। यह मध्यस्थ चर का उपयोग करके किया जा सकता है । यदि अलग-अलग ढलान (एक ही अवरोधन लगाते समय) संगत हैं तो आपको कोई अंतर नहीं पड़ता है, अन्यथा आपने खुद को उनके अंतर के लिए एक स्पष्ट तर्क प्रदान किया।xx2x

  • आपको केंद्र और standartize कब करना चाहिए?

मुझे लगता है कि इस प्रश्न को पहले प्रश्न और परीक्षण के साथ नहीं मिलाया जाना चाहिए, और मुझे डर है कि या आसपास पहले से ही परिणाम पूर्वाग्रह हो सकता है। मैं सलाह दूंगा कि कम से कम पहले चरण में केंद्र न करें। याद रखें कि आप शायद बहुउद्देशीयता से नहीं मरेंगे, कई लेखकों का तर्क है कि यह एक छोटे नमूना आकार ( यहां और यहां ) के साथ काम करने के बराबर है ।xx2

  • क्या असतत गिनती चर को (निरंतर) फ्लोटिंग-पॉइंट चर में बदलने से परिणामों की व्याख्या बदल जाती है?

हाँ, यह होगा, लेकिन यह पहले 2 बिंदुओं पर बहुत अधिक निर्भर करेगा, इसलिए मैं आपको एक बार में एक बात का सुझाव देना चाहूंगा। मुझे लगता है कि प्रतिगमन इस परिवर्तन के बिना काम नहीं करेगा, इसलिए मैं आपको अभी से इसे अनदेखा करने की सलाह दूंगा। ध्यान दें कि एक सामान्य तत्व से विभाजित करके आप उस पैमाने को बदल रहे हैं जिस पर , लेकिन इसे देखने के पूरी तरह से अलग-अलग तरीके हैं, जैसे मैंने ऊपर लिखा था, जिसमें इस सीमा को अधिक स्पष्ट तरीके से माना जाता है।x2=x


आपके उत्तर के लिए बहुत बहुत धन्यवाद, विशेष रूप से लिंक के लिए !!!
पीटर

यह मदद करने के लिए एक खुशी थी। =)
पीडोफ्रेगिरा

4

सामान्य केंद्रित में मल्टीकोलिनरिटी को कम करने में मदद कर सकता है, लेकिन "आप शायद मल्टीकोलिनरिटी से नहीं मरेंगे" (प्रीडियोफाइरा का जवाब देखें)।

इंटरसेप्ट को अर्थपूर्ण बनाने के लिए सबसे महत्वपूर्ण, केंद्रित होना अक्सर आवश्यक होता है। सरल मॉडल में , अवरोधन को लिए अपेक्षित परिणाम के रूप में परिभाषित किया गया है । यदि शून्य का मान सार्थक नहीं है, तो न ही पुनरावृत्ति है। अक्सर चर को उसके माध्य के चारों ओर केन्द्रित करना उपयोगी होता है; इस स्थिति में, भविष्यवक्ता प्रपत्र और इंटरसेप्ट एक ऐसे विषय के लिए अपेक्षित परिणाम होता है, जिसका मान के बराबर होता है जिसका अर्थ ।yi=α+βxi+εx=0xx(xix¯)αxix¯

ऐसे मामलों में, आपको और फिर वर्ग को केंद्र में रखना चाहिए । आप और अलग-अलग केन्द्रित नहीं कर सकते , क्योंकि आप "नए" चर, पर परिणाम को फिर से प्राप्त कर रहे हैं , इसलिए आपको इस नए चर को स्क्वायर करना होगा। अर्थ क्या हो सकता है?xxx2(xix¯)x2

आप एक गणना चर को केन्द्रित कर सकते हैं, यदि इसका अर्थ सार्थक है , लेकिन आप इसे माप सकते हैं। उदाहरण के लिए, यदि और "2" आधार रेखा हो सकती है, तो आप 2: । अवरोधन एक विषय के लिए अपेक्षित परिणाम बन जाता है जिसका मान "2" के बराबर होता है, एक संदर्भ मूल्य।x=1,2,3,4,5(xi2)=1,0,1,2,3xi

विभाजन के रूप में, कोई परेशानी नहीं: आपके अनुमानित गुणांक बड़े होंगे! जेलमैन और हिल , §4.1, एक उदाहरण दें: start earning

कमाई=-61000+1300इंच में ऊंचाई)+त्रुटिकमाई=-61000+51ऊंचाई (मिलीमीटर में)+त्रुटिकमाई=-61000+81000000ऊंचाई (मील में)+त्रुटि

एक इंच है मिलीमीटर तो है । एक इंच है , emiles तो है । लेकिन ये तीनों समीकरण पूरी तरह से समकक्ष हैं।25.4511300/25.41.6-5810000001300/1.6-5



आपके उत्तर के लिए धन्यवाद सर्जियो। इसने वास्तव में मेरी मदद की। दुर्भाग्य से मैं केवल एक उत्तर को मेरे स्वीकृत उत्तर के रूप में चिह्नित कर सकता हूं।
पीटर

आपका स्वागत है। और चिंता मत करो ;-)
सर्जियो

1

मेरा मानना ​​है कि x के निम्न मानों का आश्रित चर पर सकारात्मक प्रभाव पड़ता है और उच्च मूल्यों का नकारात्मक प्रभाव पड़ता है।

जबकि मैं गुणांक के दूसरों के उपचार और व्याख्या की सराहना करता हूं, यहां आपने जो वर्णन किया है वह केवल एक रैखिक प्रभाव है। दूसरे शब्दों में, आपने जो वर्णन किया है, वह x के वर्ग का परीक्षण करने की आवश्यकता को इंगित नहीं करता है ।


मेरे विचार में, यदि y=β0+β1x1+β2x2+ε, (आंशिक) प्रभाव एक्समैं पर y (या, बेहतर, पर [y|एक्स]) है [y|एक्स]/एक्समैं=βमैं। ऐसे प्रभाव निरंतर होते हैं, वे के स्तर पर निर्भर नहीं करते हैं एक्समैं। अगर मॉडल हैy=β0+β1एक्स1+β2एक्स2+β3एक्स22+ε, तो का आंशिक प्रभाव एक्स2 है β2+2β3एक्स2 और के स्तर पर निर्भर करता है एक्स2। यह अन्य मॉडलों में भी हो सकता है, उदाहरण के लिए रैखिक रेखीय मॉडल में, लेकिन एक साधारण रैखिक (1 डिग्री) मॉडल में नहीं। क्या मै गलत हु?
सर्जियो

@ rolando2: मुझे यकीन नहीं है कि क्या हम समेटे हुए बात करते हैं। यदि मैं केवल नियमित भविष्य कहनेवाला चर शामिल करता हूं तो मुझे उस भविष्यवक्ता के लिए एक अनुमानित गुणांक मिलेगा जो या तो सकारात्मक या नकारात्मक है। गुणांक के आधार पर मैं कह सकता हूं कि एक इकाई को x में जोड़ने से, y एक निश्चित राशि से बढ़ेगा या घटेगा। लेकिन मैं इस तरह पता नहीं लगा सकता कि क्या छोटे मूल्य वास्तव में y की वृद्धि की ओर ले जाते हैं, जबकि उच्च मान (एक निश्चित अज्ञात बिंदु से) y की कमी की ओर ले जाते हैं।
पीटर

@ पेटर - मैं समझता हूं और मैं आपको अपने प्रश्न के "मैं मान लेता हूं" वाक्य को पढ़ने के लिए संपादित करने का सुझाव देता हूं: "मैं मानता हूं कि, एक्स के कुछ क्षेत्रों में, एक्स के उच्च मूल्यों पर निर्भर चर पर सकारात्मक प्रभाव पड़ता है, जबकि कुछ अन्य क्षेत्र में, उच्च मूल्यों का नकारात्मक प्रभाव पड़ता है। "
rolando2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.