अर्थशास्त्र में शोधकर्ता द्विआधारी प्रतिक्रिया चर के लिए रैखिक प्रतिगमन का उपयोग क्यों करते हैं?


13

हाल ही में, मुझे अर्थशास्त्र में कई पेपर पढ़ने पड़े (ऐसा क्षेत्र जिससे मैं बहुत परिचित नहीं हूं)। एक बात जो मैंने देखी है, वह यह है कि जब प्रतिक्रिया चर द्विआधारी होता है, तब भी ओएलएस का उपयोग करके लगाए गए रैखिक प्रतिगमन मॉडल सर्वव्यापी होते हैं। मेरा सवाल इसलिए है:

लीनियर रिग्रेशन को अर्थशास्त्र के क्षेत्र में लॉजिस्टिक रिग्रेशन के लिए क्यों पसंद किया जाता है? क्या यह केवल सामान्य अभ्यास है या यह एक ऐसी प्रक्रिया है जिसकी सक्रिय रूप से वकालत की जाती है (शिक्षकों द्वारा, आदि)।

कृपया ध्यान दें कि मैं यह नहीं पूछ रहा हूं कि द्विआधारी प्रतिक्रिया के साथ रैखिक प्रतिगमन का उपयोग करना एक बुरा विचार क्यों हो सकता है, या वैकल्पिक तरीके क्या हैं। इसके विपरीत, मैं पूछ रहा हूं कि लोग इस सेटिंग में रैखिक प्रतिगमन का उपयोग क्यों करते हैं क्योंकि मुझे इन दो प्रश्नों के उत्तर पता हैं।


5
क्या आप कोई उदाहरण दे सकते हैं?
Stephan Kolassa

7
यह सही नहीं है। अर्थशास्त्र और अर्थमिति के पास लॉगिट और प्रोबिट और संबंधित मॉडल पर एक विशाल साहित्य भी है। मैं एक बाहरी व्यक्ति हूं और मैं आसानी से सापेक्ष उपयोग नहीं कर सकता, लेकिन साहित्य "सर्वव्यापी" (मतलब, हर जगह!) का खंडन करने के लिए पर्याप्त है। यहां एक सवाल है कि तथाकथित रैखिक संभाव्यता मॉडल का उपयोग क्यों किया जाता है और मुझे नहीं लगता कि स्पष्टीकरण को खोजने के लिए गहन या कठिन होने की आवश्यकता है: यह समझना सरल है और कभी-कभी यह पर्याप्त रूप से काम करता है।
निक कॉक्स

3
अर्थशास्त्र का केवल गणित के साथ बहुत ही आकस्मिक संबंध है। मैं इसके बारे में बहुत ज्यादा चिंता नहीं करेगा।
साइकोरैक्स का कहना है कि

1
@ साइकोरेक्स मुझे एक समान लगता है। और अगर कोई गणित से मैला है, वह अभी भी कुछ ऐसा काम करने में सक्षम है जो "काम करता है"।
हायतौ डु

1
@ साइकोरैक्स न तो सच है और न ही उचित है। निश्चित रूप से, यह कहते हुए कि "आप इसके बारे में बहुत अधिक चिंता नहीं करेंगे" सवाल के लिए गैर जिम्मेदार है। उप-क्षेत्र के आधार पर, अर्थशास्त्र का गणित और सांख्यिकी के साथ बहुत मजबूत संबंध हो सकता है। यह सिर्फ इतना है कि अर्थशास्त्री अक्सर कार्य-कारण के संबंध में होते हैं, जबकि अवलोकन डेटा (बहुत सारे सामाजिक विज्ञान करते हैं) से भी निपटना होता है। यह कुछ आर्थिक अंतर्ज्ञान में लाने के बिना मजबूत गणितीय कठोरता स्थापित करना बेहद कठिन बनाता है।
18

जवाबों:


18

डेव जाइल्स के अर्थमिति ब्लॉग पर यह ब्लॉग पोस्ट ज्यादातर रैखिक संभावना मॉडल (एलपीएम) के नुकसान को रेखांकित करता है ।

हालांकि , वह उन कारणों की एक छोटी सूची शामिल करता है जिनके कारण शोधकर्ता इसका उपयोग करना चुनते हैं:

  • यह कम्प्यूटेशनल रूप से सरल है।
  • "सीमांत प्रभाव" की व्याख्या करना आसान है।
  • यह "लिंक फ़ंक्शन" के गलत-विनिर्देश के जोखिम से बचा जाता है।
  • यदि आपके पास अंतर्जात डमी रजिस्टर्स हैं, तो लॉगिट या प्रोबिट के साथ जटिलताएं हैं।
  • एलपीएम, लॉगिट और प्रोबिट मॉडल से अनुमानित सीमांत प्रभाव आमतौर पर बहुत समान हैं, खासकर यदि आपके पास एक बड़ा नमूना आकार है।

मुझे नहीं पता कि एलपीएम वह सब है जो आमतौर पर लॉगिट या प्रोबिट के साथ तुलना में उपयोग किया जाता है लेकिन ऊपर दिए गए कुछ कारण मेरे लिए समझदार हैं।


2
+1, रैखिक संभावना मॉडल के लिए धन्यवाद, मुझे पहले यह नहीं पता था।
हेताओ दू

1
यदि आप अधिक रुचि रखते हैं, तो एंग्रीस्ट और पिसके द्वारा "ज्यादातर हानिकारक अर्थमिति" में इस पर एक बड़ा खंड है।
shf8888

2

जब मैंने दूसरे दाखिलों से पेपर पढ़े तो मेरे भी ऐसे ही सवाल थे। और इससे संबंधित बहुत से प्रश्न पूछे, जैसे कि एजुकेशन डाटा माइनिंग कम्युनिटी में यह एक: लॉजिक लॉस की बजाय संभावनाओं पर चुकता नुकसान का उपयोग क्यों करें?

यहां मैं बहुत सारी व्यक्तिगत राय पेश करूंगा।


मुझे लगता है कि कई व्यावहारिक उपयोग के मामलों में हानि समारोह बहुत ज्यादा मायने नहीं रखता है। कुछ शोधकर्ता वर्ग के नुकसान के बारे में अधिक जान सकते हैं और इसकी प्रणाली का निर्माण कर सकते हैं, यह अभी भी काम करता है और वास्तविक दुनिया की समस्याओं को हल करता है। शोधकर्ता लॉजिस्टिक लॉस या हिंज लॉस को कभी नहीं जान सकते हैं, और इसे आजमाना चाहते हैं। इसके अलावा, वे इष्टतम गणित मॉडल को खोजने के लिए इच्छुक नहीं हो सकते हैं, लेकिन वास्तविक समस्याओं को हल करना चाहते हैं जिन्हें किसी ने पहले हल करने का प्रयास नहीं किया।

यह एक और उदाहरण है: यदि आप मेरे प्रश्न के उत्तर की जांच करते हैं, तो वे सभी समान हैं। लगभग 0-1 नुकसान के लिए वर्गीकरण में विभिन्न नुकसान कार्यों को चुनने के प्रभाव क्या हैं


अधिक विचार: मशीन सीखने का एक शोध बहुत समय बिता सकता है कि किस मॉडल को चुना जाए, और मॉडल को कैसे अनुकूलित किया जाए। ऐसा इसलिए है क्योंकि मशीन सीखने वाले शोधकर्ता में अधिक डेटा एकत्र करने / अधिक उपाय प्राप्त करने की क्षमता नहीं हो सकती है। और एक मशीन सीखने वाले शोधकर्ता की नौकरी बेहतर गणित हो रही है, एक विशिष्ट वास्तविक दुनिया की समस्या को बेहतर ढंग से हल नहीं कर रही है।

दूसरी ओर, वास्तविक दुनिया में, यदि डेटा बेहतर है, तो यह हर चीज को धड़कता है। इसलिए, तंत्रिका नेटवर्क या यादृच्छिक वन चुनना बहुत अधिक मायने नहीं रखता है। ये सभी मॉडल एक व्यक्ति के समान हैं जो वास्तविक दुनिया की समस्याओं को हल करने के लिए मशीन लर्निंग को एक उपकरण के रूप में उपयोग करना चाहते हैं। एक व्यक्ति जो गणित या उपकरण विकसित करने में दिलचस्पी नहीं रखता है, वह सिस्टम को बेहतर बनाने के लिए विशिष्ट डोमेन ज्ञान का उपयोग करने में अधिक समय बिता सकता है।

जैसा कि मैंने टिप्पणी में उल्लेख किया है। और अगर कोई गणित से मैला है, वह अभी भी कुछ काम करने में सक्षम है।


1
(+1) यह बहुत सारे "उद्धरण" hxd हैं, वे संवाद करने के लिए क्या हैं? क्या "काम करता है" का मतलब है कि वे सोचते हैं कि यह काम करता है, लेकिन यह नहीं करता है या इसका मतलब "सॉर्ट काम करता है"?
मैथ्यू ड्र्यू

@MatthewDrury टिप्पणी के लिए धन्यवाद। मुझे लगता है कि मेरे पास बहुत सारी व्यक्तिगत भावनाएं थीं और उन्हें लिखना नहीं जानता। मुझे लगता है कि उनमें से कई औपचारिक या बहुत व्यक्तिपरक नहीं हैं। यही कारण है कि मैं बहुत सारे उद्धरण था।
हीताओ दू

मुझे लगता है कि व्यक्तिगत राय के रूप में उन्हें टैग करना अधिक स्पष्ट है। यह वह है जो मैं छात्रों के साथ कक्षा में करता हूं: "यह व्यक्तिगत राय पर आधारित है, लेकिन एसवीएम चूसना" (वास्तविक उदाहरण नहीं है, या यह है ...)
मैथ्यू ड्र्यू

@MatthewDrury मुझे लिखने की सलाह देने के लिए धन्यवाद, नहीं, जवाब में कोई उद्धरण नहीं है!
हेयताओ दू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.