लॉजिस्टिक रिग्रेशन में अतिवृद्धि


14

मैं लॉजिस्टिक रिग्रेशन में अतिविशिष्टता की अवधारणा पर एक हैंडल पाने की कोशिश कर रहा हूं। मैंने पढ़ा है कि जब एक प्रतिक्रिया चर का विचरण द्विपद वितरण से अपेक्षित होता है, तो ओवरडायर्स विचलन होता है।

लेकिन अगर एक द्विपद चर केवल दो मान (1/0) हो सकता है, तो इसका मतलब और विचरण कैसे हो सकता है?

मैं बर्नौली परीक्षणों की x संख्या से सफलताओं के माध्य और विचरण की गणना के साथ ठीक हूं। लेकिन मैं एक माध्य की अवधारणा के चारों ओर अपना सिर नहीं लपेट सकता और एक चर के विचरण जो केवल दो मान हो सकते हैं।

क्या कोई इसका सहज अवलोकन प्रदान कर सकता है:

  1. एक चर में माध्य और विचरण की अवधारणा जिसमें केवल दो मूल्य हो सकते हैं
  2. एक चर में अतिसूक्ष्म की अवधारणा जो केवल दो मान हो सकती है

1
20 मान जोड़ें , जहां 10 और 10 । क्या आप इसे 20 से विभाजित कर सकते हैं? क्या आप sd गणना कर सकते हैं ? 0 1 yy01y
साइकोरैक्स का कहना है कि

अच्छी तरह से डाल दिया तो मेरा मानना ​​है कि इसका मतलब है = 0.5, मानक विचलन = 0.11।
लूसियानो

मान लें कि मेरी प्रतिक्रिया चर में 100 सफलताएं और 5 असफलताएं थीं। क्या यह अतिविशिष्ट होने की संभावना है?
लूसियानो

लुसियानो, आपको यह निर्धारित करने के लिए प्रयोग के एक से अधिक प्राप्ति की आवश्यकता है कि क्या यह अतिविशिष्ट है।
अंडरटेकर

जवाबों:


10

परीक्षणों के साथ एक द्विपद यादृच्छिक चर और सफलता पी की संभावना दो से अधिक मान ले सकती है। द्विपद यादृच्छिक चर उन में सफलताओं की संख्या का प्रतिनिधित्व करता है एन परीक्षणों, और वास्तव में कर सकते हैं लेने के एन + 1 विभिन्न मूल्यों ( 0 , 1 , 2 , 3 , , एन )। इसलिए यदि उस वितरण का विचरण द्विपद मान्यताओं के तहत होने की अपेक्षा बहुत अधिक है (शायद उदाहरण के लिए अतिरिक्त शून्य हैं), तो यह अतिविशिष्टता का मामला है। एनपीएनएन+10,1,2,3,,एन

अतिवृद्धि बर्नौली यादृच्छिक चर ( ) के लिए कोई मतलब नहीं हैएन=1

एक लॉजिस्टिक रिग्रेशन वक्र के संदर्भ में, आप एक "छोटे स्लाइस" या समूहन पर विचार कर सकते हैं, एक द्विपद प्रयोग की प्राप्ति के लिए पूर्वसूचक मूल्य की एक संकीर्ण सीमा के माध्यम से (शायद हमारे पास स्लाइस में 10 अंक एक निश्चित संख्या के साथ हों सफलताओं और असफलताओं)। भले ही हम वास्तव में प्रत्येक पूर्वसूचक मूल्य पर कई परीक्षण नहीं करते हैं और हम कच्चे काउंट के बजाय अनुपात देख रहे हैं, हम फिर भी इन "स्लाइस" में से प्रत्येक के अनुपात को वक्र के करीब होने की उम्मीद करेंगे। यदि इन "स्लाइस" में वक्र से दूर होने की प्रवृत्ति है, तो वितरण में बहुत अधिक परिवर्तनशीलता है। इसलिए टिप्पणियों को समूहीकृत करके, आप व्यक्तिगत रूप से 0/1 डेटा को देखने के बजाय द्विपद यादृच्छिक चर की प्रतीति बनाते हैं।

नीचे दिया गया उदाहरण इस साइट के एक अन्य प्रश्न से है। कहते हैं कि नीली रेखाएं भविष्यवक्ता चर की सीमा पर अपेक्षित अनुपात का प्रतिनिधित्व करती हैं। नीली कोशिकाएँ देखी गई स्थितियों (इस मामले में स्कूलों) को दर्शाती हैं। यह एक चित्रमय प्रतिनिधित्व प्रदान करता है कि ओवरडिप्रेसन कैसे दिख सकता है । ध्यान दें कि नीचे ग्राफ़ की कोशिकाओं की व्याख्या करने के साथ खामियां हैं, लेकिन यह एक विचार प्रदान करता है कि ओवरडाइस्पोर्ट खुद को कैसे प्रकट कर सकता है।

फैलाव उदाहरण पर


1
लेकिन मैं लॉजिस्टिक रिग्रेशन के संदर्भ में अतिविशिष्टता में दिलचस्पी रखता हूं। लॉजिस्टिक रिग्रेशन में एक प्रेडिक्टर वेरिएबल के प्रत्येक मान के लिए, एन ट्रायल नहीं है, केवल एक ही ट्रायल है। और उस एक परिणाम का परिणाम या तो सफलता है या असफल
लूसियानो

मैंने सिर्फ रैखिक प्रतिगमन के संदर्भ में अतिसूक्ष्मवाद के पीछे अंतर्ज्ञान को संबोधित करने के लिए एक पैराग्राफ जोड़ा।
अंडरमिनर

1
Underminer, मैं कल्पना करने की कोशिश कर रहा हूं कि इस वाक्य से आपका क्या मतलब है: "अगर इन" स्लाइस "में वक्र से दूर होने की प्रवृत्ति है, तो वितरण में बहुत अधिक परिवर्तनशीलता है"। यहाँ मुझे लगता है कि आप क्या मतलब है: वक्र पर टुकड़ा पर जहां कहते हैं कि सफलता की संभावना 0.1-0.3 है वहाँ सफलता के बहुत सारे हैं और वक्र पर टुकड़ा है जहाँ कहते हैं 0.7-0.9 की सफलता की संभावना बहुत हैं विफल रहता है। क्या आपका यही मतलब है और यह अतिविशिष्टता का प्रतिनिधित्व करेगा?
लूसियानो

1
@ लुसियानो सही विचार है। लेकिन ध्यान रखें कि "स्लाइस" का एक संतुलन होना चाहिए जो कि फिट होने के लिए पहले से बहुत ऊपर और बहुत नीचे से बहुत नीचे हो। इसलिए यह कहना अधिक यथार्थवादी हो सकता है कि 0.7 के आसपास के एक स्लाइस में बहुत अधिक सफलताएं (शायद 100%) हैं और अगली स्लाइस में 0.75 के आसपास बहुत कम (50%) हैं तो 0.80 में बहुत अधिक (100%), इत्यादि हैं। उम्मीद से अधिक विचरण देखा जाएगा।
अंडरटेकर

मैंने हां, अच्छी तरह से समझाया
लूसियानो

7

जैसा कि पहले से ही दूसरों ने नोट किया है, एक बर्नौली (0/1) चर के मामले में अतिविशिष्टता लागू नहीं होती है, क्योंकि उस मामले में, मतलब जरूरी विचरण को निर्धारित करता है। लॉजिस्टिक रिग्रेशन के संदर्भ में, इसका मतलब है कि यदि आपका परिणाम द्विआधारी है, तो आप फैलाव पैरामीटर का अनुमान नहीं लगा सकते हैं। (एनबी इसका मतलब यह नहीं है कि आप टिप्पणियों के बीच संभावित संबंध को सिर्फ इसलिए अनदेखा कर सकते हैं क्योंकि आपका परिणाम द्विआधारी है!)

यदि, दूसरी ओर, आपका परिणाम अनुपात का एक सेट है, तो आप पियर्सन ची-स्क्वेरड स्टैटिस्टिक्स (या डिविज़न) को विभाजित करके एक फैलाव पैरामीटर का अनुमान लगा सकते हैं (जो, हालांकि, एक से अधिक, एक से कम भी हो सकता है)। ) स्वतंत्रता के अवशिष्ट डिग्री द्वारा।

याद रखें, विशुद्ध रूप से द्विआधारी परिणाम के साथ लॉजिस्टिक प्रतिगमन केवल सामान्य लॉजिस्टिक प्रतिगमन मॉडल का एक विशेष मामला है जिसमें द्विपद सूचकांक एक से अधिक हो सकता है (और टिप्पणियों में भिन्न हो सकता है)। इस प्रकार, यह सवाल कि क्या आप लॉजिस्टिक रिग्रेशन मॉडल फिट कर रहे हैं या नहीं, इस सवाल से कोई संबंध नहीं है कि आपका डेटा ओवरड्रेस किया गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.