लॉजिस्टिक रिग्रेशन बनाम ऑग्मेंटेड वैरिएबल पूर्वाग्रह बनाम साधारण से कम वर्ग के प्रतिगमन में वैरिएबल वैरिएबल बायस


17

मेरे पास लॉजिस्टिक और लीनियर रिग्रेशन में छोड़े गए वैरिएबल पूर्वाग्रह के बारे में एक सवाल है।

कहो कि मैं एक रैखिक प्रतिगमन मॉडल से कुछ चर को छोड़ देता हूं। यह बताएं कि जो छोड़े गए चर मेरे मॉडल में शामिल चर के साथ असंबंधित हैं। उन छोड़े गए चर मेरे मॉडल में गुणांक को पक्षपात नहीं करते हैं।

लेकिन लॉजिस्टिक रिग्रेशन में, मैंने अभी सीखा कि यह सच नहीं है। छोड़े गए चरों में शामिल चर पर गुणांक होगा, भले ही छोड़े गए चर शामिल चर के साथ असंबंधित हों। मुझे इस विषय पर एक पेपर मिला, लेकिन मैं इसके प्रमुख या पूंछ नहीं बना सकता।

यहां कागज और कुछ पावरपॉइंट स्लाइड हैं।

पूर्वाग्रह, जाहिरा तौर पर, हमेशा शून्य की ओर है। क्या कोई समझा सकता है कि यह कैसे काम करता है?


क्या आप इस बात से परिचित हैं कि लॉजिस्टिक रिग्रेशन मॉडल एक अंतर्निहित "अव्यक्त-चर" रैखिक प्रतिगमन मॉडल से कैसे निकलता है?
एलेकोस पापाडोपोलोस

@AlecosPapadopoulos I एक नहीं है। पकवान क्या है?
एलेक्सिस

ऐसे अन्य लेख हैं जो इस पर चर्चा करते हैं, लेकिन आप जिस से जुड़े हैं वह सबसे आसान है जो मुझे पता है। इसलिए मुझे नहीं लगता कि मैं इस पर सुधार कर सकता हूं।
मार्टन Buis

प्रिय श्री पापड़ोपोलोस: मैंने अव्यक्त-चर विचार पर पढ़ा है। तुमने क्यों पूछा?
कन्फ्यूज्ड

@ एलेक्सिस इस पोस्ट को देखें। इस पोस्ट, सांख्यिकी.स्टैकएक्सचेंज.com / questions / 80611 / , और विकिपीडिया लेख, en.wikipedia.org/wiki/… । यह दृष्टिकोण यह भी स्पष्ट करता है कि यह वह अनुमान है जो हम अंतर्निहित मॉडल की त्रुटि अवधि पर करते हैं जो यह निर्धारित करता है कि हम संभाव्यता स्तर पर किस मॉडल को प्राप्त करेंगे। एक और उदाहरण के लिए, अगर हम मान लेते हैं कि अंतर्निहित त्रुटि एक समान प्रकार है, हम रैखिक संभावना मॉडल प्राप्त, देखते हैं, stats.stackexchange.com/questions/81789
Alecos पापाडोपौलोस

जवाबों:


21

"क्षीणन पूर्वाग्रह" के मामले को और अधिक स्पष्ट रूप से प्रस्तुत किया जा सकता है यदि हम "प्रोबेट" मॉडल की जांच करते हैं -लेकिन परिणाम तार्किक उपद्रव पर भी ले जाता है।

सशर्त संभाव्यता मॉडल (लॉजिस्टिक) (लॉगिट), "प्रोबिट", और "रैखिक संभाव्यता" मॉडल के नीचे) हम एक अव्यक्त (अप्रचलित) रैखिक प्रतिगमन मॉडल पोस्ट कर सकते हैं:

y=Xβ+u

जहां एक सतत सर्वनाश चर रहा है (और एक्स regressor मैट्रिक्स है)। त्रुटि शब्द को रजिस्टरों से स्वतंत्र माना जाता है , और एक वितरण का पालन करने के लिए जिसमें शून्य के चारों ओर एक घनत्व सममित होता है , और हमारे मामले में, मानक सामान्य वितरण F U ( u ) = Φ ( u )yXFU(u)=Φ(u)

हम मानते हैं कि हम क्या निरीक्षण, यानी द्विआधारी चर , सर्वनाश का सूचक समारोह है y * :yy

y=1ify>0,y=0ify0

फिर हम पूछते हैं कि "क्या संभावना है कि मूल्य 1 लेगा जो रजिस्टरों को दिया गया है?" (यानी हम एक सशर्त संभावना देख रहे हैं)। ये हैy1

P(y=1X)=P(y>0X)=P(Xβ+u>0X)=P(u>XβX)=1Φ(Χβ)=Φ(Xβ)

मानक संचयी वितरण फ़ंक्शन की "प्रतिबिंबित" संपत्ति के कारण अंतिम समानता, जो कि शून्य से घनत्व फ़ंक्शन की समरूपता से आती है। ध्यान दें कि हालांकि हम मान लिया है कि के स्वतंत्र है एक्स , पर कंडीशनिंग एक्स आदेश मात्रा के इलाज के लिए की जरूरत है एक्स β के रूप में गैर यादृच्छिक।uXXXβ

यदि हम मान लेते हैं कि , तो हम सैद्धांतिक मॉडल प्राप्त करते हैंXβ=b0+b1X1+b2X2

(1)P(y=1X)=Φ(b0+b1X1+b2X2)

अब को X 1 से स्वतंत्र होने दें और गलत तरीके से अंतर्निहित प्रतिगमन के विनिर्देश से बाहर रखा जाए। तो हम निर्दिष्ट करते हैंX2X1

आगे मान लें कि एक्स 2 भी एक सामान्य यादृच्छिक चर रहा है एक्स 2 ~ एन ( μ 2 , σ 2 2 ) । लेकिन इसका मतलब यह है कि

y=b0+b1X1+ϵ
X2X2N(μ2,σ22)

ϵ=u+b2X2N(b2μ2,1+b22σ22)

सामान्य वितरण (और स्वतंत्रता धारणा) के बंद होने के अलावा के कारण। पहले की तरह ही तर्क को लागू करना, यहाँ हमारे पास है

P(y=1X1)=P(y>0X1)=P(b0+b1X1+ϵ>0X1)=P(ϵ>b0b1X1X1)

हमारे पास चर का मानकीकरण हैϵ

P(y=1X1)=1P(ϵb2μ21+b22σ22(b0+b2μ2)1+b22σ22b11+b22σ22X1X1)

(2)P(y=1X1)=Φ((b0+b2μ2)1+b22σ22+b11+b22σ22X1)

और एक मॉडल और ( 2 ) की तुलना कर सकता है ।(1)(2)

b1

b^1pb11+b22σ22|b^1|<|b1|

जो "शून्य के प्रति पूर्वाग्रह" परिणाम है।

ϵ

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.