"क्षीणन पूर्वाग्रह" के मामले को और अधिक स्पष्ट रूप से प्रस्तुत किया जा सकता है यदि हम "प्रोबेट" मॉडल की जांच करते हैं -लेकिन परिणाम तार्किक उपद्रव पर भी ले जाता है।
सशर्त संभाव्यता मॉडल (लॉजिस्टिक) (लॉगिट), "प्रोबिट", और "रैखिक संभाव्यता" मॉडल के नीचे) हम एक अव्यक्त (अप्रचलित) रैखिक प्रतिगमन मॉडल पोस्ट कर सकते हैं:
y∗=Xβ+u
जहां एक सतत सर्वनाश चर रहा है (और एक्स regressor मैट्रिक्स है)। त्रुटि शब्द को रजिस्टरों से स्वतंत्र माना जाता है , और एक वितरण का पालन करने के लिए जिसमें शून्य के चारों ओर एक घनत्व सममित होता है , और हमारे मामले में, मानक सामान्य वितरण F U ( u ) = Φ ( u ) ।y∗XFU(u)=Φ(u)
हम मानते हैं कि हम क्या निरीक्षण, यानी द्विआधारी चर , सर्वनाश का सूचक समारोह है y * :yy∗
y=1ify∗>0,y=0ify∗≤0
फिर हम पूछते हैं कि "क्या संभावना है कि मूल्य 1 लेगा जो रजिस्टरों को दिया गया है?" (यानी हम एक सशर्त संभावना देख रहे हैं)। ये हैy1
P(y=1∣X)=P(y∗>0∣X)=P(Xβ+u>0∣X)=P(u>−Xβ∣X)=1−Φ(−Xβ)=Φ(Xβ)
मानक संचयी वितरण फ़ंक्शन की "प्रतिबिंबित" संपत्ति के कारण अंतिम समानता, जो कि शून्य से घनत्व फ़ंक्शन की समरूपता से आती है। ध्यान दें कि हालांकि हम मान लिया है कि के स्वतंत्र है एक्स , पर कंडीशनिंग एक्स आदेश मात्रा के इलाज के लिए की जरूरत है एक्स β के रूप में गैर यादृच्छिक।uXXXβ
यदि हम मान लेते हैं कि , तो हम सैद्धांतिक मॉडल प्राप्त करते हैंXβ=b0+b1X1+b2X2
P(y=1∣X)=Φ(b0+b1X1+b2X2)(1)
अब को X 1 से स्वतंत्र होने दें और गलत तरीके से अंतर्निहित प्रतिगमन के विनिर्देश से बाहर रखा जाए। तो हम निर्दिष्ट करते हैंX2X1
आगे मान लें कि एक्स 2 भी एक सामान्य यादृच्छिक चर रहा है एक्स 2 ~ एन ( μ 2 , σ 2 2 ) । लेकिन इसका मतलब यह है कि
y∗=b0+b1X1+ϵ
X2X2∼N(μ2,σ22)
ϵ=u+b2X2∼N(b2μ2,1+b22σ22)
सामान्य वितरण (और स्वतंत्रता धारणा) के बंद होने के अलावा के कारण। पहले की तरह ही तर्क को लागू करना, यहाँ हमारे पास है
P(y=1∣X1)=P(y∗>0∣X1)=P(b0+b1X1+ϵ>0∣X1)=P(ϵ>−b0−b1X1∣X1)
हमारे पास चर का मानकीकरण हैϵ
P(y=1∣X1)=1−P⎛⎝⎜ϵ−b2μ21+b22σ22−−−−−−−√≤−(b0+b2μ2)1+b22σ22−−−−−−−√−b11+b22σ22−−−−−−−√X1∣X1⎞⎠⎟
⇒P(y=1∣X1)=Φ⎛⎝⎜(b0+b2μ2)1+b22σ22−−−−−−−√+b11+b22σ22−−−−−−−√X1⎞⎠⎟(2)
और एक मॉडल और ( 2 ) की तुलना कर सकता है ।(1)(2)
b1
b^1→pb11+b22σ22−−−−−−−√⟹|b^1|<|b1|
जो "शून्य के प्रति पूर्वाग्रह" परिणाम है।
ϵ