1) हाँ। आप एक ही सहसंयोजक के साथ व्यक्तियों से द्विपदीय डेटा एकत्र कर सकते हैं? यह इस तथ्य से आता है कि एक द्विपद मॉडल के लिए पर्याप्त आंकड़ा प्रत्येक कोवरिएट वेक्टर के लिए घटनाओं की कुल संख्या है; और बर्नौली द्विपद का एक विशेष मामला है। सहज रूप से, प्रत्येक बर्नौली परीक्षण जो एक द्विपद परिणाम बनाता है, स्वतंत्र है, इसलिए इन्हें एकल परिणाम के रूप में या अलग-अलग परीक्षणों के रूप में गिनने के बीच अंतर नहीं होना चाहिए।
2) मान लें कि हमारे पास अनोखा वैक्टर है जिनमें से प्रत्येक का परीक्षणों पर द्विपद परिणाम है , अर्थात
आपने लॉजिस्टिक प्रतिगमन निर्दिष्ट किया है मॉडल, इसलिए
हालांकि हम बाद में देखेंगे कि यह महत्वपूर्ण नहीं है।एक्स 1 , x 2 , ... , एक्स एन एन मैं Y मैं ~ बी मैं n ( एन मैं , पी मैं ) एल ओ जी मैं टी ( पी मैं ) = कश्मीर Σ कश्मीर = 1 β कश्मीर एक्स मैं कश्मीरnएक्स1, एक्स2, ... , एक्सnएनमैं
Yमैं~ बी मैं n ( एनमैं, पीमैं)
logit(pi)=∑k=1Kβkxik
इस मॉडल के लिए लॉग-
और हम अपने पैरामीटर अनुमान प्राप्त करने के लिए इसे ( शब्दों में) के संबंध में अधिकतम करते हैं।
ℓ(β;Y)=∑i=1nlog(NiYi)+Yilog(pi)+(Ni−Yi)log(1−pi)
βpi
अब, विचार करें कि प्रत्येक , हम व्यक्तिगत बर्नौली / बाइनरी परिणामों में द्विपद परिणाम को विभाजित करते हैं, जैसा आपने किया है। विशेष रूप से,
, जो कि पहले 1s हैं और शेष 0s हैं। यह वही है जो आपने किया था - लेकिन आप समान रूप से पहला 0s के रूप में और बाकी 1s, या किसी अन्य ऑर्डरिंग के रूप में कर सकते हैं, है ना?i=1,…,nNi
Zi1,…,ZiYi=1
Zi(Yi+1),…,ZiNi=0
Yi(Ni−Yi)
आपकी दूसरी मॉडल का कहना है कि
के लिए एक ही प्रतिगमन मॉडल के साथ ऊपर के रूप में। इस मॉडल के लिए लॉग-
और जिस तरह से हमने अपने s को परिभाषित किया है , इस कारण इसे को सरल बनाया जा सकता है
जो बहुत परिचित दिखना चाहिए।
जेडमैं जे∼ B e r n o u l l i ( p)मैं)
पीमैंℓ ( β;जेड) = ∑मैं = १nΣज = १एनमैंजेडमैं जेलॉग( पीमैं) + ( 1 - जेडमैं जे) लॉग करें( 1 - पीमैं)
जेडमैं जेℓ ( β; Y) = ∑मैं = १nYमैंलॉग( पीमैं) + ( एनमैं- वाईमैं) लॉग करें( 1 - पीमैं)
दूसरे मॉडल में अनुमान प्राप्त करने के लिए, हम इसे संबंध में अधिकतम करते हैं । इसके और पहले लॉग- बीच एकमात्र अंतर , जो कि संबंध में निरंतर है , और इसलिए यह अधिकतमकरण को प्रभावित नहीं करता है और हम एक ही अनुमान प्राप्त करेंगे।βलॉग( एनमैंYमैं)β
3) प्रत्येक अवलोकन में एक अवशिष्ट अवशिष्ट है। द्विपद मॉडल में, वे
जहाँ आपके मॉडल से अनुमानित संभावना है। ध्यान रखें कि आपके द्विपद मॉडल (स्वतंत्रता की 0 अवशिष्ट डिग्री) संतृप्त है और सही फिट हैं: सभी टिप्पणियों के लिए है, तो सभी के लिए ।
डीमैं= 2 [ वाईमैंलॉग( यमैं/ एनमैंपी^मैं) + ( एनमैं- वाईमैं) लॉग करें( 1 - वाईमैं/ एनमैं1 - पी^मैं) ]]
पी^मैंपी^मैं= यमैं/ एनमैंडीमैं= 0मैं
बर्नौली मॉडल में,
इसके अलावा इस तथ्य के अलावा कि अब आपके पास अवशिष्ट अवशिष्ट ( द्विपद डेटा के साथ बजाय ), ये प्रत्येक
या
इस बात पर निर्भर करता है कि या , और स्पष्ट रूप से उपरोक्त के समान नहीं है। यहां तक कि अगर आप इन पर योग प्रत्येक के लिए विचलन बच की राशि प्राप्त करने के लिए , आप एक ही नहीं मिलता है:
डीमैं जे= 2 [ जेडमैं जेलॉग( Z)मैं जेपी^मैं) + ( 1 - जेडमैं जे) लॉग करें( १ - जेडमैं जे1 - पी^मैं) ]]
Σnमैं = १एनमैंnडीमैं जे= - 2 लॉग( पी^मैं)
डीमैं जे= - 2 लॉग( 1 - पी^मैं)
जेडमैं जे= 10jमैंडीमैं= ∑ज = १एनमैंडीमैं जे= 2 [ वाईमैंलॉग( 1)पी^मैं) +( एनमैं- वाईमैं) लॉग करें( 1)1 - पी^मैं) ]]
तथ्य यह है कि एआईसी अलग है (लेकिन भक्ति में परिवर्तन नहीं है) लगातार उस शब्द पर वापस आता है जो दो मॉडलों के लॉग-लिबिलिटीज के बीच अंतर था। विचलन की गणना करते समय, इसे रद्द कर दिया जाता है क्योंकि यह एक ही डेटा के आधार पर सभी मॉडलों में समान होता है। AIC के रूप में परिभाषित किया गया है
और कहा कि मिश्रित अवधि के बीच अंतर है रों:
A मैंसी= 2 के- 2 ℓ
ℓ
A मैंसीबी ई आर एन ओ यू एल एल आई- ए आईसीB i n o m i a l= 2 ∑मैं = १nलॉग( एनमैंYमैं) =9.575 पर