शून्य-फुलाया हुआ पोइसन प्रतिगमन


14

मान लीजिए स्वतंत्र हैं औरY=(Y1,,Yn)

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

इसके अलावा मानकों लगता और पी = ( पी 1 , ... , पी एन ) संतुष्टλ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

यदि एक ही सहसंयोजक और p को प्रभावित करता है ताकि B = G , तो शून्य फुलाया हुआ Poisson प्रतिगमन को Poisson प्रतिगमन के रूप में दो बार कई मापदंडों की आवश्यकता क्यों है?λpB=G


2
आपको अभी भी और λ का अनुमान लगाना होगा । B और G डिज़ाइन मैट्रिसेस (डेटा) हैं, इसलिए जो समान हैं वे पैरामीटर स्पेस के आयाम को कम नहीं करते हैं। βλBG
मैक्रो

@ मैक्रो: यदि लोगों का एक कॉलम है, तो हमें पॉसियन रिग्रेशन की तुलना में अनुमान लगाने के लिए 1 और पैरामीटर की आवश्यकता क्यों होगी? G
डेमियन

अच्छी तरह से आपको p i का अनुमान लगाना होगाpi ( "अवरोधन" मॉडल की रसद भाग में) और ( "अवरोधन" मॉडल की प्वासों भाग में) तो वहाँ 2 के बजाय मापदंडों 1. हैंλi
मैक्रो

1
@ लॉबी, मापदंडों की संख्या कम करने के लिए आपको कुछ अड़चनें बनानी होंगी। उदाहरण के लिए, , हालांकि यह सोचने का कोई कारण नहीं है कि यह समझ में आता है - खासकर क्योंकि लिंक फ़ंक्शन अलग हैं। λ=β
मैक्रों

3
@MichaelChernick - इसे शून्य-फुलाया हुआ पॉइज़न कहा जाता है क्योंकि आप मूल रूप से "पॉसिंग" को एक गैर-शून्य मान को देखने की समान सापेक्ष संभावनाओं को बनाए रखते हुए एक पोइसन डिस्ट्रिक्ट से शून्य देखने की संभावना को "फुला" रहे हैं।
जूलमैन

जवाबों:


2

शून्य फुलाया प्वासों मामले में, अगर , तो β औरB=Gβ दोनों एक ही लंबाई, जिनमें से स्तंभों की संख्या है बी या जी । इसलिए मापदंडों की संख्या डिज़ाइन मैट्रिक्स के स्तंभों की संख्या से दोगुनी है यानी इंटरसेप्ट (और जो भी डमी कोडिंग की आवश्यकता थी) सहित व्याख्यात्मक चर की संख्या से दोगुनी है।λBG

एक सीधे पॉइसन रिग्रेशन में, नहीं है चिंता करने के लिए पी वेक्टर नहीं है, λ का अनुमान लगाने की कोई आवश्यकता नहीं है। तो पैरामीटर की संख्या सिर्फ की लंबाई है β यानी आधा शून्य फुलाया मामले में मानकों की संख्या।pλβ

अब, कोई विशेष कारण नहीं है कि को G के बराबर क्यों होना चाहिए , लेकिन आमतौर पर यह समझ में आता है। हालांकि, एक एक डेटा पैदा करने की प्रक्रिया है, जहां सभी पर किसी भी घटनाओं के होने का मौका एक प्रक्रिया द्वारा बनाई गई है कल्पना कर सकता जी λ और एक पूरी तरह से अलग प्रक्रिया बी β ड्राइव देखते हैं कि कितने घटनाओं, गैर शून्य घटनाओं को देखते हुए। एक आकस्मिक उदाहरण के रूप में, मैं कुछ असंबंधित खेल खेलने के लिए उनके इतिहास परीक्षा के अंकों के आधार पर कक्षाओं को चुनता हूं, और फिर उनके द्वारा प्राप्त किए गए लक्ष्यों की संख्या का निरीक्षण करता हूं। इस मामले में B, G से काफी भिन्न हो सकता है (यदि इतिहास परीक्षा के स्कोर को चलाने वाली चीजें खेल में ड्राइविंग के प्रदर्शन के लिए अलग हैं) और be और λBGGλBβBGβλअलग-अलग लंबाई हो सकती है। B या उससे अधिक कॉलम हो सकते हैं । तो उस मामले में शून्य-फुलाया हुआ पॉइज़न मॉडल एक साधारण पॉइसन मॉडल की तुलना में अधिक पैरामीटर होगा।GB

आम तौर पर मुझे लगता है कि ज्यादातर समय G=B

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.