अर्ध-द्विपद वितरण (GLM के संदर्भ में) क्या है?


30

मैं उम्मीद कर रहा हूं कि कोई व्यक्ति इस बात की सहज जानकारी दे सकता है कि क्वासिबिनोमियल वितरण क्या है और यह क्या करता है। मुझे इन बिंदुओं में विशेष रुचि है:

  1. कैसे quasibinomial द्विपद वितरण के लिए अलग है।

  2. जब प्रतिक्रिया चर एक अनुपात होता है (उदाहरण मान में 0.23, 0.11, 0.78, 0.98) शामिल हैं, तो एक क्सिबिनोमियल मॉडल आर में चलेगा लेकिन एक द्विपद मॉडल नहीं होगा।

  3. जब TRUE / FALSE प्रतिक्रिया चर अतिविशिष्ट है, तो quasibinomial मॉडल का उपयोग क्यों किया जाना चाहिए।

जवाबों:


20
  1. द्विपद वितरण और अर्ध-द्विपद के बीच का अंतर उनके संभाव्यता घनत्व कार्यों (पीडीएफ) में देखा जा सकता है, जो इन वितरणों को चिह्नित करते हैं।

    द्विपद पीडीएफ:

    P(X=k)=(nk)pk(1p)nk

    अर्ध-द्विपद पीडीएफ:

    P(X=k)=(nk)p(p+kϕ)k1(1pkϕ)nk

    अर्ध-द्विपद वितरण, जबकि द्विपद वितरण के समान, एक अतिरिक्त पैरामीटर ϕ (तक सीमित है |ϕ|min{p/n,(1p)/n} ) जो वर्णन करने का प्रयास करता है। डेटा में अतिरिक्त विचरण जिसे एक द्विपद वितरण द्वारा अकेले नहीं समझाया जा सकता है।

    (ध्यान दें कि अर्ध-द्विपद वितरण का माध्य बजाय है।)pi=0nn!ϕi(nk)!p

  2. मुझे इस पर यकीन नहीं है, शायद R में glm फंक्शन क्सीबिनोमियल मोड में वज़न जोड़ता है ताकि इस पर ध्यान दिया जा सके?

  3. अतिरिक्त पैरामीटर का उद्देश्य डेटा में अतिरिक्त विचरण का अनुमान लगाना है। प्रत्येक सामान्यीकृत रैखिक मॉडल (GLM) परिणाम / प्रतिक्रिया के लिए एक वितरण धारणा बनाता है और इस वितरण के आधार पर डेटा की संभावना को अधिकतम करता है। यह एक विकल्प है जिसे विश्लेषक बनाता है, और यदि आपको लगता है कि आपको अपने डेटा में अधिक विचरण के लिए खाते की आवश्यकता है, तो आप अपनी चमक के लिए प्रतिक्रिया को मॉडल करने के लिए अर्ध-द्विपदीय डिस्टर्बेंस चुन सकते हैं। परीक्षण करने का एक शानदार तरीका है अगर हमें एक द्विपद के बजाय एक अर्ध-द्विपद मॉडल फिट करने की आवश्यकता है, एक अर्ध-द्विपद मॉडल फिट करने के लिए है, और यह देखने के लिए परीक्षण करें कि क्या पैरामीटर 0 है।ϕϕ


2
उत्कृष्ट अलेजांद्रो, अब if पैरामीटर 0 है तो मैं कैसे परीक्षण कर सकता हूं?
जुआनची

2
ध्यान दें कि Rसाथ में glm.fit, binomialऔर quasibinomialबिल्कुल समान हैं, सिवाय इसके कि quasibinomial(1) पूर्णांक चेक को हटाता है, और (2) एनए का एआईसी देता है। देखें इस उत्तर अधिक जानकारी के लिए।
मिगेलमोरिन

-1 "इस तरह के" अर्ध-द्विपद "वितरण को glms के संदर्भ में अर्ध-द्विपद की संभावना के लिए पूरी तरह से असंबंधित लगता है, इसलिए यह देखना मुश्किल है कि इसे इतने सारे अपवित्र क्यों मिले।
जरेल टफ्टो

14

अर्ध-द्विपद आवश्यक रूप से एक विशेष वितरण नहीं है; यह विचरण और सामान्यीकृत रेखीय मॉडल के बीच संबंध के लिए एक मॉडल का वर्णन करता है जो कि द्विपद के लिए माध्य के संदर्भ में द्विपद के लिए विचरण का बार है।ϕ

एक वितरण है जो इस तरह के विनिर्देश (स्पष्ट एक - एक बढ़ाया द्विपद) को फिट बैठता है, लेकिन यह जरूरी नहीं है कि जब अर्ध-द्विपद मॉडल फिट होता है, तो इसका उद्देश्य नहीं होता है; यदि आप डेटा के लिए उपयुक्त हैं जो अभी भी 0-1 है तो इसे द्विपद नहीं बनाया जा सकता है।

तो अर्ध-द्विपद विचरण मॉडल, पैरामीटर के माध्यम से , डेटा के साथ बेहतर व्यवहार कर सकता है जिसके लिए विचरण बड़ा है (या, शायद, छोटा) की तुलना में आप द्विपद डेटा के साथ प्राप्त करेंगे, जबकि जरूरी नहीं कि यह वास्तविक वितरण हो। ।ϕ

जब प्रतिक्रिया चर एक अनुपात होता है (उदाहरण मान में 0.23, 0.11, 078, 0.98) शामिल हैं, तो एक क्सिबिनोमियल मॉडल R में चलेगा लेकिन एक द्विपद मॉडल नहीं होगा

मेरे स्मरण के लिए एक द्विपद मॉडल को अनुपात * के साथ R में चलाया जा सकता है, लेकिन आपको इसे सही सेट अप करना होगा।

* आर को द्विपदीय डेटा देने के तीन अलग-अलग तरीके हैं जिनसे मैं अवगत हूं। मुझे पूरा यकीन है कि यह एक है।


यह क्वासिलिकेलीहुड अनुमान से कैसे संबंधित है?
तैमूरकास

2
+1 (लेकिन मैं अधिक व्यापक उत्तर देखना पसंद करूंगा!)। आनुपातिक जीएलएम को आनुपातिक के साथ स्थापित करने के तीन तरीके संभवत: ये हैं: सांख्यिकी.स्टैकएक्सचेंज . com / a / 26779 / 28666 ? एक लिंक मददगार हो सकता है। इसके अलावा, "कैसैबिनोमियल" के बारे में आपने क्या कहा कि वास्तव में वितरण इस धागे में दूसरे उत्तर से संबंधित नहीं है?
अमीबा का कहना है कि

1
@amoeba आप इसके लिए एक वितरण लिख सकते हैं, जैसा कि मेरे जवाब में कहा गया था (एक छोटा द्विपद) लेकिन वह गणना डेटा के लिए वितरण नहीं हो सकता (quibibinomial सभी पूर्णांकों पर नहीं है जब तक कि फैलाव पैरामीटर 1 या न ही निरंतर डेटा के लिए नहीं है () यह असतत है!)। आमतौर पर लोग इसकी गणना-संरचना के कारण गणना डेटा के लिए इसका उपयोग करते हैं (लेकिन जिस स्थिति में घातीय परिवार में ऐसा कोई वितरण नहीं है)
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.