नकारात्मक द्विपद वितरण बनाम द्विपद वितरण


22

नकारात्मक द्विपद वितरण और द्विपद वितरण के बीच क्या अंतर है?

मैंने ऑनलाइन पढ़ने की कोशिश की, और मैंने पाया कि ऋणात्मक द्विपद वितरण का उपयोग तब किया जाता है जब डेटा बिंदु असतत होते हैं, लेकिन मुझे लगता है कि द्विपद वितरण का उपयोग असतत डेटा बिंदुओं के लिए भी किया जा सकता है।


5
वे दोनों असतत हैं।
Glen_b -Reinstate Monica

5
सरल चित्रण: आप कैंडी डोर-टू-डोर बेच रहे हैं। प्रत्येक दरवाजे पर आप दस्तक देते हैं, आपके पास 1 कैंडी बार बेचने की संभावना 1/4 और 3/4 या 0 कैंडी बार बेचने की संभावना है। यदि आप 50 दरवाजे खटखटाते हैं तो n बार बेचने की आपकी संभावना n में द्विपद वितरण है। 30 बार बेचने के लिए मी दरवाजे पर दस्तक देने की आपकी संभावना मी में एक नकारात्मक द्विपद वितरण है। ध्यान दें कि पूर्व में 50 पर कटौती होती है क्योंकि आप 50 से अधिक बार नहीं बेच सकते हैं, जबकि उत्तरार्द्ध में अनंत पर एक पूंछ है, क्योंकि आप उस दिन केवल भयानक भाग्य रख सकते हैं और कभी भी 30 वीं बार नहीं बेच सकते हैं।
जेरी गर्न

जवाबों:


30

अंतर यह है कि हम किसमें रुचि रखते हैं। दोनों वितरण स्वतंत्र बर्नौली परीक्षणों से सफलता की निश्चित संभावना के साथ बनाए गए हैं, पी

द्विपद वितरण के साथ, यादृच्छिक चर X n परीक्षणों में देखी गई सफलताओं की संख्या है । क्योंकि परीक्षणों की एक निश्चित संख्या है, एक्स के संभावित मान 0, 1, ..., n हैं

ऋणात्मक द्विपद वितरण के साथ, यादृच्छिक चर वाई परीक्षण की संख्या है जब तक कि आर वें सफलता नहीं देखी जाती है। इस मामले में, हम परीक्षणों की संख्या बढ़ती जा रही रखना जब तक हम तक पहुंचने के आर सफलताओं। Y के संभावित मान r , r + 1 , r + 2 हैं , ... कोई ऊपरी सीमा नहीं है। ऋणात्मक द्विपद को r वें सफलता तक r असफलताओं की संख्या के संदर्भ में भी परिभाषित किया जा सकता है , बजाय r वें सफलता तक परीक्षणों की संख्या के । विकिपीडिया इस तरीके से ऋणात्मक द्विपद वितरण को परिभाषित करता है।

इसलिए संक्षेप में:

द्विपद :

  • परीक्षण की निश्चित संख्या ( एन )
  • सफलता की निश्चित संभावना ( पी )
  • यादृच्छिक चर X = सफलताओं की संख्या है।
  • संभावित मान 0 ≤ हैं एक्सn

नकारात्मक द्विपद :

  • सफलताओं की निश्चित संख्या ( आर )
  • सफलता की निश्चित संभावना ( पी )
  • रैंडम वैरिएबल Y = र की सफलता तक परीक्षणों की संख्या ।
  • संभावित मान हैं आरY

दो वितरणों के समर्थन का उल्लेख करने के लिए मुझे याद दिलाने के लिए बेन बोल्कर को धन्यवाद। उन्होंने यहां एक संबंधित प्रश्न का उत्तर दिया


4
एनबी की अधिक चर्चा यहां: आंकड़े.स्टैकएक्सचेंज . com / questions / 6728/… । यह ध्यान देने योग्य है कि द्विपद प्रतिक्रियाएं [0, N] से
बंधी हुई

अच्छा बिंदु, मैंने इसे शामिल करने के लिए अपना उत्तर अपडेट कर दिया है।
जेल्समा

विस्तृत जवाब के लिए धन्यवाद jelsema, मैं इसे अब बेहतर समझ सकता
हूं

19

नकारात्मक द्विपद वितरण, द्विपद के स्पष्ट रूप से स्पष्ट संबंध के बावजूद, वास्तव में पोइसन वितरण के मुकाबले बेहतर है। तीनों असतत हैं, btw।

λλ

यदि आपका डेटा बताता है कि विचरण माध्य (अतिविशिष्टता) से अधिक है, तो यह पॉइसन को नियमबद्ध करता है, तो नकारात्मक द्विपद को देखने के लिए अगला वितरण होगा। इसके एक से अधिक पैरामीटर हैं, इसलिए इसका विचरण माध्य से अधिक हो सकता है।

NB से द्विपद का संबंध अंतर्निहित प्रक्रिया से आता है, जैसा कि @ Jelsema के उत्तर में वर्णित किया गया था। प्रक्रिया संबंधित है, इसलिए वितरण भी हैं, लेकिन जैसा कि मैंने यहां बताया कि पॉसन वितरण का लिंक व्यावहारिक अनुप्रयोगों में करीब है।

अद्यतन: एक और पहलू पैरामीटराइजेशन है। द्विपद वितरण के दो पैरामीटर हैं: पी और एन। इसका bona fide domain 0 से n है। इसमें यह न केवल असतत है, बल्कि संख्याओं के सीमित सेट पर भी परिभाषित है।

λn


3
मुझे समझ में नहीं आता है कि "पोइसन वितरण के मुकाबले बेहतर" से आपका क्या मतलब है। मूल प्रश्न यह नहीं कहता है कि किस प्रकार का मॉडलिंग वांछित है। इसका मतलब यह भी नहीं है कि किसी को मॉडलिंग में दिलचस्पी है।
बगुलाभगत

@heropup, ओपी स्पष्ट रूप से अनुप्रयोगों में रुचि रखता है, और सीधे एनबी की द्विपद से तुलना करता है। इसलिए, मेरा जवाब उस तुलना के बारे में है, और पोइसन की तुलना विशिष्ट अनुप्रयोगों में अधिक प्रासंगिक है।
अक्कल

7

जब आप नमूना लेते हैं तो वे दोनों असतत होते हैं और मायने रखते हैं।

DNS=(DDD,DDN,DND,DNN,NDD,NDN,NND,NNN)

S=(D,ND,NND,NNND,...)

p

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.