शून्य-फुलाया और बाधा मॉडल के बीच अंतर क्या है?


81

मुझे आश्चर्य है कि क्या तथाकथित शून्य-फुलाए गए वितरण (मॉडल) और तथाकथित बाधा-शून्य-वितरण (मॉडल) के बीच स्पष्ट अंतर है? साहित्य में शब्द बहुत बार आते हैं और मुझे संदेह है कि वे समान नहीं हैं, लेकिन क्या आप कृपया मुझे सरल शब्दों में अंतर समझाएंगे?

जवाबों:


80

दिलचस्प सवाल के लिए धन्यवाद!

अंतर: मानक गणना मॉडल की एक सीमा यह है कि शून्य और नॉनजेरोस (सकारात्मक) को एक ही डेटा-जनरेटिंग प्रक्रिया से आने के लिए माना जाता है। बाधा मॉडल के साथ , ये दो प्रक्रियाएं समान होने के लिए विवश नहीं हैं। मूल विचार यह है कि एक बर्नौली संभावना द्विआधारी परिणाम को नियंत्रित करती है कि क्या एक गिनती चर में एक शून्य या सकारात्मक अहसास है। यदि अहसास सकारात्मक है, तो बाधा पार हो जाती है, और सकारात्मक के सशर्त वितरण को ट्रंकेटेड-एट-शून्य काउंट डेटा मॉडल द्वारा नियंत्रित किया जाता है। शून्य-फुलाया मॉडल के साथप्रतिक्रिया चर बर्नौली वितरण (या शून्य पर एक बिंदु द्रव्यमान कहते हैं) और एक पॉइसन वितरण (या गैर-नकारात्मक पूर्णांक पर समर्थित किसी भी अन्य गणना वितरण) के मिश्रण के रूप में तैयार किया गया है। अधिक विवरण और सूत्रों के लिए, उदाहरण के लिए, गुरुमू और त्रिवेदी (2011) और डेलरिम्पल, हडसन और फोर्ड (2003) देखें।

उदाहरण: बाधा मॉडल व्यक्तियों द्वारा सामना किए जाने वाले अनुक्रमिक निर्णय लेने की प्रक्रियाओं से प्रेरित हो सकते हैं। आप पहले यह तय करें कि आपको कुछ खरीदने की ज़रूरत है या नहीं, और फिर आप उस चीज़ की मात्रा (जो सकारात्मक होनी चाहिए) तय करें। जब आपको कुछ खरीदने के निर्णय के बाद (या संभावित रूप से) कुछ भी खरीदने की अनुमति दी जाती है, तो ऐसी स्थिति का एक उदाहरण है जहां शून्य-फुलाया गया मॉडल उपयुक्त है। शून्य दो स्रोतों से आ सकता है: ए) खरीदने का कोई निर्णय नहीं; ख) खरीदना चाहता था, लेकिन कुछ भी नहीं खरीद रहा था (जैसे स्टॉक से बाहर)।

बीटा: बाधा मॉडल दो भागों वाले मॉडल का एक विशेष मामला है जो अध्याय 16 के पेड़ (2011) में वर्णित है। वहां, हम देखेंगे कि दो-भाग मॉडल के लिए, उपयोग की जाने वाली स्वास्थ्य देखभाल की मात्रा एक सतत और साथ ही एक गणना चर हो सकती है। तो साहित्य में "शून्य-फुलाया गया बीटा वितरण" को कुछ हद तक भ्रमित किया गया है, वास्तव में दो-भाग वितरण और मॉडल (एक्ट्युरियल साइंस में सामान्य) की श्रेणी में आता है, जो एक बाधा मॉडल की उपरोक्त परिभाषा के अनुरूप है। । इस उत्कृष्ट पुस्तक ने खंड 12.4.1 में शून्य-फुलाया गया मॉडल और धारा 12.4.2 में बाधा मॉडल पर चर्चा की, जिसमें एक्चुअरी एप्लिकेशन के सूत्र और उदाहरण हैं।

इतिहास: कोवेरेट्स के बिना शून्य-फुलाया हुआ पॉइसन (ज़िप) मॉडल का एक लंबा इतिहास है (उदाहरण के लिए, जॉनसन और कोट्ज़, 1969)। कोविरेट्स को शामिल करने वाले ज़िप प्रतिगमन मॉडल का सामान्य रूप लैंबर्ट (1992) के कारण है। बाधा मॉडल पहले एक कनाडाई सांख्यिकी क्रैग (1971) द्वारा प्रस्तावित किए गए थे, और बाद में मुल्लाही (1986) द्वारा इसे और विकसित किया गया। आप क्रॉस्टन (1972) पर भी विचार कर सकते हैं, जहां शून्य के वर्चस्व वाले पूर्णांक-मूल्यवान प्रक्रिया का वर्णन करने के लिए बर्नौली प्रक्रिया के साथ सकारात्मक ज्यामितीय गिनती का उपयोग किया जाता है।

R: अंत में, यदि आप R का उपयोग करते हैं, तो साइमन जैकमैन द्वारा बाधा () और zeroinfl () कार्यों में Achim Zeileis द्वारा "पॉलिटिकल साइंस कम्प्यूटेशनल लेबोरेटरी में विकसित R के लिए कक्षाएं और तरीके" के लिए पैकेज pscl है।

उपरोक्त उत्पादन करने के लिए निम्नलिखित संदर्भों की सलाह ली गई है:

  • गुरुमू, एस। और त्रिवेदी, पीके एक्सेन्ट जीरो इन काउंट मॉडल्स इन रिक्रिएशनल ट्रिप्स जर्नल ऑफ़ बिज़नेस एंड इकोनॉमिक स्टैटिस्टिक्स, 1996, 14, 469-477
  • जॉनसन, एन।, कोटज़, एस।, सांख्यिकी में वितरण: असतत वितरण। 1969, ह्यूटन मिज़िन, बोस्टन
  • लैंबर्ट, डी।, विनिर्माण क्षेत्र में दोषों के लिए एक आवेदन के साथ शून्य-फुलाया हुआ पॉइज़न प्रतिगमन। टेक्नोमेट्रिक्स, 1992, 34 (1), 1-14।
  • क्रैग, जेजी ड्यूरेबल गुड्स इकोनोमेट्रिक, 1971, 39, 829-844 की मांग के लिए आवेदन के साथ सीमित डिपेंडेंट वेरिएबल्स के लिए कुछ सांख्यिकीय मॉडल
  • मुल्ला, जे। संशोधित और कुछ संशोधित गणना डेटा मॉडल का परीक्षण जर्नल ऑफ़ इकोनोमेट्रिक्स, 1986, 33, 341-365
  • फ़्रीज़, ईडब्ल्यू रिग्रेशन मॉडलिंग विथ एक्चुएरियल एंड फाइनेंशियल एप्लीकेशन कैम्ब्रिज यूनिवर्सिटी प्रेस, 2011
  • Dalrymple, एमएल; हडसन, आईएल एंड फोर्ड, आरपीके फिनिट मिक्सचर, जीरो-इनफ्लाइटेड पॉइसन और हर्ल्ड मॉडल, एसयूडी कम्प्यूटेशनल स्टैटिस्टिक्स एंड डेटा एनालिसिस, 2003, 41, 491-504
  • क्रॉस्टन, JD पूर्वानुमान और आंतरायिक मांगों के लिए स्टॉक नियंत्रण परिचालन अनुसंधान त्रैमासिक, 1972, 23, 289-113

2
एक बाधा मॉडल वास्तव में एक "मॉडल" ही है, फिर? या यह दो अनुक्रमिक, और अलग-अलग अनुमानित मॉडल चल रहा है? कल्पना करें कि प्रतिस्पर्धा के स्कोर (1 - जीत का अंतर) को देखते हुए चुनावी दौड़ की प्रतिस्पर्धात्मकता की मॉडलिंग करें। यह [0, 1) से घिरा है, क्योंकि कोई संबंध नहीं हैं (उदाहरण के लिए, 1)। तो हम पहले 0 बनाम (0, 1) का विश्लेषण करने के लिए एक लॉजिस्टिक रिग्रेशन करते हैं। तब हम (0, 1) मामलों का विश्लेषण करने के लिए बीटा रिग्रेशन करते हैं। ऐसा लगता है कि ये दो अलग-अलग मॉडल हैं, अपने स्वयं के गुणांक और अलग अनुमान के साथ? या क्या मैं कुछ न कुछ भूल रहा हूं?
मार्क व्हाइट

उदाहरण के लिए, आप अपने उत्तर में उल्लेख करते हैं कि शून्य (ए) कार खरीदने का फैसला नहीं करने के कारण हो सकता है, या (बी) के लिए चाहते हैं, लेकिन यह स्टॉक से बाहर था। ऐसा लगता है कि बाधा मॉडल दोनों के बीच अंतर करने में सक्षम नहीं होगा, क्योंकि वे क्रमिक रूप से किए जाते हैं ...?
मार्क व्हाइट

एक अन्य उदाहरण पर विचार करें: प्रतिक्रियाएं हैं [1, 7], पारंपरिक लिकर्ट स्केल की तरह, 7. छत पर एक विशाल छत प्रभाव के साथ, एक ऐसा बाधा मॉडल कर सकता है जो लॉजिस्टिक रिग्रेशन [1, 7) बनाम 7 और फिर टोबिट रिग्रेशन हो। उन सभी मामलों के लिए जहां मनाया प्रतिक्रियाएं हैं <7. फिर, हमें प्रतिगमन गुणांक के दो सेट मिलते हैं, और उन्हें अलग से अनुमानित किया जाता है। ऐसा लगता है जैसे हम इन प्रक्रियाओं को संयुक्त रूप से नहीं कर रहे हैं, लेकिन दो बिल्कुल अलग मॉडल में? तो, क्या बाधा वास्तव में एक मॉडल है, या बस एक पंक्ति में दो अलग-अलग प्रकार के सामान्यीकृत रैखिक मॉडल करने की प्रक्रिया है?
मार्क व्हाइट

मैंने अपने स्वयं के पोस्ट में इस प्रश्न को यहां दिया है: आंकड़े
मार्क व्हाइट

47

बाधा मॉडल यह मानते हैं कि केवल एक प्रक्रिया है जिसके द्वारा एक शून्य का उत्पादन किया जा सकता है, जबकि शून्य-फुलाया गया मॉडल यह मानता है कि 2 अलग-अलग प्रक्रियाएं हैं जो एक शून्य का उत्पादन कर सकती हैं।

बाधा मॉडल 2 प्रकार के विषयों को मानते हैं: (1) वे जो कभी परिणाम का अनुभव नहीं करते हैं और (2) वे जो हमेशा परिणाम का अनुभव करते हैं कम से कम एक बार। शून्य-फुलाया गया मॉडल उन विषयों के रूप में अवधारणा करता है (1) जो कभी परिणाम का अनुभव नहीं करते हैं और (2) वे जो परिणाम का अनुभव कर सकते हैं या हमेशा नहीं।

सरल शब्दों में: शून्य-फुलाया और बाधा मॉडल दोनों भागों में वर्णित हैं।

पहला ऑन-ऑफ हिस्सा है, जो एक द्विआधारी प्रक्रिया है। सिस्टम प्रायिकता " " और "on" प्रायिकता । (यहां, को मुद्रास्फीति की संभावना के रूप में जाना जाता है।) जब सिस्टम "बंद" होता है, तो केवल शून्य गणना संभव है। यह हिस्सा शून्य-फुलाया और बाधा मॉडल के लिए समान है।π1ππ

दूसरा भाग गिनती का हिस्सा है, जो तब होता है जब सिस्टम "चालू" होता है। यह वह जगह है जहाँ शून्य-फुलाया और बाधा मॉडल भिन्न होते हैं। शून्य-फुलाए गए मॉडल में, काउंट अभी भी शून्य हो सकते हैं। बाधा मॉडल में उन्हें नॉनजरो होना चाहिए। इस भाग के लिए, शून्य-फुलाया गया मॉडल "सामान्य" असतत संभाव्यता वितरण का उपयोग करता है, जबकि बाधा मॉडल शून्य-काटे गए असतत संभाव्यता वितरण फ़ंक्शन का उपयोग करते हैं।

बाधा मॉडल का उदाहरण: एक ऑटोमोबाइल निर्माता अपने ऑटोमोबाइल के लिए दो गुणवत्ता नियंत्रण कार्यक्रमों की तुलना करना चाहता है। यह उनकी तुलना किए गए वारंटी दावों की संख्या के आधार पर करेगा। प्रत्येक कार्यक्रम के लिए, यादृच्छिक रूप से चयनित ग्राहकों के एक सेट का 1 वर्ष के लिए पालन किया जाता है और उनके द्वारा फाइल किए गए वारंटी दावों की संख्या गिना जाता है। दो कार्यक्रमों में से प्रत्येक के लिए मुद्रास्फीति की संभावनाओं की तुलना तब की जाती है। "बंद" राज्य "शून्य दावा" दायर किया गया है, जबकि "चालू" राज्य "कम से कम एक दावा दायर किया गया है।"

शून्य-फुलाए गए मॉडल का उदाहरण: ऊपर के एक ही अध्ययन में, शोधकर्ताओं को पता चला है कि ऑटोमोबाइल पर कुछ मरम्मत वारंटी के दावे के दाखिल किए बिना तय की गई थी। इस तरह, जीरो गुणवत्ता नियंत्रण समस्याओं के अभाव के साथ-साथ गुणवत्ता नियंत्रण समस्याओं की उपस्थिति का एक मिश्रण है जिसमें कोई वारंटी का दावा शामिल नहीं था। "बंद" राज्य का अर्थ है "दायर किए गए शून्य दावे" जबकि "चालू" राज्य का अर्थ है "कम से कम एक दावा दायर करना या दावा दायर किए बिना मरम्मत करना।"

एक अध्ययन के लिए यहां देखें जिसमें दोनों प्रकार के मॉडल एक ही डेटा सेट पर लागू किए गए थे।


विस्तृत उत्तर के लिए धन्यवाद। क्या आपके पास जोड़ा शून्य के साथ मानक बीटा वितरण के लिए उपयुक्त शब्दावली है? शून्य-फुलाए गए मॉडल की अपनी परिभाषा का उपयोग करते हुए, स्पष्ट रूप से शून्य का एक स्रोत है, इसलिए इसे शून्य-फुलाया नहीं जा सकता है ... इस चर्चा को देखें आँकड़े ।stackexchange.com
skulker

2
मुझे @Hibernating द्वारा सुझाया गया "शून्य-जोड़ा बीटा वितरण" पसंद है
डैरेन जेम्स

10

मॉडल में ~ 0 की प्रायिकता के साथ और ~ Poisson ( ) के साथ वितरण की संभावना , इस प्रकार मॉडल 2 घटकों के साथ मिश्रण मॉडल है और: yiπyiλ1π

Pr(yj=0)=π+(1π)eλ
Pr(yj=xi)=(1π)λxieλxi!,xi1

और मॉडल ~ 0 में प्रायिकता के साथ और ~ संभाव्यता के साथ किए हुए ( ) वितरण , और: yiπyiλ1π

Pr(yj=0)=π
Pr(yj=xi)=(1π)1eλ(λxieλxi!),xi1

4

बाधा मॉडल के बारे में, यहाँ गणितीय और सांख्यिकीय मॉडलिंग (अर्नोल्ड, बालाकृष्णन, सरबिया, और मेइंज्यूज़, 2008) में अग्रिमों का एक उद्धरण है :

बाधा मॉडल को बाधा के नीचे की प्रक्रिया और ऊपर वाले की विशेषता है। जाहिर है, सबसे व्यापक रूप से इस्तेमाल किया जाने वाला बाधा मॉडल वह है जो बाधा को शून्य पर सेट करता है। औपचारिक रूप से, बाधा-पर-शून्य मॉडल के रूप में व्यक्त किया जाता है: लिए लिएP(Ni=ni)=f1(0)ni=0 P(Ni=ni)=1f1(0)1f2(0)f2(ni)=ϕf2(ni)ni=1,2,...

परिवर्तनीय को बाधा को पार करने की संभावना के रूप में व्याख्या की जा सकती है, या बीमा के मामले में अधिक सटीक रूप से, कम से कम एक दावे की रिपोर्ट करने की संभावना।ϕ

शून्य-फुलाए गए मॉडल के लिए, विकिपीडिया कहता है :

एक शून्य-फुलाया गया मॉडल एक शून्य-प्रवर्तित संभाव्यता वितरण पर आधारित एक सांख्यिकीय मॉडल है, यानी एक वितरण जो लगातार शून्य-मूल्यवान टिप्पणियों के लिए अनुमति देता है।

शून्य-फुलाया हुआ पॉइसन मॉडल एक यादृच्छिक घटना की चिंता करता है जिसमें इकाई समय में अतिरिक्त शून्य-गणना डेटा होता है। उदाहरण के लिए, किसी भी कवर किए गए व्यक्ति द्वारा बीमा कंपनी के दावों की संख्या लगभग हमेशा शून्य होती है, अन्यथा काफी नुकसान बीमा कंपनी को दिवालिया होने का कारण होगा। शून्य फुलाया हुआ पॉइसन (जिप) मॉडल दो घटकों को नियोजित करता है जो दो शून्य पैदा करने वाली प्रक्रियाओं के अनुरूप होते हैं। पहली प्रक्रिया एक द्विआधारी वितरण द्वारा शासित होती है जो संरचनात्मक शून्य उत्पन्न करती है। दूसरी प्रक्रिया एक पॉइसन वितरण द्वारा नियंत्रित होती है जो मायने रखता है, जिनमें से कुछ शून्य हो सकते हैं। दो मॉडल घटकों को निम्नानुसार वर्णित किया गया है:[1]

Pr(yj=0)=π+(1π)eλ
Pr(yj=hi)=(1π)λhieλhi!,hi1
जहाँ परिणाम चर का कोई भी ऋणात्मक पूर्णांक मान नहीं है, th के लिए अपेक्षित काउंट है ; अतिरिक्त शून्य की संभावना है।yjλiiπ

अर्नोल्ड और सहकर्मियों (2008) से, मैं देखता हूं कि एक बाधा-पर-शून्य मॉडल बाधा वर्ग के अधिक सामान्य वर्ग का एक विशेष मामला है, लेकिन विकिपीडिया ( हॉल, 2004 ) के एक संदर्भ से , मैं यह भी देखता हूं कि कुछ शून्य- फुलाया मॉडल ऊपरी बांधा जा सकता है। मैं सूत्रों के अंतर को काफी नहीं समझता, लेकिन वे काफी हद तक समान हैं (दोनों एक समान उदाहरण, बीमा दावों का भी उपयोग करते हैं)। मुझे आशा है कि अन्य उत्तर किसी भी महत्वपूर्ण अंतर को समझाने में मदद कर सकते हैं, और यह उत्तर उन लोगों के लिए मंच निर्धारित करने में मदद करेगा।

विकिपीडिया का संदर्भ:

  1. लैम्बर्ट, डी। (1992)। विनिर्माण में दोष के लिए एक आवेदन के साथ शून्य फुलाया हुआ पॉइसन प्रतिगमन। टेक्नोमेट्रिक्स, 34 (1), 1-14।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.