एक नकारात्मक द्विपद वितरण का उपयोग करने के लिए एक पॉइसन वितरण का उपयोग करके एक प्रक्रिया की मॉडलिंग से स्विच करें?


24

हमारे पास एक यादृच्छिक प्रक्रिया है जो समय-समय पर अवधि के एक निर्धारित समय में कई बार हो सकती है । हमारे पास इस प्रक्रिया के पहले से मौजूद मॉडल से एक डेटा फीड है, जो की अवधि में होने वाली कई घटनाओं की संभावना प्रदान करता है । यह मौजूदा मॉडल पुराना है और हमें अनुमान त्रुटियों के लिए फ़ीड-डेटा पर लाइव चेक चलाने की आवश्यकता है। डेटा-फीड का उत्पादन करने वाला पुराना मॉडल (जो समय-शेष टी में होने वाली n घटनाओं की संभावना प्रदान कर रहा है ) लगभग पोइसन वितरित है।टी0टी<टीnटी

तो विसंगतियों / त्रुटियों के लिए जाँच करने के लिए, हम करते हैं टी शेष समय हो सकता है और एक्सटी ईवेंट की कुल संख्या शेष समय में होने के लिये हो टी । पुराने मॉडल का तात्पर्य अनुमानों पी(एक्सटीसी) । तो हमारी धारणा के तहत एक्सटी~प्वासों(λटी) हमारे पास है: \ P (X_t \ leq c) = e ^ {- \ lambda} \ sum_ {k = 0} ^ c \ frac { \ lambda_t ^ कश्मीर} {कश्मीर!} \ ,. पुराने मॉडल (टिप्पणियों y_ {t} ) के आउटपुट से

पी(एक्सटीसी)=-λΣकश्मीर=0सीλटीकश्मीरकश्मीर!
हमारी घटना दर \ lambda_t प्राप्त करने के लिए , हम एक राज्य अंतरिक्ष दृष्टिकोण का उपयोग करते हैं और राज्य संबंध को मॉडल करते हैं: y_t = \ lambda_t + \ varepsilon_t \ quad (\ varepsilon_t \ sim N) (? 0, H_t)),। λटीyटी
yt=λt+εt(εtN(0,Ht)).
हम पुराने मॉडल से टिप्पणियों को λt , फ़िल्टर्ड राज्य E (\ lambda_t | Y_t) को प्राप्त करने के लिए \ lambda_t के विकास के लिए एक राज्य स्थान [निरंतर गति क्षय] मॉडल का उपयोग करते हैं E(λt|Yt)और अनुमानित घटना आवृत्ति में एक विसंगति / त्रुटि को चिह्नित करते हैं। फ़ीड-डेटा यदि E(λt|Yt)<yt

यह दृष्टिकोण पूरा समय-अवधि में अनुमानित ईवेंट की संख्या में त्रुटियों उठा पर अच्छी तरह से सनक से काम करता T , लेकिन इतनी अच्छी तरह से करता है, तो हम एक और अवधि के लिए भी ऐसा ही करना चाहते हैं नहीं 0t<σ जहां σ<23T । इसके आस-पास जाने के लिए, हमने तय किया है कि हम अब नकारात्मक द्विपद वितरण का उपयोग करना चाहते हैं ताकि हम अब X_t \ sim NB (r, p) मान लें XtNB(r,p)और हमारे पास:

P(Xtc)=prk=0c(1p)k(k+r1r1),
जहां पैरामीटर λ को अब r और p से बदल दिया गया हैp। इसे लागू करने के लिए सीधा होना चाहिए, लेकिन मुझे व्याख्या के साथ कुछ कठिनाइयां आ रही हैं और इस प्रकार मेरे कुछ प्रश्न हैं जिनकी मैं आपकी मदद करना चाहूंगा:

1. क्या हम केवल नकारात्मक द्विपद वितरण में p = \ lambda सेट कर सकते हैं p=λ? यदि नहीं, तो क्यों नहीं?

2. मान लें कि हम p = f (\ lambda) सेट कर सकते हैं पी=(λ)जहाँ कुछ फ़ंक्शन है, हम r को सही तरीके से कैसे सेट कर सकते हैं आर(क्या हमें पिछले डेटा सेट का उपयोग करके r फिट करने की आवश्यकता है आर)?

3. Is आर घटनाओं की संख्या में किसी विशेष प्रक्रिया के दौरान होने की उम्मीद पर निर्भर है?


r (और p ) के लिए अनुमान निकालने के लिए परिशिष्ट :

मुझे पता है कि अगर वास्तव में यह समस्या उलट थी, और हमारे पास प्रत्येक प्रक्रिया के लिए घटना की गणना थी, तो हम और लिए अधिकतम संभावना अनुमानक को अपना सकते हैं । बेशक अधिकतम संभावना अनुमानक केवल उन नमूनों के लिए मौजूद है जिनके लिए नमूना विचरण नमूना माध्य से बड़ा होता है, लेकिन यदि ऐसा होता तो हम स्वतंत्र रूप से वितरित प्रेक्षणों लिए संभावना फ़ंक्शन को सेट कर सकते थे। as: जिसमें से हम लॉग- को इस प्रकार लिख सकते हैं: पी एन कश्मीर 1 , कश्मीर 2 , ... , k एन एल ( आर , पी ) = एन Π मैं = 1 पी ( k मैं ; आर , पी ) , एल ( आर , पी ) = एन Σ मैं = 1 ln ( Γ ( k i + r ) = 1 ln ( krpNk1,k2,,kN

L(r,p)=i=1NP(ki;r,p),
l(r,p)=i=1Nln(Γ(ki+r))i=1Nln(ki!)Nln(Γ(r))+i=1Nkiln(p)+Nrln(1p).
अधिकतम खोजने के लिए हम और संबंध में आंशिक व्युत्पत्ति लेते हैं और उन्हें शून्य के बराबर सेट करते हैं: सेटिंग और सेटिंग हम पाते हैं: पी आर एल ( आर , पी )rpआरएल(आर,पी)=पीएल(आर,पी)=0पी= एन Σ मैं =
rl(r,p)=i=1एनψ(कश्मीरमैं+आर)-एनψ(आर)+एनln(1-पी),पीएल(आर,पी)=Σमैं=1एनकश्मीरमैं1पी-एनआर11-पी
आरएल(आर,पी)=पीएल(आर,पी)=0आरएल(आर,पी)=एनΣमैं=1ψ(kमैं+आर)-एनψ(आर)+पी=Σमैं=1एनकश्मीरमैं(एनआर+Σमैं=1एनकश्मीरमैं),
आरएल(आर,पी)=Σमैं=1एनψ(कश्मीरमैं+आर)-एनψ(आर)+एनln(आरआर+Σमैं=1एनकश्मीरमैंएन)=0।
इस समीकरण को न्यूटन या ईएम का उपयोग करके बंद फॉर्म में आर के लिए हल नहीं किया जा सकता है। हालाँकि, इस स्थिति में ऐसा नहीं है। यद्यपि हम पिछले डेटा का उपयोग स्थैतिक प्राप्त करने के लिए कर सकते हैं और यह हमारी प्रक्रिया के लिए वास्तव में किसी भी तरह का उपयोग नहीं है, हमें समय में इन मापदंडों को अनुकूलित करने की आवश्यकता है, जैसे कि हमने पॉइसन का उपयोग किया था। आरपी

1
केवल अपने डेटा को पॉइसन या नकारात्मक द्विपद प्रतिगमन मॉडल में प्लग क्यों नहीं करें?
स्टेट्सटूडेंट

1
मैं नहीं लग रहा है यह चाहिए है इस्तेमाल किया जा रहा। यह ध्यान में रखते हुए कि पोइसन नकारात्मक द्विपद का सीमित मामला है, इस समस्या को उसी तरह से व्यवस्थित करने का कोई तरीका होना चाहिए जैसे मैंने पॉइसन के लिए किया है। इसके अलावा, यह प्रक्रिया हजारों अंतर प्रक्रियाओं के लिए एक साथ होती है और किसी में भी "घटना दर" नहीं होती है, जिसका अर्थ है कि इन मापदंडों के लिए प्रतिगमन विश्लेषण सभी जीवित प्रक्रियाओं के लिए हर नए अवलोकन में किया जाना चाहिए। यह संभव नहीं है। मेरे प्रश्न और टिप्पणी को पढ़ने के लिए समय निकालने के लिए बहुत-बहुत धन्यवाद, यह सबसे अधिक सराहनीय है ...
MoonKnight

1
यदि आप के पास को फैलाव चर तो और । यह एकीकृत करने पर सीमांत NB वितरण । आप इसका उपयोग मदद करने के लिए कर सकते हैं। (एक्सटी|λटी,आरटी,जीटी)~पीमैंरों(λटीजीटी)(जीटी|आरटी)~जीमीटरमीटर(आरटी,आरटी)(जीटी)=1vआर(जीटी)=आरटी-1जीटी
प्रोबेबिलिसलॉजिकल

यह एक बड़ी मदद है, लेकिन क्या आप इसे थोड़ा और अधिक समझ सकते हैं और कुछ स्पष्ट विवरण प्रदान कर सकते हैं? आपके समय के लिए बहुत-बहुत धन्यवाद ...
MoonKnight

1
नकारात्मक द्विपद के बजाय द्विपद का उपयोग करने के बारे में क्या? यह करना आसान हो सकता है। Anscombe FJ। पॉइसन, द्विपद और नकारात्मक-द्विपद डेटा का परिवर्तन। Biometrika। 1948; 35: 246-54।
कार्ल

जवाबों:


1

नकारात्मक द्विपद वितरण द्विपद संभावना मॉडल के समान है। यह तब लागू होता है जब निम्नलिखित धारणाएँ (स्थितियाँ) अच्छी रहती हैं 1) कोई भी प्रयोग एक ही स्थिति के तहत तब तक किया जाता है जब तक कि निश्चित संख्या में सफलताएँ न मिलें, C, 2 प्राप्त होता है) प्रत्येक प्रयोग के परिणाम को दो श्रेणियों में से एक में वर्गीकृत किया जा सकता है। , सफलता या असफलता 3) सफलता की संभावना P प्रत्येक प्रयोग के लिए समान है 40 प्रत्येक प्रयोग अन्य सभी से स्वतंत्र है। पहली स्थिति द्विपद और नकारात्मक द्विपद के बीच एकमात्र महत्वपूर्ण अंतर कारक है


0

पोइसन वितरण 1 की तरह कुछ शर्तों के तहत द्विपद का एक उचित अनुमान हो सकता है) प्रत्येक परीक्षण के लिए सफलता की संभावना बहुत कम है। P -> 0 2) np = m (कहते हैं) अंतिम है। अक्सर राजनेताओं द्वारा उपयोग किया जाने वाला नियम यह है कि पोइसोन द्विपद का एक अच्छा सन्निकटन है जब n 20 से अधिक या बराबर है और p बराबर या 5 से कम है %

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.