हमारे पास एक यादृच्छिक प्रक्रिया है जो समय-समय पर अवधि के एक निर्धारित समय में कई बार हो सकती है । हमारे पास इस प्रक्रिया के पहले से मौजूद मॉडल से एक डेटा फीड है, जो की अवधि में होने वाली कई घटनाओं की संभावना प्रदान करता है । यह मौजूदा मॉडल पुराना है और हमें अनुमान त्रुटियों के लिए फ़ीड-डेटा पर लाइव चेक चलाने की आवश्यकता है। डेटा-फीड का उत्पादन करने वाला पुराना मॉडल (जो समय-शेष टी में होने वाली n घटनाओं की संभावना प्रदान कर रहा है ) लगभग पोइसन वितरित है।टी0 ≤ टी < टीnटी
तो विसंगतियों / त्रुटियों के लिए जाँच करने के लिए, हम करते हैं टी शेष समय हो सकता है और एक्सटी ईवेंट की कुल संख्या शेष समय में होने के लिये हो टी । पुराने मॉडल का तात्पर्य अनुमानों P ( X)टी≤ c ) । तो हमारी धारणा के तहत एक्सटी~ प्वासों( λटी) हमारे पास है:
\ P (X_t \ leq c) = e ^ {- \ lambda} \ sum_ {k = 0} ^ c \ frac { \ lambda_t ^ कश्मीर} {कश्मीर!} \ ,.
पुराने मॉडल (टिप्पणियों y_ {t} ) के आउटपुट से
P ( X)टी≤ ग ) = ई- λΣके = ०सीλकश्मीरटीके !।
हमारी घटना दर
\ lambda_t प्राप्त करने के लिए , हम एक राज्य अंतरिक्ष दृष्टिकोण का उपयोग करते हैं और राज्य संबंध को मॉडल करते हैं:
y_t = \ lambda_t + \ varepsilon_t \ quad (\ varepsilon_t \ sim N) (? 0, H_t)),।
λटीyटीyटी= λटी+ εटी( εटी∼ एन(0,Ht)).
हम पुराने मॉडल से टिप्पणियों को
λt , फ़िल्टर्ड राज्य
E (\ lambda_t | Y_t) को प्राप्त करने के लिए
\ lambda_t के विकास के लिए एक राज्य स्थान [निरंतर गति क्षय] मॉडल का उपयोग करते हैं
E(λt|Yt)और अनुमानित घटना आवृत्ति में एक विसंगति / त्रुटि को चिह्नित करते हैं। फ़ीड-डेटा यदि
E(λt|Yt)<yt ।
यह दृष्टिकोण पूरा समय-अवधि में अनुमानित ईवेंट की संख्या में त्रुटियों उठा पर अच्छी तरह से सनक से काम करता T , लेकिन इतनी अच्छी तरह से करता है, तो हम एक और अवधि के लिए भी ऐसा ही करना चाहते हैं नहीं 0≤t<σ जहां σ<23T । इसके आस-पास जाने के लिए, हमने तय किया है कि हम अब नकारात्मक द्विपद वितरण का उपयोग करना चाहते हैं ताकि हम अब X_t \ sim NB (r, p) मान लें Xt∼NB(r,p)और हमारे पास:
P(Xt≤c)=pr∑k=0c(1−p)k(k+r−1r−1),
जहां पैरामीटर
λ को अब
r और
p से बदल दिया गया है
p। इसे लागू करने के लिए सीधा होना चाहिए, लेकिन मुझे व्याख्या के साथ कुछ कठिनाइयां आ रही हैं और इस प्रकार मेरे कुछ प्रश्न हैं जिनकी मैं आपकी मदद करना चाहूंगा:
1. क्या हम केवल नकारात्मक द्विपद वितरण में p = \ lambda सेट कर सकते हैं p=λ? यदि नहीं, तो क्यों नहीं?
2. मान लें कि हम p = f (\ lambda) सेट कर सकते हैं प = च( λ )जहाँ च कुछ फ़ंक्शन है, हम r को सही तरीके से कैसे सेट कर सकते हैं आर(क्या हमें पिछले डेटा सेट का उपयोग करके r फिट करने की आवश्यकता है आर)?
3. Is आर घटनाओं की संख्या में किसी विशेष प्रक्रिया के दौरान होने की उम्मीद पर निर्भर है?
r (और p ) के लिए अनुमान निकालने के लिए परिशिष्ट :
मुझे पता है कि अगर वास्तव में यह समस्या उलट थी, और हमारे पास प्रत्येक प्रक्रिया के लिए घटना की गणना थी, तो हम और लिए अधिकतम संभावना अनुमानक को अपना सकते हैं । बेशक अधिकतम संभावना अनुमानक केवल उन नमूनों के लिए मौजूद है जिनके लिए नमूना विचरण नमूना माध्य से बड़ा होता है, लेकिन यदि ऐसा होता तो हम स्वतंत्र रूप से वितरित प्रेक्षणों लिए संभावना फ़ंक्शन को सेट कर सकते थे। as:
जिसमें से हम लॉग- को इस प्रकार लिख सकते हैं:
पी एन कश्मीर 1 , कश्मीर 2 , ... , k एन एल ( आर , पी ) = एन Π मैं = 1 पी ( k मैं ; आर , पी ) , एल ( आर , पी ) = एन Σ मैं = 1 ln ( Γ ( k i + r ) = 1 ln ( krpNk1,k2,…,kN
L(r,p)=∏i=1NP(ki;r,p),
l(r,p)=∑i=1Nln(Γ(ki+r))−∑i=1Nln(ki!)−Nln(Γ(r))+∑i=1Nkiln(p)+Nrln(1−p).
अधिकतम खोजने के लिए हम और संबंध में आंशिक व्युत्पत्ति लेते हैं और उन्हें शून्य के बराबर सेट करते हैं:
सेटिंग और सेटिंग हम पाते हैं:
पी ∂ आर एल ( आर , पी )rp∂आरएल(आर,पी)=∂पीएल(आर,पी)=0पी= एन Σ मैं =∂rl(r,p)∂pl(r,p)=∑i=1Nψ(ki+r)−Nψ(r)+Nln(1−p),=∑i=1Nki1p−Nr11−p.
∂आरएल ( आर , पी ) = ∂पीl ( आर , पी ) = 0∂आरएल(आर,पी)=एनΣमैं=1ψ(kमैं+आर)-एनψ(आर)+पी = ∑मैं = १एनकश्मीरमैं(Nआर + ∑एनमैं = १कश्मीरमैं),∂आरएल ( आर , पी ) = Σमैं = १एनψ ( केमैं+ आर ) - एनψ ( आर ) + एनln( आरआर + ∑एनमैं = १कश्मीरमैंएन) =0।
इस समीकरण को न्यूटन या ईएम का उपयोग करके बंद फॉर्म में आर के लिए हल नहीं किया जा सकता है। हालाँकि, इस स्थिति में ऐसा नहीं है। यद्यपि हम पिछले डेटा का उपयोग स्थैतिक प्राप्त करने के लिए कर
सकते हैं और यह हमारी प्रक्रिया के लिए वास्तव में किसी भी तरह का उपयोग नहीं है, हमें समय में इन मापदंडों को अनुकूलित करने की आवश्यकता है, जैसे कि हमने पॉइसन का उपयोग किया था।
आरपी