आश्रित डेटा के लिए बर्नौली यादृच्छिक चर का योग कैसे बनाएं?


9

मेरे पास लगभग समान प्रश्न हैं: मैं बर्नौली यादृच्छिक चर का योग कैसे कुशलता से कर सकता हूं?

लेकिन सेटिंग काफी अलग है:

  1. S=i=1,NXi , , ~ 20, ~ 0.1P(Xi=1)=piNpi

  2. हमारे पास बर्नौली यादृच्छिक चर के परिणामों के लिए डेटा है: ,Xi,jSj=i=1,NXi,j

  3. यदि हम अधिकतम संभावना वाले अनुमान के साथ अनुमान लगाते हैं (और get ), तो यह पता चलता है कि बहुत बड़ा है। अन्य मानदंडों द्वारा अपेक्षित:pip^iMLEP^{S=3}(p^iMLE)P^{S=3}(p^iMLE)P^expected{S=3}0.05

  4. इसलिए, और को स्वतंत्र नहीं माना जा सकता (उनकी छोटी निर्भरता है)।XiXj (j>k)

  5. इस तरह के कुछ अवरोध हैं: और (ज्ञात), जिसे के आकलन में मदद करनी चाहिए ।pi+1pis2P^{S=s}=AP{S}

हम इस मामले में बर्नोली यादृच्छिक चर का योग कैसे बना सकते हैं?

कार्य को हल करने के लिए कौन सा साहित्य उपयोगी हो सकता है?

UPDATED

कुछ और विचार हैं:

(1) यह मानना ​​संभव है कि श्रृंखला में 1 या अधिक सफलताओं के बाद बीच अज्ञात निर्भरता शुरू होती है। तो जब , और ।Xii=1,KXi>0pK+1pK+1pK+1<pK+1

(2) MLE का उपयोग करने के लिए हमें कम से कम संदिग्ध मॉडल की आवश्यकता है। यहाँ एक प्रकार है:

P{X1,...,Xk}=(1p1)...(1pk) यदि किसी भी K अगर और , और किसी भी k के लिए।i=1,kXi=0P{X1,...,Xk,Xk+1,...,XN}=(1p1)...pkP{Xk+1,...,XN}i=1,k1Xi=0Xk=1P{Xk+1=1,Xk+2=1,...,XN=1}pk+1pk+2...pN

(3) चूँकि हम केवल में रुचि रखते हैं, हम ( सफलता N- (k + 1) +1 के )। औरP{S}P{Xk+1,...,XN}P{i=1,kXi=s;N(k+1)+1=l}i=k+1,NXiP{i=k,NXi=s;Nk+1=l}=ps,l

(4) पैरामीटर और आधार पर मॉडल के लिए MLE का उपयोग करें साथ के लिए (और किसी भी ) और कुछ अन्य देशी constrains ।p1,...,pNp0,1,p1,1;p0,2,p1,2,p2,2;...ps,l=0s6l

क्या इस योजना के साथ सब कुछ ठीक है?

अद्यतन 2

अनुभवजन्य वितरण (लाल) के कुछ उदाहरणों की तुलना में पॉइसन वितरण (नीला) (पोइसन का मतलब 2.22 और 2.45 है, नमूना आकार 332 और 259 है):P{S}

sample1 sample2

नमूने के लिए (A1, A2) पॉसों के साथ 2.28 और 2.51 (नमूना आकार 303 और 249 हैं):

sample3 sample4

शामिल samlpe A1 + A2 के लिए (नमूना आकार 552 है):

नमूना 3 + नमूना 4

लगता है कि पोइसन के लिए कुछ सुधार सबसे अच्छा मॉडल होना चाहिए :)।


2
क्या हैं ? Xi,j
CHL

1
@ और (2) में सूत्र और (4) में दूसरी बाधा का कोई मतलब नहीं है: टोपी का मतलब (4) में क्या है? क्या है ? (आपने केवल परिभाषित किया है , नहीं ।) क्या अभिव्यक्ति में (4) तीन उत्पादों का योग है या कुछ और? SSjS
whuber

Xi,j बर्नौली यादृच्छिक परिणाम (j-th श्रृंखला में i-th परिणाम) हैं, योग (श्रृंखला के योग) का j-th परिणाम है। योग का यादृच्छिक चर है; हैट इन (4) का मतलब अनुमान है। इसलिए के निम्नतम मूल्यों के योग के बारे में कुछ अतिरिक्त जानकारी है । गलतफहमी के लिए खेद है। SjSS
एंड्री

जवाबों:


3

एक दृष्टिकोण सामान्यीकृत रैखिक मॉडल (GLM) के साथ का मॉडल बनाना होगा । यहां, आप , हाल ही के अवलोकन इतिहास के (th के रूप में एक लॉजिस्टिक लीनियर) फ़ंक्शन पर सफलता की संभावना तैयार करेंगे। तो आप अनिवार्य रूप से एक ऑटोरेस्पेक्टिव GLM फिट कर रहे हैं जहाँ शोर बर्नौली है और लिंक फ़ंक्शन लॉगिट है। सेटअप है:Xpii

pi=f(b+a1Xi1+a2Xi2+akXik) , जहां

f(x)=11+exp(x) , और

XiBernoulli(pi)

मॉडल के पैरामीटर , जो लॉजिस्टिक प्रतिगमन द्वारा अनुमान लगाया जा सकता है। (आपको बस इतना करना है कि प्रत्येक परीक्षण में अवलोकन इतिहास के प्रासंगिक हिस्से का उपयोग करके अपने डिज़ाइन मैट्रिक्स को सेट करें, और इसे एक लॉजिस्टिक रिग्रेशन आकलन फ़ंक्शन में पास करें; लॉग-लाइबिलिटी अवतल है इसलिए मापदंडों के लिए एक अद्वितीय वैश्विक अधिकतम है)। यदि परिणाम वास्तव में स्वतंत्र हैं, तो का शून्य पर सेट हो जाएगा; सकारात्मक का अर्थ है कि जब भी सफलता देखी जाती है, तो बाद में की वृद्धि होती है।{b,a1,ak}aiaipi

मॉडल नहीं है अधिक संभावना के लिए एक सरल अभिव्यक्ति प्रदान योग की की है, लेकिन इस अनुकरण द्वारा गणना करने के लिए आसान है (कण को छानने या एमसीएमसी) के बाद से मॉडल सरल Markovian संरचना है।Xi

मस्तिष्क में न्यूरॉन्स के "स्पाइक्स" के बीच अस्थायी निर्भरता को मॉडल करने के लिए इस तरह के मॉडल का बड़ी सफलता के साथ उपयोग किया गया है, और ऑटोरिएरिव बिंदु प्रक्रिया मॉडल पर एक व्यापक साहित्य है। देखें, उदाहरण के लिए, Truccolo et al 2005 (हालांकि यह पेपर बर्नौली की संभावना के बजाय एक पॉइज़न का उपयोग करता है, लेकिन एक से दूसरे तक मैपिंग सीधी है)।


1

यदि निर्भरता clumping के कारण होती है, तो एक यौगिक Poisson मॉडल मॉडल के रूप में समाधान हो सकता है । कुछ हद तक एक यादृच्छिक संदर्भ यह बारबोर और चिरसैफिनौ द्वारा किया गया है।Sj

पूरी तरह से अलग दिशा में, जब से आप इंगित करते हैं कि 20 है, और इस प्रकार अपेक्षाकृत छोटा है, ग्राफिकल मॉडल का निर्माण करने के लिए हो सकता है , लेकिन मुझे नहीं पता कि आपका सेटअप और डेटा इसे संभव बनाते हैं या नहीं। @Chl टिप्पणियों के रूप में, यह उपयोगी होगा यदि आप वर्णन करते हैं कि क्या हैं।NXijXi,j

यदि का अनुक्रमिक मापों का प्रतिनिधित्व करते हैं, जैसे समय के साथ, और निर्भरता इसी से संबंधित है, एक तीसरी संभावना - और ऊपर के दो सुझावों के बीच कुछ समझौता करने के लिए - एक छिपे हुए मार्कोव मॉडल का उपयोग करना है की।Xi,jXi,j


Xi,j बर्नौली यादृच्छिक परिणाम हैं। अशुद्धि के लिए क्षमा करें। तो, समय के क्रमिक समान अंतराल के लिए खेल टीमों के लिए अंकों का योग है। यह पता चला है कि पहला गोल किए जाने के बाद अंतराल में अगले लक्ष्य की संभावनाएं अलग होंगी। Xi
एंड्री
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.