समय के साथ पूर्वाग्रह अलग करने के लिए एक पक्षपाती सिक्का कैसे मॉडल करें?


10

पक्षपाती सिक्कों के मॉडल में आमतौर पर एक पैरामीटर होता है । एक तरीका यह अनुमान लगाने के लिए एक श्रृंखला के ड्रॉ से द्विपद संभावना के साथ एक बीटा पूर्व और गणना पिछला वितरण उपयोग करने के लिए है।θθ=P(Head|θ)θ

मेरी सेटिंग्स में, कुछ अजीब शारीरिक प्रक्रिया के कारण, मेरे सिक्के के गुण धीरे-धीरे बदल रहे हैं और समय का एक कार्य बन जाता है । मेरा डेटा ऑर्डर किए गए ड्रॉ का एक सेट है, यानी । मैं विचार कर सकता हूं कि मेरे पास असतत और नियमित समय ग्रिड पर प्रत्येक लिए केवल एक ड्रॉ है ।टी { एच , टी , एच , एच , एच , टी , } टीθt{H,T,H,H,H,T,...}t

आप यह कैसे मॉडल करेंगे? मैं कुछ ऐसा सोच रहा हूँ जैसे कि कलमन फ़िल्टर इस तथ्य के अनुकूल हो कि छिपा हुआ चर और द्विपद संभावना को बनाए रखता है। का उपयोग करने के लिए मैं क्या इस्तेमाल कर सकता हूं ?पी ( θ ( टी + 1 ) | θ ( टी ) )θP(θ(t+1)|θ(t))

निम्नलिखित उत्तर संपादित करें (धन्यवाद!) : मैं ऑर्डर 1 के मार्कोव चेन के रूप में को मॉडल करना चाहूंगा जैसे कि यह एचएमएम या कलमन फिल्टर में किया जाता है। एकमात्र धारणा जो मैं बना सकता हूं, वह है चिकनी। मैं लिख सकता है साथ एक छोटा सा गाऊसी शोर (Kalman फिल्टर विचार), लेकिन इस आवश्यकता को टूट जाएगा कि रहना चाहिए । @ जेएवी के विचार के बाद, मैं वास्तविक लाइन को पर मैप करने के लिए एक प्रोबिट फ़ंक्शन का उपयोग कर सकता हूं , लेकिन मुझे अंतर्ज्ञान है कि यह एक गैर-विश्लेषणात्मक समाधान देगा। माध्य साथ एक बीटा वितरणθ ( टी ) पी ( θ ( टी + 1 ) | θ ( टी ) ) = θ ( टी ) + ε ε θ [ 0 , 1 ] [ 0 , 1 ] θ ( टी )θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) और एक व्यापक विचरण कर सकता है।

मैं यह सवाल पूछ रहा हूं क्योंकि मुझे लगता है कि यह समस्या इतनी सरल है कि पहले इसका अध्ययन किया जाना चाहिए था।


आप अनुमान लगा सकते हैं कि आपके पास समय के साथ सफलता अनुपात बदलने के लिए एक मॉडल है। कई अलग-अलग मॉडल काम करेंगे और अनुमान मॉडल के आधार पर अनुमान बहुत भिन्न हो सकते हैं। मुझे नहीं लगता कि मॉडल चुनने के लिए ट्रैक्टिबिलिटी एक व्यावहारिक मानदंड है। मैं इस प्रक्रिया को समझना चाहता हूं और एक मॉडल की तलाश करना चाहता हूं जो कि आपके द्वारा अपेक्षित व्यवहार से सहमत होने वाली विशेषता प्रदर्शित करता है।
बजे माइकल आर। चेरिक जूल

@MichaelChernick: धन्यवाद। एकमात्र धारणा जो मैं बना सकता हूं, वह यह है कि आसानी से और धीरे-धीरे आगे बढ़ रहा है। इसके अलावा ट्रैक्टबिलिटी एक महत्वपूर्ण मानदंड है क्योंकि मैं वास्तव में गैर-तुच्छ अंतर-निर्भरता के साथ बहुभिन्नरूपी मामले के समाधान का विस्तार करना चाहता हूं। एक आदर्श समाधान विश्लेषणात्मक होगा और एक नया डेटा आने पर पैरामीटर अनुमानों का 'ऑनलाइन' अपडेट देगा। θ
repied2

1
क्या आप इसका मतलब निकाल सकते हैं कि " " आसानी से और धीरे-धीरे चल रहा है? " पूर्णांक असतत हैं, और सुचारू कार्य हैं जो पूर्णांकों पर मनमाना मान लेते हैं, जिसका अर्थ है कि चिकनाई कोई बाधा नहीं देती है। "धीरे" की कुछ धारणाएँ अभी भी कोई अड़चन नहीं देती हैं, जबकि कुछ करते हैं। θ
डगलस ज़रे

0.1 / यूनिट समय या 0.001 या ... की संभावना में परिवर्तन की तरह "धीरे-धीरे" कितनी तेजी से होता है, और आप कब तक एक अनुक्रम होने की उम्मीद करते हैं? क्या सीमा अपेक्षाकृत संकीर्ण है (उदाहरण के लिए, 0.2 - 0.4) या यह (0,1) के करीब आती है?
19

@DouglasZare 'चिकनी' से, मैं यह बताना चाहता था कि E [t_t + 1 | =_t] = t_t (या बहुत करीब) और VAR (θ_t + 1 | θ_t) छोटा है। θ आसपास नहीं कूद रहा है (अन्यथा वास्तव में कुछ भी नहीं किया जा सकता है)।
repied2

जवाबों:


2

मुझे संदेह है कि आप विश्लेषणात्मक समाधान के साथ एक मॉडल के साथ आ सकते हैं, लेकिन आपके उपकरण की निर्भरता संरचना सरल होने के साथ ही सही साधनों का उपयोग करके आक्षेप को अभी भी ट्रैक किया जा सकता है। मशीन लर्निंग रिसर्चर के रूप में, मैं निम्नलिखित मॉडल का उपयोग करना पसंद करूंगा क्योंकि एक्सपेक्टेशन प्रॉपर्टीजेशन की तकनीक का उपयोग करके इनवेंशन को काफी कुशल बनाया जा सकता है:

बता दें कि -th ट्रायल का परिणाम है । आइए हम समय-भिन्न पैरामीटर को परिभाषित करेंटीX(t)t

टी 0η(t+1)N(η(t),τ2) के लिए ।t0

साथ लिंक करने के लिए , अव्यक्त चर परिचयएक्स ( टी )η(t)X(t)

Y(t)N(η(t),β2) ,

और मॉडल होना चाहिएX(t)

Y ( टी ) 0 एक्स ( टी ) = 0 वाई ( टी ) पी [ एक्स ( टी ) = 1 ] = Φ ( η ( टी ) / β ) Φ θ ( टी ) = η ( टी ) / βX(t)=1 यदि , और अन्यथा। आप वास्तव में नजरअंदाज कर सकते हैं और उन्हें केवल , (with पीडीएफ के साथ हाशिए पर कर सकते हैं मानक सामान्य) लेकिन अव्यक्त चरों की शुरूआत से अनुमान आसान हो जाता है। इसके अलावा, ध्यान दें कि आपके मूल पैराट्राइज़ेशन ।Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

यदि आप इंट्रेंस एल्गोरिथ्म को लागू करने में रुचि रखते हैं, तो इस पेपर पर एक नज़र डालें । वे एक समान मॉडल का उपयोग करते हैं ताकि आप एल्गोरिथ्म को आसानी से अनुकूलित कर सकें। ईपी को समझने के लिए निम्न पृष्ठ उपयोगी हो सकता है। यदि आप इस दृष्टिकोण को आगे बढ़ाने में रुचि रखते हैं तो मुझे बताएं; मैं कैसे अनुमान एल्गोरिथ्म को लागू करने के बारे में अधिक विस्तृत सलाह प्रदान कर सकता हूं।


0

मेरी टिप्पणी पर विस्तार से बताने के लिए एक मॉडल जैसे p (t) = p ऍक्स्प (-t) एक मॉडल है जो सरल है और अधिकतम संभावना के उपयोग से का अनुमान p (t) का अनुमान लगाने की अनुमति देता है । लेकिन क्या वास्तव में संभावना तेजी से क्षय होती है। यह मॉडल स्पष्ट रूप से गलत होगा यदि आप पहले और बाद के समय की तुलना में सफलता की उच्च आवृत्ति के साथ समय अवधि का निरीक्षण करते हैं। Oscillatory व्यवहार को p (t) = p | sint के रूप में मॉडल किया जा सकता है । दोनों मॉडल बहुत अधिक ट्रैक्टेबल हैं और अधिकतम संभावना से हल किए जा सकते हैं लेकिन वे बहुत अलग समाधान देते हैं।000


1
ऐसा प्रतीत होता है कि ओपी समय , में सफलता की संभावना को चिह्नित करने के लिए एक मार्कोवियन प्रक्रिया के रूप में मॉडल करना चाहता है, न कि लिए कुछ कार्यात्मक रूप निर्दिष्ट करने के लिए । θ ( टी ) θ ( टी )tθ(t)θ(t)
मैक्रों

1
@ मैक्रो सही है, मैं लिए एक पैरामीट्रिक फॉर्म प्रदान करने में सक्षम नहीं हूं , और यह वांछनीय नहीं है क्योंकि यह फ़ंक्शन कुछ भी चिकनी हो सकता है। मैं एक मार्कोव मॉडल 1 ऑर्डर ऑफ़ हिडेन मार्कोव मॉडल या एक कलमन फ़िल्टर के समान चाहता हूं, लेकिन एक छिपे हुए चर के साथ जो 0 और 1 के बीच वास्तविक मान लेता है, और बर्नौली संभावना के साथ। theta(t)
repied2

@ पियरे ओके एडिट से पहले यह दिखाई दिया कि आप समय को बदलती पी का अनुमान लगा रहे थे और एचएमएम को संभावित दृष्टिकोण के रूप में सुझाव दे रहे थे। जिस तरह से यह टी के साथ बदलता है उसके लिए मैं एक कार्यात्मक रूप की सिफारिश नहीं कर रहा था। मैं एक बिंदु बना रहा था कि अधिक जानकारी के बिना विभिन्न प्रकार के कई मॉडल का निर्माण किया जा सकता था और मेरे दो उदाहरण यह दिखाने के लिए थे कि बिना अधिक जानकारी के मॉडल के विकल्प बहुत अलग उत्तर दे सकते हैं। आप एचएमएम पर जोर क्यों देंगे? यदि कोई काम करता है और आपके डेटा को फिट करता है तो इसे अस्वीकार क्यों करें क्योंकि यह "गैर-विश्लेषणात्मक है।
माइकल आर। चेरिक जूल 25'12 12:03

मैं सुझाव दे रहा हूं कि सुविधाजनक समाधान ढूंढना व्यावहारिक सांख्यिकीय समस्याओं को हल करने का तरीका नहीं है!
माइकल आर। चेरनिक

1
@MichaelChernick अंतिम रूप से: मैं एक विश्लेषणात्मक समाधान खोजना चाहता हूं क्योंकि मुझे आशा है कि यह एक प्रसिद्ध समस्या है और लोगों ने लचीले पर्याप्त विश्लेषणात्मक समाधान का प्रस्ताव दिया है। लेकिन मैं हमारे सुझाव से सहमत हूं कि सामान्य रूप से कम्प्यूटेशनल लागत की तुलना में 'वास्तविक गतिशीलता' का मॉडलिंग अधिक महत्वपूर्ण है। अफसोस की बात यह है कि यह बड़े डेटा के लिए है और एक धीमी गति से होने वाला
अहंकार

0

tp

p=Φ(g(t,θ))g(t,θ)Φ

Φg()g()

आपके पुन: संपादित प्रश्न का उत्तर देने के लिए:

जैसा कि आपने कहा था कि प्रोबेट का उपयोग केवल संख्यात्मक समाधान का उपयोग करेगा, लेकिन आप इसके बजाय एक लॉजिस्टिक फ़ंक्शन का उपयोग कर सकते हैं:

P[θ(t+1)]=11+exp(θ(t)+ϵ)

logP1P=θ(t)+ϵ

θ(t+1)=at3+bt2+ct+dϵϵ

P[Coint+1=H|t]=11+exp(θ(t))

ϵt


यदि आप एक प्रोबिट का उपयोग करते हैं, तो एक मल्टीवेरेट एक्सटेंशन सीधा होता है क्योंकि मल्टीवेरेट प्रोबिट का अनुमान लगाया जा सकता है। निर्भरताएँ बहुभिन्नरूपी सामान्य वितरण के सहसंयोजक मैट्रिक्स द्वारा निहित होगी।
जदव
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.