चूँकि मैं एक सॉफ्टवेयर इंजीनियर हूँ और अधिक आँकड़े जानने की कोशिश कर रहा हूँ, इससे पहले कि मैं शुरू करूँ, मुझे माफ करना पड़ेगा, यह गंभीर newb क्षेत्र है ...
मैं PyMC सीख रहा हूं और कुछ वास्तव में (वास्तव में) सरल उदाहरणों के माध्यम से काम कर रहा हूं । एक समस्या जिसका मुझे काम नहीं मिल सकता है (और इसके लिए कोई संबंधित उदाहरण नहीं मिल सकता है) दो सामान्य वितरण से उत्पन्न डेटा के लिए एक मॉडल फिटिंग है।
कहो मेरे पास 1000 मान हैं; एक से उत्पन्न 500 Normal(mean=100, stddev=20)
और एक से उत्पन्न 500 Normal(mean=200, stddev=20)
।
यदि मैं उनके लिए एक मॉडल फिट करना चाहता हूं, यानी PyMC का उपयोग करके दो साधन और एकल मानक विचलन निर्धारित करता हूं। मुझे पता है कि यह कुछ की तर्ज पर है ...
mean1 = Uniform('mean1', lower=0.0, upper=200.0)
mean2 = Uniform('mean2', lower=0.0, upper=200.0)
precision = Gamma('precision', alpha=0.1, beta=0.1)
data = read_data_from_file_or_whatever()
@deterministic(plot=False)
def mean(m1=mean1, m2=mean2):
# but what goes here?
process = Normal('process', mu=mean, tau=precision, value=data, observed=True)
यानी, जेनरेटिंग प्रोसेस नॉर्मल है, लेकिन म्यू दो वैल्यू में से एक है। मैं अभी नहीं जानता कि मूल्य के बीच "निर्णय" का प्रतिनिधित्व कैसे किया जाता है m1
या नहीं m2
।
शायद मैं पूरी तरह से गलत तरीके से इसे मॉडलिंग करने के लिए ले रहा हूं? क्या कोई मुझे एक उदाहरण पर इंगित कर सकता है? मैं BUGS और JAGS पढ़ सकता हूं इसलिए कुछ भी वास्तव में ठीक है।