मैं ए / बी परीक्षण करने का प्रयास कर रहा हूं, बेसिकियन तरीके से, जैसा कि हैकर्स और बायेसियन ए / बी परीक्षणों के लिए प्रोबैबीलिस्टिक प्रोग्रामिंग में । दोनों लेखों का मानना है कि निर्णय निर्माता यह तय करता है कि कौन सा वेरिएंट पूरी तरह से कुछ मानदंड की संभावना पर आधारित है, जैसे इसलिए, ए बेहतर है। यह संभावना इस बात पर कोई जानकारी नहीं देती है कि इससे पर्याप्त निष्कर्ष निकालने के लिए पर्याप्त मात्रा में डेटा था या नहीं। इसलिए, मुझे यह स्पष्ट नहीं है कि परीक्षण कब रोकना है।
मान लीजिए कि दो बाइनरी आरवी, और बी हैं , और मैं अनुमान लगाना चाहता हूं कि यह कितनी संभावना है कि पी ए > पी बी , और पी ए - पी बीAऔरBकी टिप्पणियों के आधार पर। इसके अतिरिक्त, मान लीजिए किपीएऔरपीबीपोस्टरीयर बीटा-वितरित हैं।
जब से मैं पा सकते हैं के लिए मानकों पी ए और पी बी , मैं डाकियों का नमूना ले सकता हूं, और अनुमान लगा सकता हूं P ( p A > p B | data ) । अजगर में उदाहरण:
import numpy as np
samples = {'A': np.random.beta(alpha1, beta1, 1000),
'B': np.random.beta(alpha2, beta2, 1000)}
p = np.mean(samples['A'] > samples['B'])
मैं प्राप्त कर सकता हूं, उदाहरण के लिए, । अब मैं कुछ ऐसा करना चाहते हैं हैं पी ( पी ए > पी बी | डेटा ) = 0.95 ± 0.03 ।
मैंने विश्वसनीय अंतराल और बेयर्स कारकों के बारे में शोध किया है, लेकिन यह समझ नहीं पा रहा है कि इस मामले के लिए उनकी गणना कैसे करें यदि वे बिल्कुल भी लागू हैं। मैं इन अतिरिक्त आंकड़ों की गणना कैसे कर सकता हूं ताकि मेरे पास एक अच्छा समाप्ति मानदंड हो?