मैं एक क्लस्टरिंग समस्या को हल करने के लिए Bayes का उपयोग कर रहा हूं। कुछ गणनाएं करने के बाद, मैं दो संभावनाओं के अनुपात को प्राप्त करने की आवश्यकता के साथ समाप्त होता हूं:
प्राप्त करने में सक्षम होने के लिए । इन संभावनाओं को दो अलग 2D बहुभिन्नरूपी KDE के एकीकरण द्वारा प्राप्त किया जाता है जैसा कि इस उत्तर में बताया गया है :
जहां और KDEs हैं और एकीकरण थ्रॉल्ड्स और \ hat {के नीचे सभी बिंदुओं के लिए किया जाता है g} (r_b, s_b) । दोनों केडीई एक गाऊसी कर्नेल का उपयोग करते हैं । एक केडीई की एक प्रतिनिधि छवि जो मैं यहां काम कर रहा हूं, के समान है: 2 डी में कर्नेल घनत्व अनुमानक को एकीकृत करना ।
मैं KDEs की गणना एक python
फंक्शन के माध्यम से करता हूं ।
n
मेरे सरणी की लंबाई कहां है और h
बैंडविड्थ का उपयोग किया जाता है।
ऊपर के अभिन्न की गणना एक मोंटे कार्लो प्रक्रिया को लागू करने के लिए की जाती है जो काफी कम्प्यूटेशनल रूप से महंगी है। मैंने कहीं पढ़ा है (भूल गए हैं, जहां क्षमा करें) कि इस तरह के मामलों में समान रूप से वैध परिणाम प्राप्त करने के लिए थ्रेसहोल्ड बिंदुओं पर मूल्यांकन किए गए पीडीएफ (केडीई) के अनुपात से संभावनाओं के अनुपात को बदलना संभव है। मुझे इसमें दिलचस्पी है क्योंकि केडीई अनुपात की गणना एमसी के साथ इंटीग्रल के अनुपात की गणना करने की तुलना में तेजी के परिमाण का आदेश है।
इसलिए इस अभिव्यक्ति की वैधता पर सवाल कम किया गया है:
किन परिस्थितियों में, यदि कोई हो, तो क्या मैं कह सकता हूं कि यह रिश्ता सही है?
[फिक्स्ड टाइपो (EDIT)]
जोड़ें :
यहाँ मूल रूप से एक ही प्रश्न है, लेकिन अधिक गणितीय रूप में बनाया गया है ।
P(X)
जिसकी गणना से बचने के लिए मैं कोशिश कर रहा हूं। क्या आप उस पैरामीटर की प्रासंगिकता पर थोड़ा विस्तार कर सकते हैं?