पीडीएफ के अनुपात की संभावनाओं का अनुपात


12

मैं एक क्लस्टरिंग समस्या को हल करने के लिए Bayes का उपयोग कर रहा हूं। कुछ गणनाएं करने के बाद, मैं दो संभावनाओं के अनुपात को प्राप्त करने की आवश्यकता के साथ समाप्त होता हूं:

P(A)/P(B)

प्राप्त करने में सक्षम होने के लिए । इन संभावनाओं को दो अलग 2D बहुभिन्नरूपी KDE के एकीकरण द्वारा प्राप्त किया जाता है जैसा कि इस उत्तर में बताया गया है :P(H|D)

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

जहां f^(x,y) और g^(x,y) KDEs हैं और एकीकरण थ्रॉल्ड्स f^(ra,sa) और \ hat {के नीचे सभी बिंदुओं के लिए किया जाता है g} (r_b, s_b)g^(rb,sb) । दोनों केडीई एक गाऊसी कर्नेल का उपयोग करते हैं । एक केडीई की एक प्रतिनिधि छवि जो मैं यहां काम कर रहा हूं, के समान है: 2 डी में कर्नेल घनत्व अनुमानक को एकीकृत करना

मैं KDEs की गणना एक pythonफंक्शन के माध्यम से करता हूं

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

nमेरे सरणी की लंबाई कहां है और hबैंडविड्थ का उपयोग किया जाता है।

ऊपर के अभिन्न की गणना एक मोंटे कार्लो प्रक्रिया को लागू करने के लिए की जाती है जो काफी कम्प्यूटेशनल रूप से महंगी है। मैंने कहीं पढ़ा है (भूल गए हैं, जहां क्षमा करें) कि इस तरह के मामलों में समान रूप से वैध परिणाम प्राप्त करने के लिए थ्रेसहोल्ड बिंदुओं पर मूल्यांकन किए गए पीडीएफ (केडीई) के अनुपात से संभावनाओं के अनुपात को बदलना संभव है। मुझे इसमें दिलचस्पी है क्योंकि केडीई अनुपात की गणना एमसी के साथ इंटीग्रल के अनुपात की गणना करने की तुलना में तेजी के परिमाण का आदेश है।

इसलिए इस अभिव्यक्ति की वैधता पर सवाल कम किया गया है:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

किन परिस्थितियों में, यदि कोई हो, तो क्या मैं कह सकता हूं कि यह रिश्ता सही है?

[फिक्स्ड टाइपो (EDIT)]


जोड़ें :

यहाँ मूल रूप से एक ही प्रश्न है, लेकिन अधिक गणितीय रूप में बनाया गया है ।


1
ध्यान दें कि उपयुक्त का अस्तित्व इंटीग्रल्स के माध्यम से मूल्यवान प्रमेय द्वारा सुनिश्चित किया जाता है। ra,b,sa,b
डेव

1
मेरा मानना ​​है कि मिल्स रेशियो प्रासंगिक हो सकता है।
whuber

@ व्ह्यूबर के अनुपात में स्पष्ट रूप से यह आवश्यक है कि मुझे वह मूल्य पता हो, P(X)जिसकी गणना से बचने के लिए मैं कोशिश कर रहा हूं। क्या आप उस पैरामीटर की प्रासंगिकता पर थोड़ा विस्तार कर सकते हैं?
गेब्रियल

जवाबों:


3

केडीई सामान्य वितरण का एक मिश्रण है। आइए उनमें से एक को देखें।

और की परिभाषाएं दिखाती हैं कि उनके मूल्य विमान में अनुवाद और पुनर्जीवन के तहत अपरिवर्तनीय हैं, इसलिए यह पीडीएफ साथ मानक सामान्य वितरण पर विचार करने के लिए पर्याप्त है । असमानतापी ( बी ) एफP(A)P(B)f

f(x,y)f(r,s)

के बराबर है

x2+y2r2+s2.

ध्रुवीय निर्देशांक परिचय अभिन्न को फिर से लिखने की अनुमति देता हैρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

अब मिश्रण पर विचार करें। क्योंकि यह रैखिक है,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

वास्तव में, और आनुपातिक हैं। आनुपातिकता का स्थान ।पीfP2πh2


और बीच इस तरह के एक आनुपातिक संबंध विशेष रूप सेPf एक सरल प्रतिधारण पर विचार करके सराहना की जा सकती है। मान कि में इकाई क्षेत्र के औसत दर्जे के सेट पर समान वितरण है और में औसत दर्जे का सेट पर समान वितरण है जो से और जिसका क्षेत्रफल । फिर पीडीएफ के साथ मिश्रण निरंतर मूल्य है पर , पर , और शून्य कहीं और है। विचार करने के लिए तीन मामले हैं:1 2 2 1 μ > 1 = 1 / 2 + 2 / 2 1 / 2f1A1f2A2A1μ>1f=f1/2+f2/21/2 1 / ( 2 μ ) एक 2A11/(2μ)A2

  1. ( आर , एस ) = 1 / 2 पी ( आर , एस ) = 1(r,s)A1 । यहाँ 1/2 अपनी अधिकतम, पूर्णता । अनुपात ।f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. ( आर , एस ) 1 / 2 0 एक 1 1 / 2 ( आर , एस ) / पी ( आर , एस ) = ( 1(r,s)A2 । यहाँ सख्ती से से कम लेकिन से अधिक है । इस प्रकार एकीकरण का क्षेत्र का पूरक है और परिणामी इंटीग्रल को बराबर होना चाहिए । अनुपात ।f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. कहीं और, शून्य है और अभिन्न शून्य है।fP

जाहिर है कि अनुपात (जहां यह परिभाषित किया गया है) स्थिर नहीं है और और बीच भिन्न होता है । हालाँकि यह वितरण निरंतर नहीं है, फिर भी इसे एक सामान्य वितरण जोड़कर बनाया जा सकता है। दोनों eigenvalues ​​को छोटा बनाकर , यह वितरण को बहुत कम बदल देगा और गुणात्मक रूप से समान परिणाम देगा - केवल अब अनुपात के मूल्यों में अंतराल में सभी संख्याएं शामिल होंगी ।1 / μ 1 ( 0 , Σ ) Σ / पी [ 1 , 1 / μ ]11/μ1(0,Σ)Σf/P[1,1/μ]


यह परिणाम अन्य आयामों के लिए भी सामान्य नहीं होता है। अनिवार्य रूप से एक ही गणना जो इस उत्तर को शुरू करती है, यह दर्शाती है कि एक अधूरा गामा फ़ंक्शन है और यह स्पष्ट रूप से जैसा नहीं है । उस दो आयामों को विशेष रूप से सराहा जा सकता है, ध्यान दें कि में एकीकरण अनिवार्य रूप से दूरियों की चिंता करता है और जब वे सामान्य रूप से वितरित होते हैं, तो दूरी फ़ंक्शन में वितरण होता है - जो घातीय वितरण है। घातांक कार्य अपने स्वयं के व्युत्पन्न के आनुपातिक होने में अद्वितीय है - इंटीग्रांड और इंटीग्रल आनुपातिक होना चाहिए।एफ पी χ 2 ( 2 ) एफ पीPfPχ2(2)fP


यह एक अविश्वसनीय रूप से जवाब देने वाला है, बहुत बहुत धन्यवाद। मुझे आपके द्वारा यहां लिखी गई सभी चीज़ों को पूरी तरह से संसाधित करने में थोड़ा समय लगेगा, लेकिन मैं आपको पूरी तरह से गणना पर भरोसा करता हूं जिसका अर्थ है कि मैंने प्रश्न को हल के रूप में चिह्नित किया है। चीयर्स।
गैब्रियल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.