दो गॉसियनों के बीच अर्थ मूवर की दूरी (EMD)


26

क्या और बीच EMD (या किसी प्रकार की बाध्यता) के लिए एक बंद-फ़ॉर्मूला फॉर्मूला है ?x1N(μ1,Σ1)x2N(μ2,Σ2)


2
En.wikipedia.org/wiki/Earth_mover%27s_distance के अनुसार EMD मल्लो या वासेरस्टीन की दूरी के समान है, इसलिए आप googlin को आज़मा सकते हैं।
kjetil b halvorsen

2
आपको यह पेपर उपयोगी लग सकता है: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

जवाबों:


27

पृथ्वी के की दूरी को EMD(P,Q)=infEXY रूप में लिखा जा सकता है , जहां X और के सभी संयुक्त वितरणों में infimum लिया जाता है Y marginals साथ XP , YQ । इसे पहली वासेरस्टीन दूरी के रूप में भी जाना जाता है , जो एक ही Wp=inf(EXYp)1/p

चलो XP=N(μx,Σx) , YQ=N(μy,Σy)

निचला बाउंड: जेन्सेन की असमानता से, चूंकि मानक उत्तल हैं,

EXYE(XY)=μxμy,
इसलिए EMD हमेशा होता है कम से कम साधनों के बीच की दूरी (किसी भी वितरण के लिए)।

W2 पर आधारित ऊपरी बाउंड : फिर से जेन्सेन की असमानता के द्वारा, (EXY)2EXY2 । इस प्रकार W1W2 । लेकिन डॉसन और लैंडौ (1982) ने स्थापित किया कि

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
EMD=W1 पर एक ऊपरी बाउंड देते हुए

एक ऊपरी ऊपरी सीमा: युग्मन पर विचार करें यह नॉट और स्मिथ (1984) द्वारा व्युत्पन्न नक्शा है। , वितरण के इष्टतम मानचित्रण पर , जर्नल ऑफ़ ऑप्टिमाइज़ेशन सिद्धांत और अनुप्रयोग, 43 (1) पीपी 39-49 लिए इष्टतम मानचित्रण के रूप में ; इस ब्लॉग पोस्ट को भी देखें । ध्यान दें कि और

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
ताकि युग्मन मान्य हो।

दूरी तब , जहां अब जो कि सामान्य रूप से साथ सामान्य है XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

इस प्रकार एक ऊपरी के लिए बाध्य है । दुर्भाग्य से, इस उम्मीद के लिए एक बंद रूप सामान्य बहुभिन्नरूपी मानदंडों के लिए लिखना आश्चर्यजनक रूप से अप्रिय है: इस प्रश्न को देखें , साथ ही साथ यह भीW1(P,Q)ED

यदि का विचरण गोलाकार हो रहा है (जैसे if , , तो का विचरण हो जाता है ), पूर्व प्रश्न एक सामान्यीकृत लैगुएर बहुपद के संदर्भ में उत्तर देता है।DΣx=σx2IΣy=σy2ID(σxσy)2I

सामान्य तौर पर, हमारे पास जेन्सन की असमानता पर आधारित लिए एक सरल ऊपरी सीमा है, उदाहरण के लिए उस पहले प्रश्न में व्युत्पन्न: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
अंत में समानता है, क्योंकि मैट्रिक्स और समान हैं , तो वे एक ही eigenvalues ​​है, और इस प्रकार उनकी वर्ग जड़ों में समान निशान हैं।ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

यह असमानता तब तक सख्त है जब तक कि नहीं होता है, जो कि ज्यादातर मामलों में होता है जब ।DΣxΣy

एक अनुमान : शायद यह करीब ऊपरी बाउंड, , तंग है। फिर से, मुझे लंबे समय तक यहां एक अलग ऊपरी सीमा थी कि मैंने तंग होने के लिए अनुमान लगाया था कि वास्तव में एक की तुलना में था, इसलिए शायद आपको इस अनुमान पर बहुत अधिक भरोसा नहीं करना चाहिए। :)EDW2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.