क्या दो वितरणों के बीच हेलिंगर दूरी का एक निष्पक्ष अनुमानक है?


20

एक सेटिंग में जहां कोई देखता है को घनत्व साथ एक वितरण से वितरित किया , मुझे आश्चर्य है कि अगर घनत्व , अर्थात् लिए एक और वितरण के लिए Hellinger दूरी का एक निष्पक्ष अनुमानक ( आधार पर ) है।X1,,XnfXif0

H(f,f0)={1Xf(x)f0(x)dx}1/2.

4
तो f0 ज्ञात और तय है। लेकिन एफ ज्ञात है या एक पैरामीट्रिक परिवार से है या आप अपने नमूने से आने वाले एफ के बारे में जानते हैं? मुझे लगता है कि किसी उत्तर का प्रयास करने पर इससे फर्क पड़ता है।
माइकल आर। चेर्निक

3
@MichaelChernick: मान लें कि आप बारे में सभी जानते हैं नमूना । fX1,,Xn
शीआन

2
मुझे नहीं लगता कि इसकी गणना की गई है (यदि वहां मौजूद है)। यदि मौजूद है, तो एआईसी का एक खोया भाई है।

4
यदि आप मान लेते हैं कि इस समस्या पर हमला संभव है तो f और f0 असतत हैं। यह एक स्पष्ट अनुमानक की ओर जाता है (EDF और बीच हेलिंगर की दूरी की गणना करें f0)। बूटस्ट्रैपिंग (सैद्धांतिक रूप से, सिमुलेशन के माध्यम से नहीं!) हमें संभावित पूर्वाग्रह के साथ-साथ पूर्वाग्रह को कम करने (या समाप्त करने) का एक तरीका देगा। मैं खुद से दूरी के बजाय वर्ग दूरी के साथ सफल होने की कुछ आशा रखता हूं , क्योंकि यह गणितीय रूप से अधिक ट्रैक्टेबल है। असतत की धारणा fअनुप्रयोगों में कोई समस्या नहीं है; असतत की जगह fवैसे भी एक घनी सबसेट है।
व्हीबर

2
यह रोज़ेनब्लाट के सबूत नहीं "सदाशयी" की निष्पक्ष आकलनकर्ता है कि वहाँ मन में आता है । क्या हम उस पर काबू पा सकते हैं और एच ( एफ , एफ 0 ) का एक अनबिकेड अनुमानक प्राप्त कर सकते हैं ? मुझे नहीं पता। fH(f,f0)
ज़ेन

जवाबों:


5

या तो कोई निष्पक्ष आकलनकर्ता या के एच 2 के लिए मौजूद है वितरण के किसी भी यथोचित व्यापक nonparametric वर्ग से।HH2f

हम इसे खूबसूरती से सरल तर्क के साथ दिखा सकते हैं

बिकल और लेहमैन (1969)। उत्तल परिवारों में निष्पक्ष अनुमान । गणितीय सांख्यिकी, 40 (5) 1523-1535। ( प्रोजेक्ट यूक्लिड )

कुछ वितरण ठीक , एफ , और जी , इसी घनत्व के साथ 0 , , और जी । चलो एच ( एफ ) निरूपित एच ( , 0 ) , और एच ( एक्स ) के कुछ आकलनकर्ता जा एच ( एफ ) के आधार पर एन आईआईडी नमूने एक्स मैं ~ एफF0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

मान लीजिए कि एच फार्म के किसी भी वितरण से नमूने के लिए निष्पक्ष है एम α : = α एफ + ( 1 - α ) जी लेकिन फिर क्यू ( α )H^

Mα:=αF+(1α)G.
ताकिक्यू(α)एक में बहुपद होना चाहिएαकी अधिकांशएनपर डिग्री।
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1α)dG(x1)][αdF(xn)+(1α)dG(xn)]=αnEXFn[H^(X)]++(1α)nEXGn[H^(X)],
Q(α)αn

अब, चलो एक उचित मामले के विशेषज्ञ हैं और बताते हैं कि संबंधित बहुपद नहीं है।Q

चलो कुछ वितरण जिस पर लगातार घनत्व है हो [ - 1 , 1 ] : 0 ( एक्स ) = सभी के लिए | x | । (उस सीमा के बाहर इसका व्यवहार कोई फर्क नहीं पड़ता।) चलो F कुछ वितरण केवल [ - 1 , 0 ] पर समर्थित है , और G कुछ वितरण केवल [ 0 , 1 ] पर समर्थित हैं ।F0[1,1]f0(x)=c|x|1F[1,0]G[0,1]

अब जहांबीएफ:=आर

Q(α)=H(mα,f0)=1Rmα(x)f0(x)dx=110cαf(x)dx01c(1α)g(x)dx=1αBF1αBG,
और इसी तरहBG के लिए। ध्यान दें किBF>0,BG>0किसी भी वितरणF,G के लिएजिसका घनत्व है।BF:=Rf(x)f0(x)dxBGBF>0BG>0FG

किसी भी परिमित डिग्री का बहुपद नहीं है। इस प्रकार, कोई आकलनकर्ता एच के लिए निष्पक्ष हो सकता हैएचवितरण के सभी परएमαपरिमित कई नमूने के साथ।1αBF1αBGH^HMα

इसी तरह, क्योंकि भी एक बहुपद नहीं है, एच 2 केलिए कोई अनुमानक नहीं हैजो कि सभी वितरणों पर निष्पक्षरूप से कई नमूने के साथएमα है1αBF1αBGH2Mα

यह वितरण के सभी उचित गैरपारंपरिक वर्गों को बहुत अधिक बाहर करता है, सिवाय नीचे घनीभूतता के साथ उन लोगों को छोड़कर (एक धारणा nonparametric विश्लेषण कभी-कभी बनाते हैं)। आप शायद उन वर्गों को भी इसी तरह के तर्क से मार सकते हैं, केवल घनत्व को स्थिर या कुछ और बनाकर।


13

I don't know how to construct (if it exists) an unbiased estimator of the Hellinger distance. It seems possible to construct a consistent estimator. We have some fixed known density f0, and a random sample X1,,Xn from a density f>0. We want to estimate

H(f,f0)=1Xf(x)f0(x)dx=1Xf0(x)f(x)f(x)dx
=1E[f0(X)f(X)],
where Xf. By the SLLN, we know that
11ni=1nf0(Xi)f(Xi)H(f,f0),
almost surely, as n. Hence, a resonable way to estimate H(f,f0) would be to take some density estimator fn^ (such as a traditional kernel density estimator) of f, and compute
H^=11ni=1nf0(Xi)fn^(Xi).

3
@Zen: Good point! I consider this answer as the answer because it made me realise H sounds very much like a standard deviation, for which there exists no unbiased estimator. As for the variance of H^n2, no worries: E[(f0(X)/f(X))2]=1 implies that this estimator has a finite variance.
Xi'an

1
Thanks for the clarification about the variance of the estimator, Xi'an!
Zen

2
Some work on other consistent estimators: (a) arxiv.org/abs/1707.03083 and related work based on k-NN density estimators; (b) arxiv.org/abs/1402.2966 based on correcting kernel density estimates; (c) ieeexplore.ieee.org/document/5605355 based on a connection to classification. (Many of these are based on samples from both f and f0, because that's the work I knew about offhand, but I think there are variants for known f0.)
Dougal
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.