इनाम:
पूर्ण इनाम किसी ऐसे व्यक्ति को दिया जाएगा जो किसी भी प्रकाशित पेपर का संदर्भ प्रदान करता है जो नीचे दिए गए आकलनकर्ता का उपयोग करता है या उसका उल्लेख करता है ।
प्रेरणा:
यह खंड शायद आपके लिए महत्वपूर्ण नहीं है और मुझे संदेह है कि यह आपको इनाम पाने में मदद नहीं करेगा, लेकिन जब से किसी ने प्रेरणा के बारे में पूछा, तो यहां मैं बता रहा हूं कि मैं क्या काम कर रहा हूं।
मैं एक सांख्यिकीय ग्राफ सिद्धांत समस्या पर काम कर रहा हूं। मानक घने ग्राफ को सीमित करने वाली वस्तु इस अर्थ में एक सममित फलन है कि । पर एक ग्राफ नमूना कोने नमूने के रूप में सोचा जा सकता है वर्दी मूल्यों इकाई अंतराल पर ( के लिए ) बढ़त की संभावना और उसके बाद है । परिणामी आसन्न मैट्रिक्स को कहा जाता है ।डब्ल्यू ( यू , वी ) = डब्ल्यू ( वी , यू ) एन एन यू मैं मैं = 1 , ... , एन ( मैं , जे ) डब्ल्यू ( यू मैं , यू जे ) ए
हम को एक घनत्व जो कि \ iint W> 0 को दर्शाता है । यदि हमारे अनुमान च के आधार पर एक के लिए किसी भी बाधाओं के बिना च , तो हम एक सुसंगत अनुमान नहीं मिल सकता है। मैं लगातार आकलन करने के बारे में एक दिलचस्प परिणाम नहीं मिला च जब च संभव कार्यों के एक कंस्ट्रेन्ड सेट से आता है। इस अनुमानक और \ _ A से , हम W का अनुमान लगा सकते हैं ।
दुर्भाग्य से, जिस विधि को मैंने पाया, वह घनत्व साथ वितरण से नमूना होने पर स्थिरता दिखाता है । जिस तरह से का निर्माण किया जाता है, उसके लिए मुझे अंकों की एक ग्रिड का नमूना देना होगा (जैसा कि मूल से ड्रॉ लेने का विरोध किया गया है )। इस आँकड़े में। सवाल है, मैं 1 आयामी (सरल) समस्या के लिए पूछ रहा हूं कि क्या होता है जब हम केवल ग्रिड पर नमूना बर्नौलीस को इस तरह से नमूना कर सकते हैं जैसे कि वास्तव में सीधे वितरण से नमूना लेना।
ग्राफ सीमाओं के लिए संदर्भ:
एल। लोवाज़ और बी। सेजेडी। घने ग्राफ अनुक्रमों की सीमा ( arxiv )।
सी। बोर्ग्स, जे। चेयेस, एल। लोवाज़, वी। सोस, और के। वेस्ज़्टरगॉम्बी। घने रेखांकन के संमिलित क्रम I: सबग्राफ आवृत्तियों, मीट्रिक गुण और परीक्षण। ( अर्क्सिव )।
संकेतन:
CDF के साथ निरंतर वितरण पर विचार और पीडीएफ जो अंतराल पर सकारात्मक समर्थन हासिल है । मान लीजिए कोई pointmass है, , हर जगह जो विभेदक है और यह भी कि की supremum है अंतराल पर । चलो मतलब है कि यादृच्छिक चर वितरण से नमूना । पर iid एकसमान यादृच्छिक चर हैं ।च [ 0 , 1 ]एक्स एफ यू मैं [ 0 , 1 ]
समस्या सेट अप:
अक्सर, हम को वितरण साथ यादृच्छिक चर दे सकते हैं और सामान्य अनुभवजन्य वितरण फ़ंक्शन के साथ काम कर सकते हैं जैसे कि " जहां संकेतक कार्य करता । ध्यान दें कि यह अनुभवजन्य वितरण स्वयं यादृच्छिक है (जहाँ निर्धारित है)। एफ एफ एन ( टी ) = 1मैं एफ एन(टी)टी
दुर्भाग्य से, मैं सीधे से नमूने नहीं ले पा रहा हूं । हालांकि, मुझे पता है कि को केवल पर सकारात्मक समर्थन है , और मैं यादृच्छिक चर उत्पन्न कर सकता जहां एक यादृच्छिक चर है जिसमें बर्नौली वितरण के साथ सफलता की संभावना जहां और ऊपर परिभाषित किए गए हैं। तो, । एक स्पष्ट तरीका है कि मैं इन मूल्यों से अनुमान लगा सकता हूं, जहांच [ 0 , 1 ] Y 1 , ... , वाई एन वाई मैं पी मैं = च ( ( मैं - 1 + यू मैं ) / n ) / ग ग यू मैं Y मैं ~ बर्न ( पी मैं
प्रशन:
सबसे मुश्किल से (मुझे लगता है कि होना चाहिए) सबसे आसान।
क्या किसी को पता है कि इस (या कुछ इसी तरह) का कोई नाम है? क्या आप एक संदर्भ प्रदान कर सकते हैं जहाँ मैं इसके कुछ गुण देख सकता हूँ?
के रूप में , है के अनुरूप आकलनकर्ता (और आप इसे साबित कर सकते हैं)?~ एफ एन ( टी ) एफ ( टी )
को रूप में सीमित वितरण क्या है ?n→∞
आदर्श रूप में, मैं निम्नलिखित को - जैसे, फ़ंक्शन के रूप में बाध्य करना चाहता हूं , लेकिन मुझे नहीं पता कि सच्चाई क्या है। के लिए खड़ा है संभावना में बिग ओहे पी ( लॉग ( एन ) / √ओपी
कुछ विचार और नोट्स:
यह ग्रिड-आधारित स्तरीकरण के साथ स्वीकृति-अस्वीकृति के नमूने जैसा लगता है । ध्यान दें कि हालांकि यह नहीं है क्योंकि हम प्रस्ताव को अस्वीकार करते हैं तो हम एक और नमूना नहीं बनाते हैं।
मुझे पूरा यकीन है कि यह पक्षपाती है। मुझे लगता है कि वैकल्पिक निष्पक्ष है, लेकिन इसमें अप्रिय संपत्ति है ।~ एफ ∗ एन ( टी ) = सीP(
मैं एक प्लग-इन अनुमानक के रूप में का उपयोग करने में रुचि रखता हूं । मुझे नहीं लगता कि यह उपयोगी जानकारी है, लेकिन शायद आप किसी कारण से जानते हैं कि ऐसा क्यों हो सकता है।
आर में उदाहरण
यदि आप अनुभवजन्य वितरण की तुलना करना चाहते हैं तो यहां कुछ R कोड है । क्षमा करें कुछ इंडेंटेशन गलत है ... मुझे नहीं लगता कि इसे कैसे ठीक किया जाए।
# sample from a beta distribution with parameters a and b
a <- 4 # make this > 1 to get the mode right
b <- 1.1 # make this > 1 to get the mode right
qD <- function(x){qbeta(x, a, b)} # inverse
dD <- function(x){dbeta(x, a, b)} # density
pD <- function(x){pbeta(x, a, b)} # cdf
mD <- dbeta((a-1)/(a+b-2), a, b) # maximum value sup_z f(z)
# draw samples for the empirical distribution and \tilde{F}
draw <- function(n){ # n is the number of observations
u <- sort(runif(n))
x <- qD(u) # samples for empirical dist
z <- 0 # keep track of how many y_i == 1
# take bernoulli samples at the points s
s <- seq(0,1-1/n,length=n) + runif(n,0,1/n)
p <- dD(s) # density at s
while(z == 0){ # make sure we get at least one y_i == 1
y <- rbinom(rep(1,n), 1, p/mD) # y_i that we sampled
z <- sum(y)
}
result <- list(x=x, y=y, z=z)
return(result)
}
sim <- function(simdat, n, w){
# F hat -- empirical dist at w
fh <- mean(simdat$x < w)
# F tilde
ft <- sum(simdat$y[1:ceiling(n*w)])/simdat$z
# Uncomment this if we want an unbiased estimate.
# This can take on values > 1 which is undesirable for a cdf.
### ft <- sum(simdat$y[1:ceiling(n*w)]) * (mD / n)
return(c(fh, ft))
}
set.seed(1) # for reproducibility
n <- 50 # number observations
w <- 0.5555 # some value to test this at (called t above)
reps <- 1000 # look at this many values of Fhat(w) and Ftilde(w)
# simulate this data
samps <- replicate(reps, sim(draw(n), n, w))
# compare the true value to the empirical means
pD(w) # the truth
apply(samps, 1, mean) # sample mean of (Fhat(w), Ftilde(w))
apply(samps, 1, var) # sample variance of (Fhat(w), Ftilde(w))
apply((samps - pD(w))^2, 1, mean) # variance around truth
# now lets look at what a single realization might look like
dat <- draw(n)
plot(NA, xlim=0:1, ylim=0:1, xlab="t", ylab="empirical cdf",
main="comparing ECDF (red), Ftilde (blue), true CDF (black)")
s <- seq(0,1,length=1000)
lines(s, pD(s), lwd=3) # truth in black
abline(h=0:1)
lines(c(0,rep(dat$x,each=2),Inf),
rep(seq(0,1,length=n+1),each=2),
col="red")
lines(c(0,rep(which(dat$y==1)/n, each=2),1),
rep(seq(0,1,length=dat$z+1),each=2),
col="blue")
संपादन:
EDIT 1 -
मैंने इसे @ व्हिबर की टिप्पणियों को संबोधित करने के लिए संपादित किया।
EDIT 2 -
मैंने आर कोड जोड़ा और इसे थोड़ा और साफ किया। मैंने पठनीयता के लिए धारणा को थोड़ा बदल दिया, लेकिन यह अनिवार्य रूप से एक ही है। जैसे ही मुझे अनुमति दी जाती है, मैं इस पर एक इनाम देने की योजना बना रहा हूं, इसलिए कृपया मुझे बताएं कि क्या आप और स्पष्टीकरण चाहते हैं।
EDIT 3 -
मुझे लगता है कि मैंने @ कार्डिनल की टिप्पणियों को संबोधित किया। मैंने कुल भिन्नता में टाइपो को तय किया। मैं एक इनाम जोड़ रहा हूं।
EDIT 4 -
@Cardinal के लिए "प्रेरणा" खंड जोड़ा गया।