क्या हार्मोनिक मतलब के लिए मानक विचलन की गणना की जा सकती है?


12

क्या हार्मोनिक के लिए मानक विचलन की गणना की जा सकती है? मैं समझता हूं कि मानक विचलन की गणना अंकगणितीय माध्य के लिए की जा सकती है, लेकिन यदि आपके पास हार्मोनिक मतलब है, तो आप मानक विचलन या सीवी की गणना कैसे करते हैं?

जवाबों:


13

हार्मोनिक माध्य का यादृच्छिक चर के रूप में परिभाषित किया गया हैHX1,...,Xn

H=11ni=1n1Xi

अंशों का क्षण लेना एक गन्दा व्यवसाय है, इसलिए इसके बजाय मैं साथ काम करना पसंद करूँगा । अभी1/H

1H=1ni=1n1Xi

Usin केंद्रीय सीमा प्रमेय हम तुरंत प्राप्त करते हैं

n(H1EX11)N(0,VarX11)

यदि निश्चित रूप से और iid हैं, क्योंकि हम चर अंकगणितीय माध्य के साथ सरल काम करते हैं ।VarX11<XiYi=Xi1

अब फ़ंक्शन लिए डेल्टा विधि का उपयोग करके हम इसे प्राप्त करते हैंg(x)=x1

n(H(EX11)1)N(0,VarX11(EX11)4)

यह परिणाम स्पर्शोन्मुख है, लेकिन सरल अनुप्रयोगों के लिए यह पर्याप्त हो सकता है।

अपडेट As @whuber सही-सही इंगित करता है, सरल अनुप्रयोग एक मिथ्या नाम है। केंद्रीय सीमा प्रमेय केवल तभी धारण करता है यदि मौजूद है, जो काफी प्रतिबंधात्मक धारणा है।VarX11

अद्यतन 2 यदि आपके पास एक नमूना है, तो मानक विचलन की गणना करने के लिए, बस नमूना क्षणों को सूत्र में प्लग करें। तो नमूने के लिए , हार्मोनिक माध्य का अनुमान हैX1,...,Xn

H^=11ni=1n1Xi

नमूना क्षणों और क्रमशः हैं:EX11Var(X11)

μ^R=1ni=1n1Xiσ^R2=1ni=1n(1XiμR)2

यहाँ पारस्परिक के लिए खड़ा है।R

अंत में मानक विचलन के लिए अनुमानित सूत्र हैH^

sd(H^)=σ^R2nμ^R4

मैंने कुछ मोंटे-कार्लो सिमुलेशन चलाए जिन्हें यादृच्छिक रूप से समान रूप से अंतराल में वितरित किया गया था । यहाँ कोड है:[2,3]

hm <- function(x)1/mean(1/x)
sdhm <- function(x)sqrt((mean(1/x))^(-4)*var(1/x)/length(x))

n<-1000

nn <- c(10,30,50,100,500,1000,5000,10000)

N<-1000

mc<-foreach(n=nn,.combine=rbind) %do% {

    rr <- matrix(runif(n*N,min=2,max=3),nrow=N)

    c(n,mean(apply(rr,1,sdhm)),sd(apply(rr,1,sdhm)),sd(apply(rr,1,hm)))

}
colnames(mc) <- c("n","DeltaSD","sdDeltaSD","trueSD")

> mc
             n     DeltaSD    sdDeltaSD      trueSD
result.1    10 0.089879211 1.528423e-02 0.091677622
result.2    30 0.052870477 4.629262e-03 0.051738941
result.3    50 0.040915607 2.705137e-03 0.040257673
result.4   100 0.029017031 1.407511e-03 0.028284458
result.5   500 0.012959582 2.750145e-04 0.013200580
result.6  1000 0.009139193 1.357630e-04 0.009115592
result.7  5000 0.004094048 2.685633e-05 0.004070593
result.8 10000 0.002894254 1.339128e-05 0.002964259

मैंने आकार के Nनमूने के nनमूने लिए। प्रत्येक nआकार के नमूने के लिए मैंने मानक अनुमान (फ़ंक्शन sdhm) के अनुमान की गणना की । फिर मैं इन अनुमानों के माध्य और मानक विचलन की तुलना प्रत्येक नमूने के लिए अनुमानित हार्मोनिक माध्य के नमूना मानक विचलन के साथ करता हूं, जो संभवतः हार्मोनिक माध्य का सही मानक विचलन होना चाहिए।

जैसा कि आप देख सकते हैं कि मध्यम नमूना आकार के लिए भी परिणाम काफी अच्छे हैं। बेशक समान वितरण एक बहुत अच्छा व्यवहार है, इसलिए यह आश्चर्यजनक नहीं है कि परिणाम अच्छे हैं। मैं अन्य वितरण के लिए व्यवहार की जांच करने के लिए किसी और को छोड़ दूंगा, कोड को अनुकूलित करना बहुत आसान है।

नोट: इस उत्तर के पिछले संस्करण में डेल्टा विधि, गलत विचरण के परिणाम में एक त्रुटि थी।


2
@mpiktas यह एक अच्छी शुरुआत है और सीवी कम होने पर कुछ मार्गदर्शन प्रदान करता है। लेकिन व्यावहारिक, सरल स्थितियों में भी यह स्पष्ट नहीं है कि सीएलटी लागू होता है। मुझे उम्मीद है कि कई वैरिएबल्स के पारस्परिक को दूसरा या पहला क्षण भी न मिले जब कोई सराहनीय संभावना हो कि उनके मूल्य शून्य के करीब हो सकते हैं। मैं यह भी उम्मीद करूंगा कि डेल्टा विधि शून्य के पास पारस्परिक रूप से संभावित बड़े डेरिवेटिव के कारण लागू न हो। इस प्रकार यह "सरल अनुप्रयोगों" को और अधिक सटीक रूप से चित्रित करने में मदद कर सकता है जहां आपकी विधि काम कर सकती है। BTW, "D" क्या है?
whuber

@whuber, D विचरण के लिए है, । सरल अनुप्रयोगों से मेरा मतलब उन लोगों से है जिनके लिए पारस्परिकता का भिन्नता और मतलब मौजूद है। जैसा कि आप सराहनीय संभावना के साथ यादृच्छिक चर के लिए कहते हैं कि उनके मूल्य शून्य के करीब हो सकते हैं, पारस्परिक का मतलब भी नहीं हो सकता है। लेकिन फिर मूल प्रश्न का उत्तर नहीं है। मैंने मान लिया कि ओपी ने पूछा कि क्या मौजूद होने पर मानक विचलन की गणना करना संभव है। यह स्पष्ट रूप से बहुत सारे यादृच्छिक चर के लिए नहीं है। DX=E(XEX)2
mpiktas

@ वाउचर, जिज्ञासा से बाहर बीटीडब्ल्यू मेरे लिए बहुत मानक संकेतन है, लेकिन कोई यह कह सकता है कि मैं रूसी विकलांगता स्कूल से आता हूं। यह "पूंजीवादी पश्चिम" में इतना आम नहीं है? :)DX
एमपिकटस

@mpiktas मैंने कभी विचरण के लिए यह अंकन नहीं देखा। मेरी पहली प्रतिक्रिया थी कि एक अंतर ऑपरेटर है! मानक संकेतन महामारी हैं, जैसे । V a r [ X ]DVar[X]
whuber

1
ईएल लेहमन और जूलियट पॉपर शफ़र द्वारा "इनवर्टेड डिस्ट्रीब्यूशन" का पेपर उलटे रैंडम वेरिएबल्स के डिस्ट्रीब्यूशन के बारे में एक दिलचस्प रीड है।
इमैक्लिक

2

संबंधित प्रश्न का मेरा उत्तर बताता है कि सकारात्मक डेटा के सेट का हार्मोनिक माध्य एक भारित वर्ग (डब्ल्यूएलएस) अनुमान (वजन ) है। इसलिए आप WLS विधियों का उपयोग करके इसकी मानक त्रुटि की गणना कर सकते हैं। यह कुछ फायदे हैं, जिनमें सादगी, व्यापकता और व्याख्या शामिल है, साथ ही किसी भी सांख्यिकीय सॉफ़्टवेयर द्वारा स्वचालित रूप से उत्पादित किया जा रहा है जो इसके प्रतिगमन गणना में भार की अनुमति देता है। 1 / x ixi1/xi

मुख्य नुकसान यह है कि गणना अत्यधिक तिरछी अंतर्निहित वितरण के लिए अच्छे आत्मविश्वास के अंतराल का उत्पादन नहीं करती है। यह किसी भी सामान्य-उद्देश्य विधि के साथ एक समस्या होने की संभावना है: हार्मोनिक मतलब डेटासेट में एक भी छोटे मूल्य की उपस्थिति के प्रति संवेदनशील है।

स्पष्ट करने के लिए, यहाँ गामा (5) वितरण (जो मामूली तिरछा है) से आकार के स्वतंत्र रूप से उत्पन्न नमूनों के अनुभवजन्य वितरण हैं । नीली रेखाएं सही हार्मोनिक माध्य ( बराबर ) दिखाती हैं जबकि लाल धराशायी रेखाएं भारित कम से कम वर्गों का अनुमान दर्शाती हैं। ब्लू लाइनों के चारों ओर ऊर्ध्वाधर ग्रे बैंड हार्मोनिक मीन के लिए दो-तरफा 95% विश्वास अंतराल हैं। इस मामले में, सभी नमूनों में CI सही हार्मोनिक माध्य को शामिल करता है। इस सिमुलेशन की पुनरावृत्ति (यादृच्छिक बीज के साथ) का सुझाव है कि कवरेज इन छोटे डेटासेटों के लिए भी 95% की दर के करीब है।एन = 12 4 2020n=12420

आंकड़े

यहाँ Rसिमुलेशन और आंकड़े के लिए कोड है।

k <- 5             # Gamma parameter
n <- 12            # Sample size
hm <- k-1          # True harmonic mean
set.seed(17)

t.crit <- -qt(0.05/2, n-1)
par(mfrow=c(4, 5))
for(i in 1:20) {
  #
  # Generate a random sample.
  #
  x <- rgamma(n, k)
  #
  # Estimate the harmonic mean.
  #
  fit <- lm(x ~ 1, weights=1/x)
  beta <- coef(summary(fit))[1, ]
  message("Harmonic mean estimate is ", signif(beta["Estimate"], 3), 
          " +/- ", signif(beta["Std. Error"], 3))
  #
  # Plot the results.
  #
  covers <- abs(beta["Estimate"] - hm) <= t.crit*beta["Std. Error"]
  plot(ecdf(x), main="Empirical CDF", sub=ifelse(covers, "", "***"))
  rect(beta["Estimate"] - t.crit*beta["Std. Error"], 0, 
       beta["Estimate"] + t.crit*beta["Std. Error"], 1.25, 
       border=NA, col=gray(0.5, alpha=0.10))
  abline(v = hm, col="Blue", lwd=2)
  abline(v = beta["Estimate"], col="Red", lty=3, lwd=2)
}

1

यहाँ एक्सपोनेंशियल r.v के लिए एक उदाहरण दिया गया है।

डेटा बिंदुओं के लिए हार्मोनिक माध्य के रूप में परिभाषित किया गया हैn

S=11ni=1nXi

मान लीजिए आपके पास एक घातीय यादृच्छिक चर, की आईआईडी नमूने । घातीय चर का योग एक गामा वितरण का अनुसरण करता हैएक्स मैं ~ एक्स पी ( λ ) nnXiExp(λ)n

i=1nXiGamma(n,θ)

जहाँ । हम यह भी जानते हैंθ=1λ

1nGamma(n,θ)Gamma(n,θn)

का वितरण इसलिए हैS

SInvGamma(n,nθ)

इस आरवी के विचरण (और मानक विचलन) अच्छी तरह से ज्ञात हैं, देखें, उदाहरण के लिए यहां


3
हार्मोनिक अर्थ के लिए आपकी परिभाषा विकिपीडिया से
mpiktas

घातांक का उपयोग समस्या को समझने के लिए एक अच्छा तरीका है।
whuber

1
सभी आशा पूरी तरह से खो नहीं है। अगर Xi ~ Exp (\ lambda) तो Xi ~ Gamma (1, \ lambda) तो 1 / Xi ~ InvGamma (1, 1 / \ lambda)। फिर "वी। विट्कोवस्की (2001) का उपयोग करें उल्टे गामा चर के एक रैखिक संयोजन के वितरण का संकलन करते हुए, क्य्बेरनेटिका 37 (1), 79-90" और देखें कि आप कितनी दूर हैं!
ट्रिस्टन

0

कुछ चिंताएं हैं कि mpiktas की CLT को पर एक बंधे हुए विचरण की आवश्यकता है । यह सच है कि में पागल पूंछ होती है जब में शून्य के आसपास सकारात्मक घनत्व होता है। हालांकि, हार्मोनिक माध्य, का उपयोग करते हुए कई अनुप्रयोगों में । इधर, से घिरा है , आप सभी क्षणों है कि आप चाहते हैं दे रही है!1/X1/XXX11/X1


0

मैं जो सुझाव दूंगा वह मानक विचलन के विकल्प के रूप में निम्न सूत्र का उपयोग करना है:

σ=Ni=1N(1x^1xi)2,

जहाँ । इस सूत्र के बारे में अच्छी बात यह है कि इसे तब छोटा किया जाता है जब , और इसकी मानक विचलन जैसी इकाइयाँ होती हैं (जो हैं) के समान इकाइयाँ )।x^=N1xix^=N1xix

यह मानक विचलन के अनुरूप है, जो कि मान है कि तब लेता है जब इसे से कम किया जाता है । यह कम से कम तब होता है जब का अर्थ होता है: ।1N(x^xi)2x^x^x^=μ=1Nxi

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.