सामान्य यादृच्छिक चर के लिए अनुमानित क्रम आँकड़े


38

क्या कुछ यादृच्छिक वितरण के आदेश आँकड़ों के लिए अच्छी तरह से ज्ञात सूत्र हैं? विशेष रूप से एक सामान्य यादृच्छिक चर के पहले और अंतिम क्रम के आँकड़े, लेकिन एक अधिक सामान्य उत्तर की भी सराहना की जाएगी।

संपादित करें: स्पष्ट करने के लिए, मैं उन अनुमानित सूत्रों की तलाश कर रहा हूं जो अधिक-या-कम स्पष्ट रूप से मूल्यांकन किए जा सकते हैं, सटीक एकीकृत अभिव्यक्ति नहीं।

उदाहरण के लिए, मैंने पहले क्रम के लिए निम्नलिखित दो अनुमानों को देखा है (यानी सामान्य आरवी का न्यूनतम):

e1:nμn12n1σ

तथा

e1:nμ+Φ1(1n+1)σ

इनमें से पहला, , लगभग देता है जो बेतहाशा ढीली बंधी हुई लगती है।n=200e1:200μ10σ

दूसरा जबकि एक त्वरित मोंटे कार्लो , इसलिए यह एक बुरा नहीं है, लेकिन महान भी नहीं है, और अधिक महत्वपूर्ण बात यह है कि यह कहां से आता है, इसके बारे में मुझे कोई अंतर्ज्ञान नहीं है।e1:200μ2.58σe1:200μ2.75σ

कोई मदद?


4
यदि आप R का उपयोग करते हैं, तो ppoint फ़ंक्शन देखें ।
कार्डिनल

1
@probabilityislogic ने आपके द्वारा सूचीबद्ध सन्निकटन के लिए कुछ अच्छे अंतर्ज्ञान दिए हैं। यदि मैं वैकल्पिक दृष्टिकोण से कुछ और देता, या क्या आपने इस मामले पर अपनी जिज्ञासा को संतुष्ट किया होता, तो क्या यह मददगार होता?
कार्डिनल

जवाबों:


31

क्लासिक संदर्भ रोइस्टन (1982) [1] है जिसमें एल्गोरिदम स्पष्ट सूत्रों से परे जा रहा है। यह ब्लॉम (1958): द्वारा एक प्रसिद्ध सूत्र को भी उद्धृत करता है with । यह सूत्र लिए -2.73 का गुणक देता है ।अल्फा=0.375n=200,आर=1E(r:n)μ+Φ1(rαn2α+1)σα=0.375n=200,r=1

[१]: १ 1: 17 के रूप में एल्गोरिथम: अपेक्षित सामान्य आदेश सांख्यिकी (सटीक और अनुमानित) जेपी रोस्टन। रॉयल स्टैटिस्टिकल सोसाइटी का जर्नल। सीरीज़ (एप्लाइड स्टैटिस्टिक्स) वॉल्यूम। 31, नंबर 2 (1982), पीपी 161-165


21

किसी भी निरंतर यादृच्छिक के ith क्रम सांख्यिकीय का वितरण पीडीएफ के साथ चर "बीटा-एफ" यौगिक वितरण द्वारा दिया जाता है। इस वितरण के बारे में सोचने का सहज तरीका है, नमूने में ith ऑर्डर स्टेटिस्टिक पर विचार करना । अब ith ऑर्डर के मूल्य के क्रम में एक यादृच्छिक चर का आँकड़ा बराबर होने के लिए हमें 3 स्थितियों की आवश्यकता है:NXx
  1. i1 नीचे मान , इसमें प्रत्येक अवलोकन के लिए प्रायिकता , जहाँ यादृच्छिक चर X का CDF है।xFX(x)FX(x)=Pr(X<x)
  2. Ni ऊपर मान , इसमें प्रायिकताx1FX(x)
  3. एक infinitesimal अंतराल के अंदर 1 मान , इसमें प्रायिकता जहाँ है यादृच्छिक चर का पीडीएफxfX(x)dxfX(x)dx=dFX(x)=Pr(x<X<x+dx)X

वहाँ रहे हैं इस विकल्प बनाने के लिए तरीके हैं, इसलिए हमने:(N1)(N1i1)

fi(xi)=N!(i1)!(Ni)!fX(xi)[1FX(xi)]Ni[FX(xi)]i1dx

अपने मूल पोस्ट में EDIT , मैंने इस बिंदु से आगे जाने का बहुत ही खराब प्रयास किया, और नीचे दी गई टिप्पणियां इसे दर्शाती हैं। मैंने इसे नीचे ठीक करने की मांग की है

अगर हम इस pdf का माध्य मान लेते हैं:

E(Xi)=xifi(xi)dxi

और इस अभिन्न अंग में, हम परिवर्तनशील (@ henry के संकेत) लेते हुए, और अभिन्न अंग बनते हैं:pi=FX(xi)

E(Xi)=01FX1(pi)Beta(pi|i,Ni+1)dpi=EBeta(pi|i,Ni+1)[FX1(pi)]

तो यह उलटा सीडीएफ का अपेक्षित मूल्य है, जिसे देने के लिए डेल्टा विधि का उपयोग करके अच्छी तरह से अनुमान लगाया जा सकता है:

EBeta(pi|i,Ni+1)[FX1(pi)]FX1[EBeta(pi|i,Ni+1)]=FX1[iN+1]

एक बेहतर सन्निकटन करने के लिए, हम दूसरे क्रम में विस्तार कर सकते हैं (भिन्नता को दर्शाते हुए प्राइम), और यह देखते हुए कि व्युत्क्रम का दूसरा व्युत्पन्न है:

2a2FX1(a)=FX(FX1(a))[FX(FX1(a))]3=fX(FX1(a))[fX(FX1(a))]3

Let । तो हमारे पास हैं:νi=FX1[iN+1]

EBeta(pi|i,Ni+1)[FX1(pi)]FX1[νi]VarBeta(pi|i,Ni+1)[pi]2fX(νi)[fX(νi)]3
=νi(iN+1)(1iN+1)2(N+2)fX(νi)[fX(νi)]3

अब, सामान्य मामले में हमारे पास

fX(x)=1σϕ(xμσ)fX(x)=xμσ3ϕ(xμσ)=xμσ2fX(x)
FX(x)=Φ(xμσ)FX1(x)=μ+σΦ1(x)

ध्यान दें कि और उम्मीद लगभग बन जाता है:fX(νi)=1σϕ[Φ1(iN+1)]

E[xi]μ+σΦ1(iN+1)+(iN+1)(1iN+1)2(N+2)σΦ1(iN+1)[ϕ[Φ1(iN+1)]]2

और अंत में:

E[xi]μ+σΦ1(iN+1)[1+(iN+1)(1iN+1)2(N+2)[ϕ[Φ1(iN+1)]]2]

हालांकि जैसा कि @whuber ने नोट किया है, यह पूंछ में सटीक नहीं होगा। वास्तव में मुझे लगता है कि यह बदतर हो सकता है, क्योंकि विभिन्न मापदंडों के साथ एक बीटा का तिरछा होना


1
"एक यादृच्छिक चर का अधिकतम संभावना अनुमानक "? निश्चित नहीं है कि वह क्या है, लेकिन मुझे लगता है कि आपने (लगभग) मोड की गणना की है
कार्डिनल

1
कुछ रहस्यमय तरीके से लगभग दो-तिहाई रास्ते होते हैं जब अचानक और बिना किसी चेतावनी या परिभाषा के दिखाई देते हैं। μσ
whuber

2
मेरा मतलब "ढेर पर" नहीं है, लेकिन मेरे लिए यह देखना भी मुश्किल है कि कैसे कोष्ठक में मात्रा को ऋणात्मक संख्या द्वारा अनुमानित किया जा सकता है।
कार्डिनल

1
@probabilityislogic, जबकि कैलकुलस के स्तर पर, आप कह सकते हैं कि इस मामले में हम एक द्विभाजित कार्य पर विचार कर रहे हैं और बस एक चर को दूसरे के बजाय अधिकतम कर रहे हैं, मुझे लगता है कि गणितीय, सांख्यिकीय और शैक्षणिक कारण हैं जिन्हें आप नहीं कहते हैं। "अधिकतम संभावना अनुमान" किया गया। वे इस स्थान पर गणना करने के लिए बहुत अधिक हैं, लेकिन मुझे लगता है कि एक सरल एक सम्मोहक पर्याप्त है कि हम एक कारण के लिए आँकड़ों में एक विशेष, रहस्यमय शब्दावली का उपयोग करें। एक ही समस्या के लिए एक समय पर बदलने से गलतफहमी हो सकती है ... / ...
कार्डिनल

2
संशोधित जवाब के लिए @probabilityislogic (+1)। एक सुझाव यह है, शायद से बेहतर है मतलब "का अर्थ है"। यह कुछ सेकंड के लिए कुछ लाइनों के लिए घूर लिया एहसास हुआ कि आप कुछ अभिसरण दावा नहीं कर रहे थे।
कार्डिनल

13

Aniko का उत्तर Blom के प्रसिद्ध फार्मूले पर निर्भर करता है जिसमें का विकल्प शामिल होता है । यह पता चला है कि यह सूत्र जी एलफिंग (1947), सामान्य आबादी , बायोमेट्रिक, वॉल्यूम से नमूनों में सीमा के विषम वितरण के कारण एक सटीक उत्तर का मात्र अनुमान है । 34, पीपी 111-119। एल्फिंग का सूत्र न्यूनतम और अधिकतम नमूने के उद्देश्य से है, जिसके लिए अल्फा का सही विकल्प । ब्लॉम का फॉर्मूला तब परिणाम देता है जब हम लगभग होते हैं ।α=3/8π/8π3

ब्लूम के अनुमान के बजाय एल्फविंग सूत्र का उपयोग करने से, हमें -2.744165 का गुणक मिलता है। यह संख्या एरिक पी। के सटीक उत्तर (-2.746) के करीब है और मोंटे कार्लो सन्निकटन (-2.75) की तुलना में ब्लॉम का अनुमान (-2.73) है, जबकि सटीक सूत्र की तुलना में इसे लागू करना आसान है।


क्या आप थोड़ा और अधिक विवरण प्रदान कर सकते हैं कि Elfving (1947) के माध्यम से how Alpha कैसे आया है? यह लेख में स्पष्ट नहीं है। α=π/8
एंथनी

1
एंथोनी - मैं शमूएल विल्क्स, पब द्वारा पाठ्यपुस्तक गणितीय सांख्यिकी पर भरोसा कर रहा हूं। विली (1962)। पी पर 8.21 व्यायाम करें। 249 में कहा गया है: "यदि x_ (1), x_ (n) एक सतत cdf F (x) से आकार n के नमूने के सबसे छोटे और सबसे बड़े क्रम के आँकड़े हैं ... यादृच्छिक चर 2n * sqrt {[F (x_) 1))] [1-F (x_ (n))]} में n -> अनंत के रूप में एक सीमा वितरण है, जिसका अर्थ है pi / 2 और भिन्नता 4- (pi ^ 2) / 4। " (क्षमा करें, मैं मार्कअप कोड नहीं जानता!) एक सममित वितरण के लिए, F (x_ (1)) = 1-F (x_ (n))। इस प्रकार F (x_ (n)) pi / (4n) के बारे में है, या x_ (n) F ^ (- 1) (pi / (4n)) के बारे में है। ब्लॉम फॉर्मूला सन्निकटन 3 / (4n) का उपयोग करता है।
हाल एम। स्वित्के

यह मुझे इंडियाना राज्य विधानमंडल के लिए बदनाम " " बिल की याद दिलाता है । (हालांकि विकिपीडिया लेख से पता चलता है कि कहानी का लोकप्रिय संस्करण सटीक नहीं है।)π=3
स्टीवन'मेरिका

7

आप क्या करना चाहते हैं, इस पर निर्भर करते हुए, यह उत्तर मदद कर सकता है या नहीं - मुझे मेपल के सांख्यिकी पैकेज से निम्नलिखित सटीक सूत्र मिला ।

with(Statistics):
X := OrderStatistic(Normal(0, 1), 1, n):
m := Mean(X):
m;

1/2_t0n!2e1/2_t02(1/21/2erf(1/2_t02))1+n(1+n)!πd_t0

अपने आप से यह बहुत उपयोगी नहीं है (और यह संभवतः हाथ से आसानी से प्राप्त किया जा सकता है, क्योंकि यह यादृच्छिक चर का न्यूनतम है ), लेकिन यह दिए गए मूल्यों के लिए त्वरित और बहुत सटीक सन्निकटन की अनुमति देता है - की तुलना में अधिक सटीक मौंटे कारलो:nn

evalf(eval(m, n = 200));
evalf[25](eval(m, n = 200));

क्रमशः -2.746042447 और -2.746042447451154492412344 देता है।

(पूर्ण प्रकटीकरण - मैं इस पैकेज को बनाए रखता हूं।)


1
@ProbabilityIsLogic ने अपने उत्तर के पहले भाग में सभी आदेश आँकड़ों के लिए यह अभिन्न अंग निकाला।
व्हिबर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.