आईड गॉसियन की अधिकतम के बारे में सबसे शक्तिशाली परिणाम क्या है? व्यवहार में सबसे अधिक उपयोग किया जाता है?


9

यह देखते हुए आईआईडी, यादृच्छिक चर पर विचारX1,,Xn,N(0,1)

Zn:=max1inXi.

प्रश्न: इन यादृच्छिक चर के बारे में सबसे "महत्वपूर्ण" परिणाम क्या है?

"महत्व" को स्पष्ट करने के लिए, तार्किक परिणाम के रूप में सबसे अधिक अन्य परिणाम कौन से हैं? कौन सा परिणाम सबसे अधिक बार अभ्यास में उपयोग किया जाता है?

अधिक विशेष रूप से, यह (सैद्धांतिक) सांख्यिकीविदों के बीच लोककथाओं का ज्ञान प्रतीत होता है कि Zn "मूल रूप से" 2logn , कम से कम स्पर्शोन्मुख रूप से । ( इस संबंधित प्रश्न को देखें )

हालाँकि, इस प्रकार के कई संबंधित परिणाम हैं, और यह ऐसा प्रतीत होता है कि अधिकांश समान नहीं हैं, और न ही एक-दूसरे को प्रभावित करते हैं। उदाहरण के लिए ,

(1)Zn2logna.s.1,

जो कि अगर और कुछ नहीं भी संभावना और वितरण में इसी परिणाम निकलता है।

हालाँकि, यह भी संबंधित परिणाम ( इस अन्य प्रश्न को देखें ) की तरह प्रतीत नहीं होता है , जैसे

(2)limnEZn2logn=1,

(यह पी। 49 ऑफ पर 2.17 व्यायाम है ), या एक और लोककथा परिणाम :

(3)EZn=2logn+Θ(1).

गैर-विषम रूप से, यह भी ज्ञात है कि प्रत्येक ( प्रमाण के लिए यहां देखें ),n

(4)clognEZn2logn

कुछ छोटे । इसी तरह के परिणाम के लिए भी दिखाया जा सकता है, क्योंकि भारी दाएं तिरछा है।c|Zn|Zn

इस अंतिम परिणाम का प्रमाण अन्य परिणामों के प्रमाणों की तुलना में बहुत अधिक सीधा है। मेरी आशा यह थी कि पहले स्पर्शोन्मुख परिणाम ने अन्य सभी स्पर्शोन्मुख लोगों को निहित किया होगा, ताकि मैं उस परिणाम को समझने में अपने सभी समय और ऊर्जा को केंद्रित करने में आत्मविश्वास महसूस कर सकूं। लेकिन, फिर से, यह प्रतीत होता है कि सच नहीं है , इसलिए अब यह मेरे लिए अस्पष्ट है जिस पर मुझे ध्यान केंद्रित करना चाहिए।

गैलाम्बोस के दूसरे संस्करण द पीपी २६५-२६ देखें , १ ९।। में छपे चरम ऑर्डर स्टैटिस्टिक्स का एसिम्प्टोटिक सिद्धांत । यह भी शायद पहले संस्करण में कहीं कहा गया है।

_ डॉगर बाउचरन , लुगोसी, मासार्ट, एकाग्रता असमानताएँ: स्वतंत्रता का एक गैर-सैद्धांतिक सिद्धांतएक तरफ: यह पुस्तक वास्तव में प्रश्न में परिणाम के लिए गैलाम्बोस का हवाला देती है, लेकिन मैं इसे गैलाम्बोस में कहीं भी उल्लेख नहीं कर सकता हूं - केवल पहला परिणाम जिसका मैंने उल्लेख किया है।


1
क्या आप जानते हैं कि जब आप MathJax में \ dots का उपयोग करते हैं, तो परिणाम कभी-कभी ऐसा प्रतीत होता है जैसे कि आपने \ ldots का उपयोग किया है और कभी-कभी यदि आपने संदर्भ के आधार पर \ cdots का उपयोग किया है? मैंने इस प्रश्न में \ ddots के साथ \ dots को प्रतिस्थापित किया है।
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
माइकल हार्डी

@ मिचेलहार्डी ओह मुझे लगा कि यह हमेशा केंद्रित था। ठीक करने के लिए धन्यवाद!
Chill2Macht

जवाबों:


4

किसी भी संभाव्य अनुप्रयोग में, सबसे मौलिक वस्तु वितरण है, जो क्षणों और सीमित गुणों से व्युत्पन्न होता है। इसलिए, आपके द्वारा वर्णित अर्थ में सबसे "महत्वपूर्ण" परिणाम पूर्ण वितरण फ़ंक्शन हैFZn(z)=Φn(z)(क्रमशः, इसी घनत्व फ़ंक्शन)। व्यवहार में, यह वितरण परिणाम शायद पहले से सूचीबद्ध किए गए कुछ अधिक अस्वाभाविक गुणों की तुलना में कम रोशन है। हालाँकि यह तार्किक रूप से इन अस्मितात्मक परिणामों का तात्पर्य है, मेरे विचार में, वे परिणाम चरम मूल्य के बदलते स्वरूप को समझने में अधिक रोशन होने की संभावना रखते हैं क्योंकि हम बदलते हैंn

यह आपके प्रश्न से स्पष्ट है कि आपके पास अधिकतम आईआईडी मानक सामान्य यादृच्छिक यादृच्छिक के मामले में चरम मूल्य गुणों की अच्छी समझ है। इन गुणों के लिए वितरण फ़ंक्शन से सभी तार्किक रूप से व्युत्पन्न हैंZn, इसलिए कि इस समस्या में काम पर सबसे मौलिक वस्तु है। जैसा कि कई मामलों में, सबसे मौलिक वस्तु जरूरी नहीं कि सबसे अधिक रोशन हो, और इसलिए आप शायद पाएंगे कि आपको सभी परिणामों को जानने के साथ करना होगा, और यह जानते हुए कि वे समस्या के विभिन्न पहलुओं पर रोशनी डालते हैं।


इस उत्तर के लिए धन्यवाद - मैं इसकी सराहना करता हूं। क्या आप वितरण समारोह से इन सभी गुणों को प्राप्त करने के लिए एक संदर्भ के बारे में जानते हैंZn? मुझे कुछ भी खोजने में अत्यधिक कठिनाई हो रही है, जो इसे समझाती है, क्योंकि यह सब "लोककथा" या "हाथ से पकड़ना" है।
Chill2Macht

रिकॉर्ड के लिए, मैंने लिंक पढ़ा है और वे मदद नहीं करते हैं। इसलिए मैंने सवाल पूछा।
Chill2Macht

1
मेरे पास अनुशंसा करने के लिए कोई विशिष्ट संदर्भ नहीं है, लेकिन मुझे लगता है कि ये परिणाम अत्यधिक मूल्य सिद्धांत पर पुस्तकों में प्राप्त होंगे। मेरा सुझाव है कि आप उस विषय पर कुछ स्नातक स्तर के ग्रंथों की तलाश करके शुरू करें और देखें कि क्या आप वहाँ की व्युत्पत्ति पा सकते हैं।
बेन - मोनिका

1

WIP: कार्य प्रगति पर है

निम्नलिखित पी। 1946 में क्रैमर के 1946 के गणितीय तरीके सांख्यिकी के हैं

Ξn=n(1-Φ(जेडn))
यहाँ Φ मानक सामान्य वितरण का संचयी वितरण कार्य है, एन(0,1)। इसकी परिभाषा के परिणामस्वरूप, हमें इसकी गारंटी है0Ξnn लगभग निश्चित रूप से।

किसी दिए गए अहसास पर विचार करें ωΩहमारे नमूना स्थान की। फिर इस अर्थ मेंजेडn दोनों का एक कार्य है n तथा ω, तथा Ξn का एक समारोह जेडn,n, तथा ω। एक निश्चित के लिएω, हम विचार कर सकते हैं जेडn का एक निर्धारक कार्य n, तथा Ξn का एक निर्धारक कार्य जेडn तथा n, जिससे समस्या सरल हो जाती है। हम परिणाम दिखाना चाहते हैं जो लगभग सभी के लिए हैंωΩ, हमें अपने परिणामों को गैर-नियतात्मक विश्लेषण से गैर-नियतात्मक सेटिंग में स्थानांतरित करने की अनुमति देता है।

निम्नलिखित पी। ३४ क्रैमर के १ ९ ४६ के गणितीय तरीके सांख्यिकी के, इस पल के लिए मान लें (मेरा उद्देश्य है कि मैं वापस आऊंगा और बाद में एक प्रमाण की आपूर्ति करूँगा) जिसे हम दिखाने में सक्षम हैं (किसी भी के लिए)ωΩ) निम्नलिखित स्पर्शोन्मुख विस्तार (भागों द्वारा एकीकरण और परिभाषा का उपयोग करना) है Φ):

(~)2πnΞn=1जेडn-जेडn22(1+हे(1जेडn2))  रों  जेडn

स्पष्ट रूप से हमारे पास ऐसा है जेडn+1जेडn किसी के लिए n, तथा जेडn लगभग निश्चित रूप से एक बढ़ता हुआ कार्य है n जैसा n, इसलिए हम यह दावा करते हैं कि जो कुछ भी तय किया गया है, उसके लिए जो कुछ भी है, उसके पार है ω:

जेडnn

इसलिए यह इस प्रकार है कि हमारे पास (जहां है) ~अलौकिक समानता को दर्शाता है ):

2πnΞn~1जेडn-1जेडn2  रों  जेडnn

हम प्रमुख संतुलन की विधि के लिए अनिवार्य रूप से मात्राओं का अनुसरण कैसे करते हैं , और निम्नलिखित जोड़-तोड़ द्वारा हमारे जोड़-तोड़ को औपचारिक रूप से उचित ठहराया जाएगा:

लेम्मा: मान लें किf(n)g(n) जैसा n, तथा f(n) (इस प्रकार g(n))। फिर कोई फंक्शन दियाhजो लघुगणक और शक्ति कानूनों की रचनाओं, परिवर्धन, और गुणन के माध्यम से बनता है (अनिवार्य रूप से कोई भी " बहुवचन " फ़ंक्शन), हमारे पास भी ऐसा ही होना चाहिएn:

h(f(n))h(g(n))
दूसरे शब्दों में, इस तरह के "पॉलीलॉग" कार्य एसिम्प्टोटिक तुल्यता को संरक्षित करते हैं

इस लेम्मा की सच्चाई प्रमेय 2.1 का परिणाम है जैसा यहां लिखा गया है । यह भी ध्यान दें कि इस तरह के एक समान प्रश्न के उत्तर का ज्यादातर विस्तारित (अधिक विवरण) संस्करण क्या है ।

दोनों पक्षों के लघुगणकों को लेते हुए, हम यह पाते हैं:

(1)log(2πΞn)lognlogZnZn22.

यह वह जगह है जहाँ Cramer कुछ पिंजरे है; वह सिर्फ कहता है "मान लियाΞn बाध्य है ", हम ब्ला ब्ला ब्ला को समाप्त कर सकते हैं। लेकिन यह दिखाते हुए Ξnउपयुक्त रूप से बंधे हुए लगभग निश्चित रूप से कुछ हद तक गैर-तुच्छ प्रतीत होता है। ऐसा लगता है कि इसका प्रमाण अनिवार्य रूप से गैलपोस के पीपी 265-267 पर चर्चा की गई का हिस्सा हो सकता है, लेकिन मुझे यकीन नहीं है कि मैं अभी भी उस पुस्तक की सामग्री को समझने के लिए काम कर रहा हूं।

वैसे भी, यह मानकर कि वह दिखा सकता हैlogΞn=o(logn), तो यह इस प्रकार है (के बाद से Zn2/2 टर्म हावी है logZn शब्द)

lognZn22Zn2logn.

यह कुछ अच्छा है, क्योंकि यह पहले से ही सबसे अधिक है जिसे हम दिखाना चाहते हैं, हालांकि फिर से यह ध्यान देने योग्य है कि यह अनिवार्य रूप से केवल सड़क को नीचे गिरा सकता है, क्योंकि अब हमें कुछ निश्चित रूप से निश्चित रूप से बाउंडेडनेस दिखाना होगा Ξn। दूसरी ओर,Ξn has the same distribution for any maximum of i.i.d. continuous random variables, so this may be tractable.

Anyway, if Zn2logn a.s., then clearly one can also conclude that Zn2logn(1+α(n)) for any α(n) which is o(1) as n. Using our lemma about polylog functions preserving asymptotic equivalence above, we can substitute this expression back into (1) to get:

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Here we have to go even further, and assume that logΞn=o(loglogn)  as  n almost surely. Again, all Cramer says is "assuming Ξn is bounded". But since all one can say a priori about Ξn is that 0Xinn a.s., it hardly seems clear that one should have Ξn=O(1) almost surely, which seems to be the substance of Cramer's claim.

But anyway, assuming one believes that, then it follows that the dominant term which does not contain α is 12loglogn. Since α=o(1), it follows that α2=o(α), and clearly log(1+α)=o(α)=o(o(αlogn)), so the dominant term containing α is 2αlogn. Therefore, we can rearrange and (dividing everything by 12loglogn or 2αlogn) find that

12loglogn2αlognαloglogn4logn.

Therefore, substituting this back into the above, we get that:

Zn2lognloglogn22logn,

again, assuming we believe certain things about Ξn.

We rehash the same technique again; since Zn2lognloglogn22logn, then it also follows that

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

when β(n)=o(1). Let's simplify a little before substituting directly back into (1); we get that:

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Substituting this back into (1), we find that:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Therefore, we conclude that almost surely

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

This corresponds to the final result on p.374 of Cramer's 1946 Mathematical Methods of Statistics except that here the exact order of the error term isn't given. Apparently applying this one more term gives the exact order of the error term, but anyway it doesn't seem necessary to prove the results about the maxima of i.i.d. standard normals in which we are interested.


Given the result of the above, namely that almost surely:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Then by linearity of expectation it follows that:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Therefore, we have shown that

limnEZn2logn=1,

as long as we can also show that

E[logΞn]=o(logn).

This might not be too difficult to show since again Ξn has the same distribution for every continuous random variable. Thus we have the second result from above.

1. Similarly, we also have from the above that almost surely:

Zn2logn=1log(Ξn)2logn+o(1),.

Therefore, if we can show that:

(*)log(Ξn)=o(logn) almost surely,

then we will have shown the first result from above. Result (*) would also clearly imply a fortiori that E[log(Ξn)]=o(logn), thereby also giving us the first result from above.

Also note that in the proof above of () we needed to assume anyway that Ξn=o(logn) almost surely (or at least something similar), so that if we are able to show () then we will most likely also have in the process needed to show Ξn=o(logn) almost surely, and therefore if we can prove () we will most likely be able to immediately reach all of the following conclusions.

3. However, if we have this result, then I don't understand how one would also have that EZn=2logn+Θ(1), since o(1)Θ(1). But at the very least it would seem to be true that

EZn=2logn+O(1).


So then it seems that we can focus on answering the question of how to show that

Ξn=o(logn) almost surely.

We will also need to do the grunt work of providing a proof for (~), but to the best of my knowledge that is just calculus and involves no probability theory, although I have yet to sit down and try it yet.

First let's go through a chain of trivialities in order to rephrase the problem in a way which makes it easier to solve (note that by definition Ξn0):

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

One also has that:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Correspondingly, define for all n:

un(ε)=inf{y:F(y)1εlognn}.

Therefore the above steps show us that:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Notice that we can write:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

The sequences un(ε) become uniformly larger as ε decreases, so we can conclude that the events

{Znun(ε) infinitely often}
are decreasing (or at least somehow monotonic) as ε goes to 0. Therefore the probability axiom regarding monotonic sequences of events allows us to conclude that:

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Therefore it suffices to show that for all ε>0,

P(Znun(ε) infinitely often)=0

because of course the limit of any constant sequence is the constant.

Here is somewhat of a sledgehammer result:

Theorem 4.3.1., p. 252 of Galambos, The Asymptotic Theory of Extreme Order Statistics, 2nd edition. Let X1,X2, be i.i.d. variables with common nondegenerate and continuous distribution function F(x), and let un be a nondecreasing sequence such that n(1F(un)) is also nondecreasing. Then, for un<sup{x:F(x)<1},

P(Znun infinitely often)=0 or 1
according as
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

The proof is technical and takes around five pages, but ultimately it turns out to be a corollary of one of the Borel-Cantelli lemmas. I may get around to trying to condense the proof to only use the part required for this analysis as well as only the assumptions which hold in the Gaussian case, which may be shorter (but maybe it isn't) and type it up here, but holding your breath is not recommended. Note that in this case ω(F)=+, so that condition is vacuous, and n(1F(n)) is εlogn thus clearly non-decreasing.

Anyway the point being that, appealing to this theorem, if we can show that:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Note that since logarithmic growth is slower than any power law growth for any positive power law exponent (logarithms and exponentials are monotonicity preserving, so loglognαlognlognnα and the former inequality can always be seen to hold for all n large enough due to the fact that lognn and a change of variables), we have that:

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

since the p-series is known to converge for all p>1, and ε>0 of course implies 1+ε/2>1.

Thus using the above theorem we have shown that for all ε>0, P(Znun(ε) i.o.)=0, which to recapitulate should mean that Ξn=o(logn) almost surely.

We need to show still that logΞn=o(loglogn). This doesn't follow from the above, since, e.g.,

1nlogn=o(logn),logn+loglogno(logn).

However, given a sequence xn, if one can show that xn=o((logn)δ) for arbitrary δ>0, then it does follow that log(xn)=o(loglogn). Ideally I would like to be able to show this for Ξn using the above lemma (assuming it's even true), but am not able to (as of yet).

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.