आयाम बढ़ने पर सामान्य वितरण की घनत्व


15

जो प्रश्न मैं पूछना चाहता हूं वह यह है कि 1 सामान्य वितरण के दौरान एसडी के नमूनों का अनुपात भिन्न-भिन्न कैसे होता है क्योंकि वेरिएबल की संख्या बढ़ जाती है?

(लगभग) हर कोई जानता है कि 1 आयामी सामान्य वितरण में, मीन के 1 मानक विचलन के भीतर 68% नमूने पाए जा सकते हैं। 2, 3, 4, ... आयामों के बारे में क्या? मुझे पता है कि यह कम हो जाता है ... लेकिन कितना (ठीक) से? 1, 2, 3 ... 10 आयामों के साथ-साथ 1, 2, 3 ... 10 अंक के लिए आंकड़े दिखाने वाली एक तालिका रखना आसान होगा। क्या कोई ऐसी तालिका की ओर इशारा कर सकता है?

थोड़ा और संदर्भ - मेरे पास एक सेंसर है जो 128 चैनलों तक का डेटा प्रदान करता है। प्रत्येक चैनल (स्वतंत्र) विद्युत शोर के अधीन है। जब मुझे एक अंशांकन वस्तु का एहसास होता है, तो मैं माप की एक पर्याप्त संख्या को औसत कर सकता हूं और 128 व्यक्तिगत मानक विचलन के साथ, 128 चैनलों में औसत मूल्य प्राप्त कर सकता हूं।

लेकिन ... जब व्यक्तिगत तात्कालिक रीडिंग की बात आती है, तो डेटा 128 व्यक्तिगत रीडिंग की तरह ज्यादा प्रतिक्रिया नहीं करता है क्योंकि यह एक (अप करने के लिए) 128-डिमेन्सोनल वेक्टर मात्रा की रीडिंग पसंद करता है। निश्चित रूप से यह उन कुछ महत्वपूर्ण रीडिंग के इलाज का सबसे अच्छा तरीका है जो हम लेते हैं (आमतौर पर 128 में से 4-6)।

मैं इस बात को महसूस करना चाहता हूं कि इस वेक्टर स्पेस में "सामान्य" भिन्नता क्या है और "बाह्य" क्या है। मुझे यकीन है कि मैंने एक तालिका देखी है जैसा मैंने वर्णित किया है कि इस तरह की स्थिति पर लागू होगा - क्या कोई एक को इंगित कर सकता है?


कृपया - क्या मेरे पास केवल अनुभवजन्य उत्तर हो सकते हैं - मैं अधिकांश गणितीय संकेतन नहीं समझता।
ओमाताई

जवाबों:


19

ले : प्रत्येक एक्स मैं सामान्य है एन ( 0 , 1 ) और एक्स मैं स्वतंत्र हैं - मुझे लगता है कि आप उच्च आयामों के साथ क्या मतलब है कि के।X=(X1,,Xd)N(0,I)XiN(0,1)Xi

आप कहेंगे कि मतलब के 1 sd के भीतर है जब | | एक्स | | < 1 (X और इसके माध्य मान के बीच की दूरी 1 से कम है)। अब | | एक्स | | 2 = एक्स 2 1 + + एक्स 2 ~X||X||<1 तो यह संभावना के साथ होता है पी ( ξ < 1 ) जहां ξ ~ χ 2 ( )||X||2=X12++Xd2χ2(d)P(ξ<1)ξχ2(d)। आप इसे अच्छे ची स्क्वायर टेबल में पा सकते हैं ...

यहाँ कुछ मूल्य दिए गए हैं:

dP(ξ<1)10.6820.3930.2040.09050.03760.01470.005280.001890.00056100.00017

और 2 एसडी के लिए:

dP(ξ<4)10.9520.8630.7440.5950.4560.3270.2280.1490.089100.053

आप की तरह commads साथ आर में इन मूल्यों प्राप्त कर सकते हैं pchisq(1,df=1:10), pchisq(4,df=1:10)आदि

पोस्ट स्क्रिप्टम जैसा कि कार्डिनल ने टिप्पणियों में बताया है, कोई इन संभावनाओं के स्पर्शोन्मुख व्यवहार का अनुमान लगा सकता है। एक की CDF चर रहा है एफ डी ( एक्स ) = पी ( डी / 2 , एक्स / 2 ) = γ ( / 2 , एक्स / 2 )χ2(d) जहांγ(रों,y)=y0टीएस-1-टीडीटीहैअधूराγसमारोह, और classicalyΓ(रों)=0टीएस-1-टीdt

Fd(x)=P(d/2,x/2)=γ(d/2,x/2)Γ(d/2)
γ(s,y)=0yts1etdtγΓ(s)=0ts1etdt

जब भागों शो से एक पूर्णांक, बार-बार एकीकरण है कि पी ( रों , y ) = - y Σ कश्मीर = रों y कश्मीरs जो पूसों वितरण के सीडीएफ की पूंछ है।

P(s,y)=eyk=sykk!,

अब इस राशि अपने पहले कार्यकाल का प्रभुत्व है (कार्डिनल के लिए बहुत धन्यवाद): बड़ेएस केलिएवाई। हम इस आवेदन कर सकते हैं जबभी है: पी(ξ<एक्स)P(s,y)yss!eysd

P(ξ<x)=P(d/2,x/2)1(d/2)!(x2)d/2ex/21πde12(dx)(xd)d21πe12xd12d,
बड़े के लिए भी , स्टर्लिंग फार्मूला का उपयोग कर तुलनीय तुल्यता। इस सूत्र से हम देखते हैं कि asymptotic क्षय के रूप में बहुत तेजी से होता वृद्धि हुई है।dd

हमारी साइट पर आपका स्वागत है, एल्विस! अच्छा उत्तर। (+1)
व्हीबर

1
ξd

आपकी टिप्पणीयों के लिए धन्यवाद। मुझे नहीं लगता था कि इस उत्तर पर बहुत ध्यान दिया जाएगा! यह सच है कि यह आयामीता के अभिशाप का एक अच्छा रूप है ... @cardinal के बारे में (3) मैं अधूरा गामा फ़ंक्शन के किसी भी विषम के बराबर नहीं जानता जब पहला पैरामीटर अनन्तता में जाता है, दूसरा तय किया जा रहा है, यह आसान नहीं है! एक मोटा मुक़ाबला किया जा सकता है, मैं बाद में लिख सकता हूं।
एल्विस

2
=2जेडमैं=एक्स2मैं-12+एक्स2मैं2एक्सपी(1/2)एक्स2=Σमैं=1जेडमैंएक्स2पी(एक्स2<1)=पी(एन1/2(0,1))=-1/2Σएक्स=2-एक्स/एक्स!पी(एक्स2<1)~-1/22-/Γ(+1) जैसा (फिर: =/2).
cardinal

1
Part of the point of the foregoing comment is that we get an exact answer for all even d. Also, using Stirling's approximation, we get that P(X2<1)e1/22k/Γ(k+1)e(d1)/2d(d+1)/2/π.
cardinal
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.