सामान्य वितरण की तुलना में भारी वितरण वाली टी-वितरण


10

मेरे लेक्चर नोट्स में यह कहा गया है,

टी-वितरण सामान्य जैसा दिखता है, हालांकि थोड़ा भारी पूंछ के साथ।

मैं समझता हूं कि यह सामान्य (केंद्रीय सीमा प्रमेय के कारण) क्यों दिखाई देगा। लेकिन मुझे यह समझने में कठिन समय हो रहा है कि गणितीय रूप से कैसे साबित किया जाए कि इसमें सामान्य वितरण की तुलना में भारी पूंछ है और अगर सामान्य वितरण की तुलना में यह किस हद तक भारी है, इसे मापने का एक तरीका है।

जवाबों:


12

पहली बात यह है कि हम "भारी पूंछ" से क्या मतलब है को औपचारिक रूप देना है। एक समान स्थान और पैमाने (जैसे मानक विचलन) के लिए दोनों वितरणों को मानकीकृत करने के बाद चरम पूंछ में घनत्व कितना अधिक है, इस पर कोई नजर नहीं कर सकता है:

यहाँ छवि विवरण दर्ज करें
( इस उत्तर से, जो आपके प्रश्न के लिए कुछ हद तक प्रासंगिक है )

[इस मामले के लिए, स्केलिंग वास्तव में अंत में मायने नहीं रखती है; t अभी भी सामान्य से "भारी" होगा, भले ही आप बहुत भिन्न पैमानों का उपयोग करें; सामान्य हमेशा कम होता जाता है]

हालाँकि, यह परिभाषा - जबकि यह इस विशेष तुलना के लिए ठीक काम करता है - बहुत अच्छी तरह से सामान्यीकरण नहीं करता है।

आमतौर पर, व्हॉबर के उत्तर में बहुत बेहतर परिभाषा है । तो अगरY से अधिक भारी पूंछ है X, जैसा t पर्याप्त रूप से बड़ा हो जाता है (सभी के लिए) t> कुछ t0), फिर SY(t)>SX(t), कहाँ पे S=1F, कहाँ पे F (सही पर भारी पूंछ के लिए cdf है; दूसरी तरफ एक समान, स्पष्ट परिभाषा है)।

यहाँ छवि विवरण दर्ज करें

यहाँ यह लॉग-स्केल पर है, और सामान्य के क्वांटाइल स्केल पर, जो हमें और अधिक विवरण देखने की अनुमति देता है:

यहाँ छवि विवरण दर्ज करें

इसलिए तब भारी तनाव का "प्रमाण" सीडीएफ की तुलना करना और यह दर्शाता है कि टी-सीएफडी की ऊपरी पूंछ अंततः हमेशा उस सामान्य से ऊपर रहती है और टी-सीएफडी की निचली पूंछ अंत में हमेशा सामान्य से नीचे रहती है।

इस मामले में करने के लिए आसान बात यह है कि घनत्व की तुलना करें और फिर दिखाएं कि सीडीएफएस (/ उत्तरजीवी कार्यों) की संबंधित सापेक्ष स्थिति का पालन करना चाहिए।

उदाहरण के लिए यदि आप तर्क दे सकते हैं कि (कुछ दिए गए पर) ν)

x2(ν+1)log(1+x2ν)>2log(k)

आवश्यक स्थिरांक के लिए k (का एक समारोह ν), सबके लिए x> कुछ x0, तो इसके लिए एक भारी पूंछ स्थापित करना संभव होगा tν बड़े के संदर्भ में परिभाषा पर भी 1F (या बड़ा F बाईं ओर)।

(यह फॉर्म घनत्वों के लॉग के अंतर से निम्नानुसार है, अगर वह घनत्व घनत्व के बीच आवश्यक संबंध रखता है)

[यह वास्तव में किसी के लिए भी दिखाना संभव है k (न केवल एक विशेष जिसे हमें प्रासंगिक घनत्व सामान्य करने वाले स्थिरांक से आने की आवश्यकता है), इसलिए परिणाम के लिए पकड़ होनी चाहिए k ज़रुरत है।]


1
के साथ एक ग्राफ logS(x) (और शायद फैली हुई है xथोड़ा) अधिक स्पष्ट रूप से भारी पूंछ का प्रदर्शन कर सकता है, और स्वतंत्रता की उच्च डिग्री के साथ भी काम कर सकता है,
हेनरी

1
@ हेनरी मैंने ऐसा प्लॉट जेनरेट किया, लेकिन यह सुनिश्चित नहीं था कि इसमें कितना मूल्य जोड़ा गया, इसलिए मैंने इसे शामिल नहीं किया। मैं इसे डालने के बारे में
सोचूंगा

1
@ हेनरी मैंने साजिश को शामिल किया।
Glen_b -Reinstate Monica

2

अंतर देखने का एक तरीका क्षणों के उपयोग से है E{xn}.

"हैवियर" पूंछ का अर्थ होगा समान शक्ति वाले क्षणों (पावर 4, 6, 8) के लिए उच्च मान, जब विचरण समान होता है। विशेष रूप से, 4-वें क्रम के क्षण (लगभग शून्य) को कर्टोसिस कहा जाता है और कुछ सटीक अर्थों में पूंछों के भारीपन की तुलना करता है।

विवरण के लिए विकिपीडिया देखें ( https://en.wikipedia.org/wiki/Kurtosis )


1
हालांकि ए के लिए tके साथ -distribution 3 या 4 स्वतंत्रता की डिग्री, कर्टोसिस अनंत है, जबकि 2 स्वतंत्रता की डिग्री मानक विचलन अनंत है, इसलिए आप कर्टोसिस की गणना नहीं कर सकते हैं, और साथ 1 स्वतंत्रता की डिग्री आप मतलब या गणना भी नहीं कर सकते 4वें पल।
हेनरी

3
@ हेनरी फिर भी यह विचार अच्छा है। छात्र की सीडीएफ का विस्तार करनाt(ν) चारों ओर वितरण + दिखाता है कि यह समान रूप से आनुपातिक है xν। इस प्रकार वजन से कम के सभी निरपेक्ष क्षणν मौजूद है और वजन के सभी पूर्ण क्षणों से अधिक है νहट जाना। सामान्य वितरण के साथ, सभी पूर्ण क्षण मौजूद हैं। यह सभी छात्रों की पूंछ का एक निश्चित क्रम प्रदान करता हैtवितरण और सामान्य वितरण के। वास्तव में, पैरामीटरνपूंछ के भारीपन को मापने के तरीके के बारे में मूल प्रश्न का एक उत्तर प्रदान करता है।
whuber

2

यहां जीवित कार्यों के आधार पर एक औपचारिक प्रमाण दिया गया है। मैं विकिपीडिया से प्रेरित "भारी पूंछ" की निम्नलिखित परिभाषा का उपयोग करता हूं :

एक यादृच्छिक चर Y अस्तित्व समारोह के साथ Sy(t) एक यादृच्छिक चर की तुलना में भारी पूंछ है X अस्तित्व समारोह के साथ Sx(t) iff

limtSy(t)Sx(t)=

एक रैंडम वैरिएबल पर विचार करें , जिसका अर्थ स्टूडेंट के रूप में दिया गया हो, जिसका अर्थ शून्य हो, स्वतंत्रता की डिग्री और स्केल पैरामीटर । हम इसकी तुलना यादृच्छिक चर । दोनों चर के लिए, अस्तित्व के कार्य अलग-अलग हैं। इसलिए, YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
जहाँ हमने प्रतिस्थापित किया है । ध्यान दें कि एक स्थिर, और इसलिए बीजगणितीय सीमा प्रमेय द्वारा, u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

महत्वपूर्ण रूप से, परिणाम , , और के मनमाने (परिमित) मूल्यों के लिए , इसलिए आपके पास ऐसी परिस्थितियाँ हो सकती हैं जहाँ वितरण में सामान्य से छोटा विचरण होता है, लेकिन फिर भी भारी पूंछ होती है।aσ2ν


1
बस ध्यान दें कि भारी पूंछ की यह "परिभाषा" हमेशा स्वीकार्य नहीं होती है। उदाहरण के लिए, एन (0,1) वितरण, इस परिभाषा के अनुसार, 9999 * यू (-1,1) + .0001 * यू (-1000, 1000) वितरण की तुलना में भारी पूंछ है, भले ही बाद वाला वितरण पैदा करता है। बाउंड सपोर्ट होने के बावजूद, औसत से 175 मानक विचलन तक के मूल्य। बेशक, एन (0,1) भी इस तरह के मूल्यों का उत्पादन करता है, लेकिन व्यावहारिक उद्देश्यों के लिए प्रासंगिकता के साथ अच्छी तरह से नीचे दिया जा सकता है।
पीटर वेस्टफॉल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.