क्या काउची वितरण किसी तरह से "अप्रत्याशित" वितरण है?


14

क्या काउची वितरण किसी तरह से "अप्रत्याशित" वितरण है?

मैंने करने की कोशिश की

cs <- function(n) {
  return(rcauchy(n,0,1))
}

आर में एन मूल्यों की एक भीड़ के लिए और देखा कि वे कभी-कभी काफी अप्रत्याशित मूल्य उत्पन्न करते हैं।

इसकी तुलना उदा

as <- function(n) {
  return(rnorm(n,0,1))
}

जो हमेशा बिंदुओं का "कॉम्पैक्ट" बादल देता प्रतीत होता है।

इस तस्वीर के द्वारा इसे सामान्य वितरण जैसा दिखना चाहिए? फिर भी यह शायद मूल्यों के एक सबसेट के लिए करता है। या शायद चाल यह है कि कॉची मानक विचलन (नीचे की तस्वीर में) बहुत अधिक धीरे-धीरे (बाएं और दाएं) में परिवर्तित होता है और इस प्रकार कम गंभीर संभावनाओं पर अधिक गंभीर आउटलेर के लिए अनुमति देता है?

https://i.stack.imgur.com/zGTLU.png

यहाँ सामान्य आरवी हैं और सीएस कॉची आरवी हैं।

यहाँ छवि विवरण दर्ज करें

लेकिन आउटलेर्स के अतिरेक से, क्या यह संभव है कि कॉची पीडीएफ की पूंछ कभी भी अभिसरित न हो?


9
1. आपका प्रश्न अस्पष्ट / अस्पष्ट है, इसलिए इसका उत्तर देना कठिन है; उदाहरण के लिए आपके प्रश्न में "अप्रत्याशित" का क्या अर्थ है? "कैची मानक विचलन" और अंत के निकट अभिसरण से आपका क्या मतलब है? आप कहीं भी मानक विचलन की गणना नहीं करते हैं। क्या, वास्तव में मानक विचलन? 2. साइट पर कई पोस्ट कॉची के गुणों पर चर्चा करते हैं जो आपके प्रश्न पर ध्यान केंद्रित करने में आपकी मदद कर सकते हैं। यह विकिपीडिया की जाँच के लायक भी हो सकता है। 3. मैं "घंटी के आकार" शब्द से बचने का सुझाव देता हूं; दोनों घनत्व लगभग घंटी के आकार के लगते हैं; बस उन्हें उनके नाम से बुलाओ।
Glen_b -Reinstate मोनिका

4
निश्चित रूप से कॉची बहुत भारी पूंछ है।
Glen_b -Reinstate मोनिका

1
मैंने कुछ तथ्य पोस्ट किए हैं; उम्मीद है कि ये आपको यह जानने में मदद करेंगे कि आप क्या जानना चाहते हैं ताकि आप अपने प्रश्न को परिष्कृत कर सकें।
Glen_b -Reinstate Monica

1
|एक्स|एक्स

2
बड़े आउटलेयर सामान्य के साथ संभव हैं, लेकिन वे अविश्वसनीय रूप से दुर्लभ हैं । घनत्व (और ऊपरी पूंछ में, विशेष रूप से कम से कम किसी दिए गए आकार के आउटलेर के लिए प्रासंगिकता के लिए, जीवित रहने का कार्य) सामान्य सिर के लिए कॉची की तुलना में 0 अधिक तेजी से होता है - लेकिन फिर भी दोनों घनत्व (और दोनों जीवित कार्य) एप्रोच ० और न ही कभी उस तक पहुँचे।
Glen_b -Reinstate मोनिका

जवाबों:


39

हालांकि साइट पर कई पोस्ट कॉची के विभिन्न गुणों को संबोधित करते हैं, मैंने एक का पता लगाने का प्रबंधन नहीं किया जो वास्तव में उन्हें एक साथ रखा था। उम्मीद है कि कुछ इकट्ठा करने के लिए यह एक अच्छी जगह हो सकती है। मैं इसका विस्तार कर सकता हूं।

भारी पूंछ

जबकि कॉची सममित और लगभग घंटी के आकार का है, कुछ हद तक सामान्य वितरण की तरह, इसमें बहुत अधिक भारी पूंछ (और "कंधे" से कम) है। उदाहरण के लिए, एक छोटी लेकिन अलग संभावना है कि एक कॉची रैंडम वैरिएबल माध्यिका से 1000 से अधिक इंटरक्वेर्टाइल रेंज बिछाएगा - लगभग एक ही ऑर्डर के सामान्य रैंडम वैरिएबल से कम से कम 2.67 इंटरक्वेर्टाइल रेंज उसके माध्यिका से होती है।

झगड़ा

कॉची का विचरण अनंत है।

संपादित करें: JG टिप्पणियों में कहता है कि यह अपरिभाषित है। यदि हम भिन्नता को मानों के जोड़े के बीच की आधी वर्ग दूरी के औसत के रूप में लेते हैं - जो कि दोनों के मौजूद होने पर विचरण के समान है, तो यह अनंत होगा। हालाँकि, सामान्य परिभाषा से JG सही है। [फिर भी नमूना साधनों के विपरीत, जो वास्तव में n के रूप में कुछ भी बड़े होने के लिए अभिसरण नहीं करता है, नमूना रूपांतरों का वितरण आकार में बढ़ता रहता है क्योंकि नमूना आकार बढ़ता है; स्केल आनुपातिक रूप से n तक बढ़ता है, या समकक्ष रूप से लॉग विचरण का वितरण नमूना आकार के साथ रैखिक रूप से बढ़ता है। ऐसा लगता है कि वास्तव में विचरण के उस संस्करण पर विचार करने के लिए उत्पादक है जो अनन्तता देता है हमें कुछ बता रहा है।]

नमूना मानक विचलन मौजूद हैं, निश्चित रूप से, लेकिन बड़ा नमूना वे बड़े होते हैं (उदाहरण के लिए n = 10 पर माध्य नमूना मानक विचलन 3.67 गुना पैमाने पैरामीटर (आधे IQR) के आसपास के क्षेत्र में है, लेकिन n = के लिए) 100 यह 11.9 के बारे में है)।

मीन

काउची वितरण का भी सीमित अर्थ नहीं है; मतलब के लिए अभिन्न अभिसरण नहीं करता है। नतीजतन, यहां तक ​​कि बड़ी संख्या के कानून लागू नहीं होते हैं - जैसे कि एन बढ़ता है, नमूना का मतलब कुछ निश्चित मात्रा में परिवर्तित नहीं होता है (वास्तव में उनके लिए अभिसरण करने के लिए कुछ भी नहीं है)।

वास्तव में, कॉची वितरण से माध्य का वितरण एकल अवलोकन (!) के वितरण के समान है। पूंछ इतनी भारी है कि योग में अधिक मूल्यों को जोड़ने से वास्तव में अत्यधिक मूल्य की संभावना होती है, जो कि अर्थ लेते समय एक बड़े हर से विभाजित करने के लिए क्षतिपूर्ति करने के लिए पर्याप्त है।

पूर्वानुमान

आप निश्चित रूप से एक कॉची वितरण से टिप्पणियों के लिए पूरी तरह से समझदार भविष्यवाणी अंतराल उत्पन्न कर सकते हैं; वहाँ सरल, काफी कुशल अनुमानक हैं जो स्थान और पैमाने का अनुमान लगाने के लिए अच्छा प्रदर्शन करते हैं और अनुमानित पूर्वानुमान अंतराल का निर्माण किया जा सकता है - इसलिए इस अर्थ में, कम से कम, काउची संस्करण 'पूर्वानुमान' हैं। हालांकि, पूंछ बहुत दूर तक फैली हुई है, ताकि यदि आप एक उच्च-संभावना अंतराल चाहते हैं, तो यह काफी व्यापक हो सकता है।

यदि आप वितरण के केंद्र की भविष्यवाणी करने की कोशिश कर रहे हैं (जैसे एक प्रतिगमन प्रकार मॉडल में), तो कुछ अर्थों में भविष्यवाणी करना अपेक्षाकृत आसान हो सकता है; कैची काफी चरम पर है (पैमाने के एक विशिष्ट माप के लिए केंद्र में "वितरण" के बहुत करीब है), इसलिए यदि आपके पास एक उपयुक्त अनुमानक है, तो केंद्र अपेक्षाकृत अच्छी तरह से अनुमान लगाया जा सकता है।

यहाँ एक उदाहरण है:

मैंने मानक कैची त्रुटियों (100 अवलोकनों, अवरोधन = 3, ढलान = 1.5) के साथ एक रैखिक संबंध से डेटा उत्पन्न किया, और अनुमानित प्रतिगमन लाइनों को तीन तरीकों से अनुमानित रूप से वाई-आउटलेर्स के लिए मजबूत किया है: टके 3 समूह रेखा (लाल), थिल प्रतिगमन (गहरा हरा) और L1- प्रतिगमन (नीला)। कॉची में कोई भी विशेष रूप से कुशल नहीं हैं - हालांकि वे सभी अधिक कुशल दृष्टिकोण के लिए उत्कृष्ट शुरुआती बिंदु बनाएंगे।

फिर भी तीनों डेटा की नीरवता की तुलना में लगभग संयोग हैं और जहां डेटा चलता है, उसके केंद्र के करीब स्थित है; इस अर्थ में कॉची स्पष्ट रूप से "पूर्वानुमेय" है।

पूर्ण अवशिष्टों का माध्य केवल किसी भी पंक्ति के लिए 1 से थोड़ा बड़ा है (अधिकांश डेटा अनुमानित रेखा के काफी करीब स्थित है); इस अर्थ में, कैची "पूर्वानुमान" है।

कैची त्रुटियों और तीन फिट प्रतिगमन लाइनों के साथ रैखिक संबंध

बाईं ओर के भूखंड के लिए एक बड़ी रूपरेखा है। डेटा को बेहतर तरीके से देखने के लिए मैंने दाईं ओर y- अक्ष पर स्केल को कम कर दिया।


1
भारी पूंछ और विचरण अनंत होने से संबंधित हैं, है ना?
मविविलेज

निश्चित रूप से। अपरिभाषित माध्य भी भारी पूंछ से संबंधित है।
Glen_b -Reinstate Monica

"वहाँ सरल, काफी कुशल अनुमानक हैं जो स्थान और पैमाने का अनुमान लगाने के लिए अच्छा प्रदर्शन करते हैं और अनुमानित पूर्वानुमान अंतराल का निर्माण किया जा सकता है" - क्या आप संदर्भ प्रदान कर सकते हैं?
कार्लोस सिनेली

टिप्पणियाँ विस्तारित चर्चा के लिए नहीं हैं; इस वार्तालाप को बातचीत में स्थानांतरित कर दिया गया है ।
गूँग - मोनिका

@Carlos वहाँ दो अलग-अलग मुद्दे हैं - (i) स्थान के लिए सरल, काफी कुशल अनुमानक (जैसे कि उपयुक्त रूप से छंटनी का मतलब है) और कॉची में पैमाने , और (ii) एक भविष्यवाणी अंतराल के निर्माण के लिए तरीके जो कॉची के लिए काम करेंगे। मुझे लगता है कि पहली साइट पर पहले से ही कवर किया गया है, और दूसरा अपने स्वयं के प्रश्न का गुणन करेगा।
Glen_b -Reinstate Monica

1

μσnμ±σμ±636.62σ

σ एक मानक विचलन नहीं है; यह एक पैमाना है। कोई परिभाषित मतलब नहीं है, इसलिए उच्च क्षण भी मौजूद नहीं हैं। यह अक्सर कहा जाता है कि माध्य और विचरण अनंत हैं और अभिन्न की एक परिभाषा के तहत जो लगभग सच है, लेकिन अभिन्न की एक और समझ में, वे बस मौजूद नहीं हैं। आप एक प्रसरण या एक संपत्ति के रूप में एक साधन के बारे में सोचना चाह सकते हैं जो कुछ वितरणों में है, लेकिन अन्य नहीं। जिस प्रकार नाक एक कशेरुकी जीवों की संपत्ति है, यदि आप एक पेड़ को नाक से देखते हैं, तो यह एक पेड़ नहीं है। यदि आप एक वितरण को विचरण के साथ देखते हैं, तो यह कॉची वितरण नहीं है।

कैची वितरण प्रकृति में काफी कम दिखाई देता है, विशेष रूप से जहां आपके पास विकास के कुछ रूप हैं। यह भी दिखाई देता है जहां चीजें घूमती हैं, जैसे चट्टानें पहाड़ियों को लुढ़काती हैं। आप इसे स्टॉक मार्केट रिटर्न में वितरण के एक बदसूरत मिश्रण के मुख्य वितरण के रूप में पाएंगे, हालांकि नीलामी में बेची गई प्राचीन वस्तुओं जैसी चीजों के बदले नहीं। एंटिक्स पर रिटर्न भी एक माध्य या विचरण के बिना एक वितरण से संबंधित है, लेकिन कॉची वितरण नहीं। नीलामी के नियमों में अंतर से मतभेद पैदा होते हैं। यदि आप NYSE के नियमों को बदलते हैं, तो कॉची वितरण गायब हो जाएगा, और एक अलग दिखाई देगा।

यह समझने के लिए कि यह आम तौर पर क्यों मौजूद है, कल्पना कीजिए कि आप बोलीदाताओं और संभावित बोलीदाताओं के एक बहुत बड़े समूह में एक बोलीदाता थे। क्योंकि स्टॉक को दोहरी नीलामी में बेचा जाता है, विजेता का अभिशाप लागू नहीं होता है। संतुलन में, तर्कसंगत व्यवहार आपके अपेक्षित मूल्य की बोली लगाना है। एक अपेक्षा माध्य का एक रूप है। माध्य अनुमानों का वितरण सामान्यता में परिवर्तित हो जाएगा क्योंकि नमूना आकार अनंत तक जाता है।

आरटी=पीटी+1पीटी

यह शेयर बाजार को बहुत अस्थिर बनाता है, अगर कोई सोचता है कि शेयर बाजार में सामान्य या लॉग-सामान्य वितरण होना चाहिए, लेकिन अप्रत्याशित रूप से अस्थिर नहीं है अगर आप भारी पूंछ की उम्मीद कर रहे हैं।

मैंने कॉची वितरण के लिए बायेसियन और फ़्रीक्वेंटिस्ट भविष्य कहनेवाला वितरण दोनों का निर्माण किया है और अपनी मान्यताओं को देखते हुए वे अच्छी तरह से काम करते हैं। बायेसियन भविष्यवाणी, कुल्बैक-लिबलर विचलन को कम करती है, जिसका अर्थ है कि आप किसी दिए गए डेटा सेट के लिए एक भविष्यवाणी में प्रकृति के करीब पहुंच सकते हैं। फ़्रीक्वेंटिस्ट भविष्यवाणी कई स्वतंत्र नमूनों से कई स्वतंत्र भविष्यवाणियों पर औसत कुल्बैक-लीब्लर विचलन को कम करती है । यह आवश्यक रूप से अच्छा प्रदर्शन नहीं करता है, हालांकि, किसी भी एक नमूने के लिए, जैसा कि एक औसत कवरेज के साथ उम्मीद करेगा। पूंछ अभिसरण करते हैं, लेकिन वे धीरे-धीरे परिवर्तित होते हैं।

बहुभिन्नरूपी कॉची में और भी अधिक परेशान करने वाले गुण हैं। उदाहरण के लिए, जबकि यह स्पष्ट रूप से कोवेरी नहीं कर सकता है क्योंकि इसका कोई मतलब नहीं है, इसमें कोवरियन मैट्रिक्स के समान कुछ भी नहीं है। यदि सिस्टम में कुछ और नहीं चल रहा है, तो कैची त्रुटियां हमेशा गोलाकार होती हैं। इसके अलावा, जबकि कुछ भी नहीं covaries, कुछ भी स्वतंत्र नहीं है। यह समझने के लिए कि व्यावहारिक रूप से कितना महत्वपूर्ण हो सकता है, दो देशों की कल्पना करें जो दोनों बढ़ रहे हैं और वे एक दूसरे के साथ व्यापार करते हैं। एक में त्रुटियां दूसरे में त्रुटियों से स्वतंत्र नहीं हैं। मेरी गलतियाँ आपकी गलतियों को प्रभावित करती हैं। अगर किसी एक देश को पागल बना दिया जाता है, तो उस पागल की गलतियों को हर जगह महसूस किया जाता है। दूसरी ओर, चूंकि प्रभाव रैखिक नहीं हैं क्योंकि एक कोविरियस मैट्रिक्स के साथ उम्मीद करेगा, दूसरे देश प्रभाव को कम करने के लिए रिश्तों को गंभीर कर सकते हैं।

यह वही है जो ट्रम्प के व्यापार युद्ध को इतना खतरनाक बनाता है। यूरोपीय संघ द्वारा हर दूसरे एकल अर्थव्यवस्था के खिलाफ व्यापार के माध्यम से आर्थिक युद्ध की घोषणा करने के बाद दुनिया की दूसरी सबसे बड़ी अर्थव्यवस्था है और यह उन देशों से लड़ने के लिए पैसे उधार लेकर युद्ध कर रही है, जिन पर उसने युद्ध की घोषणा की थी। यदि उन आश्रितों को आराम करने के लिए मजबूर किया जाता है, तो यह एक तरह से बदसूरत हो जाएगा जिसमें किसी की जीवित स्मृति नहीं है। जब जैक्सन प्रशासन ने बैंक ऑफ अटलांटिक व्यापार शुरू किया तो हमें जैक्सन प्रशासन के बाद से ऐसी समस्या नहीं थी।

कॉची वितरण आकर्षक है क्योंकि यह घातीय और एस-वक्र बढ़ते सिस्टम में प्रकट होता है। वे लोगों को भ्रमित करते हैं क्योंकि उनका दिन-प्रतिदिन का जीवन घनत्व से भरा होता है जिसका एक मतलब होता है और आमतौर पर एक विचरण होता है। यह निर्णय लेना बहुत कठिन बना देता है क्योंकि गलत सबक सीखे जाते हैं।


मुझे वह साहसिक तरीका पसंद है जिसमें गणितीय गुणों को इस उत्तर में वास्तविक दुनिया के व्यवहार के लिए मैप किया जाता है। लेकिन क्या आपको इस बात का जिक्र नहीं करना चाहिए कि दोनों (दोनों तरफ) छंटनी की हुई कैची ने अपने सभी क्षणों को परिमित किया है?
एलेकोस पापाडोपोलोस

यह केवल बाईं ओर छोटा है। नाममात्र ग्रह बजट बाधा सही पर स्टोचस्टिक है और चूंकि मौद्रिक प्रणालियां सिस्टम का संरक्षण नहीं कर रही हैं, वे सही पर अनंत हैं।
डेव हैरिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.