स्वतंत्र lognormal यादृच्छिक चर का योग lognormal प्रकट होता है?


11

मैं यह समझने की कोशिश कर रहा हूं कि जब आप टिप्पणियों की संख्या बढ़ाते हैं, तो दो (या अधिक) lognormal यादृच्छिक चर का योग एक lognormal वितरण से संपर्क करता है। मैंने ऑनलाइन देखा है और इससे संबंधित कोई परिणाम नहीं मिला है।

स्पष्ट रूप से अगर और स्वतंत्र लॉगेनॉर्मल वैरिएबल हैं, तो एक्सप्रेशन और गॉसियन रैंडम वैरिएबल के गुणों के अनुसार, भी लॉगऑनॉर्मल है। हालांकि, यह सुझाव देने का कोई कारण नहीं है कि लॉगऑनॉर्मल भी है।Y X × Y X + YXYX×YX+Y

तथापि

यदि आप दो स्वतंत्र lognormal यादृच्छिक चर और उत्पन्न करते हैं , और , और इस प्रक्रिया को कई बार दोहराते हैं, तो का वितरण lognormal प्रतीत होता है। जैसा कि आप टिप्पणियों की संख्या में वृद्धि करते हैं, यह एक तार्किक वितरण के करीब जाना भी प्रतीत होता है।वाई जेड = एक्स + वाई जेडXYZ=X+YZ

उदाहरण के लिए: 1 मिलियन जोड़े पैदा करने के बाद, Z के प्राकृतिक लॉग का वितरण नीचे दिए गए हिस्टोग्राम में दिया गया है। यह बहुत स्पष्ट रूप से एक सामान्य वितरण जैसा दिखता है, यह सुझाव देते हुए कि वास्तव में तार्किक है।Z

यहाँ छवि विवरण दर्ज करें

क्या किसी के पास उन ग्रंथों के बारे में कोई अंतर्दृष्टि या संदर्भ है जो इसे समझने में उपयोग हो सकते हैं?


क्या आप और लिए समान रूपांतर मान रहे हैं ? यदि आप अनुकरण करते हैं , तो योग का लॉग बहुत सामान्य नहीं दिखता है। वाईXYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
स्टीफन कोलासा

मैंने समान भिन्नताओं को मान लिया था - मैं असमान रूपांतर के साथ एक और कोशिश करूंगा और देखूंगा कि मैं क्या कर रहा हूं।
पैटी

2 और 3 के रूपांतरों के साथ, मुझे कुछ ऐसा मिला जो अभी भी थोड़ा सामान्य लग रहा था, अल्बाइट के साथ जो एक छोटे से तिरछा दिखता है।
पैटी

1
के माध्यम से देख रहे हैं पिछले प्रश्न सहायक हो सकता है। यहां और यहां संभावित रूप से उपयोगी कागजात हैं। अच्छे लगे!
स्टेफान कोलासा

जवाबों:


20

लॉगऑनॉर्मल के योगों की यह अनुमानित lognormality अंगूठे का एक प्रसिद्ध नियम है; यह कई पत्रों में उल्लिखित है - और साइट पर कई पोस्ट में।

पहले दो क्षणों के मेल से लॉगॉर्मोर्मल की राशि के लिए एक लॉगानॉर्मल सन्निकटन को कभी-कभी फेंटन-विल्किंसन सन्निकटन कहा जाता है।

आपको यह दस्तावेज़ Dufresne द्वारा उपयोगी ( यहाँ या यहाँ उपलब्ध है ) मिल सकता है।

मैंने पहले भी कभी-कभी लोगों को मिशेल के कागज की ओर इशारा किया था

मिशेल, आरएल (1968),
"लॉग-नॉर्मल डिस्ट्रिब्यूशन का परमानेंट।"
जे। ऑप्टिकल सोसाइटी ऑफ अमेरिका । 58: 1267-1272।

लेकिन यह अब ड्यूफ्रेसन के संदर्भ में कवर किया गया है।

लेकिन जब तक यह बहुत तिरछी स्थिति में नहीं होता है, तब यह सामान्य रूप से धारण नहीं करता है, यहां तक ​​कि आईड लॉगऑर्मल के लिए भी नहीं, क्योंकि काफी बड़े नहीं होते हैं।n

यहां 1000 सिम्युलेटेड वैल्यू का एक हिस्टोग्राम है, जो प्रत्येक में पचास-हज़ार आईआईडी लॉगऑर्मल का योग है :

पचास हजार लोगनॉर्मल की राशि का हिस्टोग्राम

जैसा कि आप देखते हैं ... लॉग काफी तिरछा है, इसलिए योग लॉगनोर्मल के बहुत करीब नहीं है।

वास्तव में, यह उदाहरण लोगों की सोच (केंद्रीय सीमा प्रमेय के कारण) के लिए एक उपयोगी उदाहरण के रूप में भी गिना जाएगा कि सैकड़ों या हजारों में कुछ सामान्य औसत के बहुत करीब दे देंगे; यह इतना तिरछा है कि इसका लॉग काफी सही तिरछा है, लेकिन केंद्रीय सीमा प्रमेय फिर भी यहां लागू होती है; एक कई लाखों की * आवश्यक हो रहा था जब इसे कहीं भी पास सममित देखने के लिए शुरू होता है।nnn

* मैंने यह पता लगाने की कोशिश नहीं की है कि कितने (लेकिन, औसत रूप से) औसत रूप से व्यवहार करने के कारण, कुछ मिलियन स्पष्ट रूप से अपर्याप्त होंगे


चूंकि टिप्पणियों में अधिक विवरण का अनुरोध किया गया था, आप निम्न कोड के साथ उदाहरण के लिए एक समान दिखने वाला परिणाम प्राप्त कर सकते हैं, जो स्केल पैरामीटर और आकार पैरामीटर साथ 50,000 lognormal यादृच्छिक चर की राशि के 1000 प्रतिकृति का उत्पादन करता है। :μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(जब से मैंने की कोशिश की है । इसका लॉग अभी भी भारी सही तिरछा है)n=106


क्या आप चित्र में हिस्टोग्राम बनाने के लिए उपयोग किए जाने वाले मापदंडों (या कोड स्निपेट) को जोड़ सकते हैं?
परोपकार करें

1
यह दो साल पहले था, मुझे याद नहीं है कि लॉगऑनॉर्मल पैरामीटर क्या थे। लेकिन हम सरल तर्क लागू करते हैं। आपको पैरामीटर के बारे में चिंता करने की आवश्यकता नहीं होगी , क्योंकि यह केवल एक्स-एक्सिस स्केल पर मानों को प्रभावित करता है, न कि आकार ( का उपयोग करने के लिए सुविधाजनक कुछ )। ताकि आकार पर किसी भी प्रभाव के साथ एकमात्र के रूप में पैरामीटर छोड़ देता है । मान लें कि और ऊपर दिए गए हिस्टोग्राम में पैमाने से मोटे तौर पर वापस काम कर रहे हैं, तो हमें पता चलता है कि या तो के बॉलपार्क में होना चाहिए (NB सावधान रहें कि यह कैसे तिरछा है)। और सिर्फ कोशिश करने से ऊपर के समान सुंदर उपस्थिति मिलती है। μ = 0 σ μ = 0 σ 4 4μμ=0σμ=0σ44
Glen_b -Reinstate मोनिका

1
इसलिए: res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)... यदि आप इसे कुछ बार आजमाते हैं, तो आप देखेंगे कि स्केल थोड़ा छोटा है, लेकिन सामान्य चित्र सही है। ध्यान दें कि घटक lognormals की जनसंख्या पल-तिरछा बिलियन है - जनसंख्या का मतलब आपके अधिकांश नमूनों में लगभग हर उत्पन्न मूल्य से अधिक होगा। 26.5
Glen_b -Reinstate Monica

2

यह शायद बहुत देर हो चुकी है, लेकिन मैंने लॉगनॉर्मल डिस्ट्रीब्यूशन के योग पर निम्नलिखित पेपर पाया है , जो इस विषय को कवर करता है। यह लाजिमी नहीं है, लेकिन इसके साथ काम करने के लिए काफी अलग और कठिन कुछ है।


1

2009 के डफ्रेस्ने द्वारा सलाह दी कागज और इस के साथ 2004 में एक साथ से एक इस उपयोगी कागज कवर लॉग-सामान्य वितरण की राशि का अनुमान पर इतिहास और योग गणितीय परिणाम देता है।

समस्या यह है कि वहाँ उद्धृत सभी अनुमानों को प्रस्थान से दबाकर पाया जाता है कि आप उस मामले में हैं जिसमें लॉग-सामान्य वितरण का योग अभी भी लॉग-सामान्य है। तब आप कुछ अनुमानित तरीके से वैश्विक राशि के और की गणना कर सकते हैं । लेकिन इससे आपको वे शर्तें नहीं मिलेंगी जिन्हें आपको पूरा करना है यदि आप चाहते हैं कि योग अभी भी सामान्य है।σμσ

हो सकता है [यह पेपर] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) आपको एक विशेष मामले में लॉग-मानदंडों के योग के लिए एक केंद्रीय सीमा प्रमेय का एक प्रकार दे, लेकिन अभी भी है सामान्यता की कमी। वैसे भी ग्लेन_ बी द्वारा दिया गया उदाहरण वास्तव में उचित नहीं है, क्योंकि यह एक ऐसा मामला है जहां आप आसानी से क्लासिक केंद्रीय सीमा प्रमेय को लागू कर सकते हैं, और निश्चित रूप से उस मामले में लॉग-सामान्य का योग गॉसियन है।

लेकिन यह सच है जैसा कि ऊपर दिए गए कागज में कहा गया है कि यहां तक ​​कि सीमा में भी आप लॉग-नॉर्मल योग रख सकते हैं (उदाहरण के लिए यदि वेरिएबल सहसंबद्ध हैं या पर्याप्त रूप से आईआईडी नहीं है ) n


1
आप कहते हैं कि मेरे उदाहरण में "आप आसानी से क्लासिक केंद्रीय सीमा प्रमेय लागू कर सकते हैं" लेकिन अगर आप समझते हैं कि हिस्टोग्राम क्या दिखा रहा है, तो स्पष्ट रूप से आप यह तर्क देने के लिए CLT का उपयोग नहीं कर सकते कि इस मामले के लिए n = 50000 पर एक सामान्य सन्निकटन लागू होता है; राशि इतनी दाहिनी तिरछी है कि उसका लॉग अभी भी भारी दाहिना तिरछा है। उदाहरण की बात यह थी कि यह बहुत ही विषम है (एक हिस्टोरोग्राम सममित से बहुत करीब लगेगा)। एक कम तिरछा सन्निकटन (जैसे सामान्य) * बदतर * होगा
Glen_b -Reinstate Monica

मैं सहमत हूँ, लेकिन शायद आप उदाहरण में या तो नमूने के संख्यात्मक अभिसरण तक नहीं पहुँचे हैं (1000 परीक्षण बहुत कम हैं) या सांख्यिकीय अभिसरण तक नहीं पहुँचा गया है, (50 000 जोड़ बहुत कम हैं), लेकिन अनंतता की सीमा में वितरण के लिए होना चाहिए गाऊसी हो, क्योंकि हम सीएलटी परिस्थितियों में हैं, है ना?
Mim 10

राशि के वितरण के आकार को समझने के लिए 1000 से अधिक नमूने पर्याप्त हैं - हमारे द्वारा लिए गए नमूनों की संख्या आकार में परिवर्तन नहीं करती है, बस "स्पष्ट रूप से" हम इसे कैसे देखते हैं। यदि हम एक बड़ा नमूना लेते हैं तो यह स्पष्ट तिरछापन दूर नहीं होने वाला है, यह सिर्फ चिकना दिखने वाला है। हां, सामान्य दिखने के योग के लिए 50,000 बहुत कम है - यह इतना सही तिरछा है कि लॉग अभी भी बहुत तिरछा दिखता है। यथोचित रूप से सामान्य दिखने से पहले इसे कई लाखों लोगों की आवश्यकता हो सकती है। हां, CLT निश्चित रूप से लागू होता है; यह iid है और विचरण परिमित है, इसलिए मानकीकृत साधनों को अंततः सामान्यता प्राप्त करनी चाहिए।
Glen_b -Reinstate Monica

1

भौतिक घटना पर व्यापक कानून व्यापक रूप से मौजूद है, सिस्टम के किसी भी स्केलिंग व्यवहार का अध्ययन करने के लिए इस तरह के चर वितरण के योग आवश्यक हैं। मुझे पता है कि यह लेख (बहुत लंबा और बहुत मजबूत है, शुरुआत की जा सकती है यदि आप कोई नमूनावादी नहीं हैं!), "2003 में प्रकाशित" लोगनाम रैंडम वैरिएबल की राशि में व्यापक वितरण प्रभाव ", (यूरोपियन फिजिकल जर्नल बी-कंडेंस्ड लैटर एंड कॉम्प्लेक्स) सिस्टम 32, 513) और उपलब्ध है https://arxiv.org/pdf/physics/0211065.pdf

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.