आम वितरण के वास्तविक जीवन के उदाहरण


28

मैं सांख्यिकी के लिए रुचि विकसित करने वाला एक स्नातक छात्र हूं। मुझे सामग्री बहुत पसंद है, लेकिन मुझे कभी-कभी वास्तविक जीवन के अनुप्रयोगों के बारे में सोचने में कठिन समय लगता है। विशेष रूप से, मेरा प्रश्न आमतौर पर इस्तेमाल किए जाने वाले सांख्यिकीय वितरण (सामान्य - बीटा- गामा आदि) के बारे में है। मुझे लगता है कि कुछ मामलों में मुझे विशेष गुण मिलते हैं जो वितरण को काफी अच्छा बनाते हैं - उदाहरण के लिए घातीय की स्मृतिहीन संपत्ति। लेकिन कई अन्य मामलों के लिए, मेरे पास पाठ्यपुस्तकों में आम वितरण के महत्व और अनुप्रयोग दोनों क्षेत्रों के बारे में कोई अंतर्ज्ञान नहीं है।

मेरी चिंताओं को दूर करने वाले कई अच्छे स्रोत हैं, मुझे खुशी होगी अगर आप उन लोगों को साझा कर सकते हैं। अगर मैं इसे वास्तविक जीवन के उदाहरणों के साथ जोड़ सकता हूं तो मैं सामग्री में बहुत अधिक प्रेरित होऊंगा।


8
वितरण की एक विस्तृत श्रृंखला को कवर करने वाले चौदह प्रकार के अनुप्रयोगों को मैथेमेटिका के फ़ंक्शन के लिए मदद पृष्ठ EstimatedDistribution पर "एप्लिकेशन" के तहत वर्णित किया गया है ।
whuber

जवाबों:


23

विकिपीडिया में एक पृष्ठ है जो प्रत्येक वितरण के बारे में अधिक विस्तार से लिंक के साथ कई संभावना वितरण को सूचीबद्ध करता है । आप सूची के माध्यम से देख सकते हैं और उन अनुप्रयोगों के प्रकारों के लिए एक बेहतर अनुभव प्राप्त करने के लिए लिंक का अनुसरण कर सकते हैं जो विभिन्न वितरण आमतौर पर उपयोग किए जाते हैं।

बस याद रखें कि ये वितरण मॉडल वास्तविकता के लिए उपयोग किए जाते हैं और जैसा कि बॉक्स ने कहा: "सभी मॉडल गलत हैं, कुछ मॉडल उपयोगी हैं"।

यहाँ कुछ सामान्य वितरण और कुछ कारण हैं जो उनके लिए उपयोगी हैं:

सामान्य: यह सीएलटी के कारण साधन और अन्य रैखिक संयोजनों (जैसे प्रतिगमन गुणांक) को देखने के लिए उपयोगी है। इससे संबंधित है कि अगर किसी चीज को कई अलग-अलग छोटे कारणों के योगात्मक प्रभावों के कारण उत्पन्न होने के लिए जाना जाता है, तो सामान्य एक उचित वितरण हो सकता है: उदाहरण के लिए, कई जैविक उपाय कई जीनों और कई पर्यावरणीय कारकों के परिणाम हैं और अक्सर लगभग सामान्य होते हैं ।

गामा: एक प्राकृतिक न्यूनतम के साथ चीजों के लिए सही तिरछा और उपयोगी। आमतौर पर बीता हुआ समय और कुछ वित्तीय चर के लिए उपयोग किया जाता है।

घातांक: गामा का विशेष मामला। यह स्मृतिहीन है और आसानी से तराजू है।

ची-वर्ग ( ): गामा का विशेष मामला। चौकोर सामान्य चरों के योग के रूप में उठता है (इसलिए इसका उपयोग चर के लिए किया जाता है)।χ2

बीटा: 0 और 1 के बीच परिभाषित (लेकिन अन्य मूल्यों के बीच होने के लिए परिवर्तित किया जा सकता है), अनुपात या अन्य मात्रा के लिए उपयोगी है जो 0 और 1 के बीच होना चाहिए।

द्विपद: "सफलता" की समान संभावना वाले स्वतंत्र परीक्षणों में से कितने "सफल" होते हैं।

पॉसन: मायने रखता है। अच्छे गुण जो किसी समय या क्षेत्र की घटनाओं की संख्या में एक पॉइसन का अनुसरण करते हैं, तो समय या क्षेत्र में दो बार की संख्या अभी भी पॉइसन (दो बार माध्य के साथ) का अनुसरण करती है: यह पॉइज़न जोड़ने या मान के अलावा अन्य स्केलिंग के लिए काम करता है 2।

ध्यान दें कि यदि घटनाएं समय के साथ होती हैं और घटनाओं के बीच का समय एक घातांक का अनुसरण करता है तो एक समयावधि में होने वाली संख्या एक पॉइसन का अनुसरण करती है।

नकारात्मक द्विपद: न्यूनतम 0 (या किस संस्करण के आधार पर अन्य मूल्य) और कोई ऊपरी सीमा नहीं है। वैचारिक रूप से यह "सफलताओं" से पहले "विफलताओं" की संख्या है। नकारात्मक द्विपद भी पॉइसन चर का एक मिश्रण है जिसका अर्थ गामा वितरण से आता है।

जियोमेट्रिक: नकारात्मक द्विपद के लिए विशेष मामला जहां यह 1 "सफलता" से पहले "विफलताओं" की संख्या है। यदि आप इसे असतत बनाने के लिए एक घातीय चर को काटते (राउंड डाउन) करते हैं, तो परिणाम ज्यामितीय होता है।


3
खैर आपके जवाब के लिए धन्यवाद। हालाँकि, विकिपीडिया एक अधिक सामान्य विवरण प्रदान करता है जो मैं चाहूंगा। असल में, मेरा सवाल यह है कि कुछ वितरण अच्छे क्यों हैं? सामान्य वितरण के मामले में एक संभावित उत्तर देने के लिए, केंद्रीय सीमित प्रमेय से संबंधित हो सकता है - जो कहता है कि यदि आप अनंत मात्रा में टिप्पणियों का नमूना लेते हैं, तो आप वास्तव में असमानता में देख सकते हैं कि उन टिप्पणियों का एक पर्याप्त आंकड़ा, स्वतंत्रता को सामान्य वितरण है। । मैं इस तरह के और उदाहरणों की खोज कर रहा हूं ..
रोर्क

वास्तव में एक वास्तविक वितरण नहीं है, लेकिन बिमोडल के बारे में क्या? मैं किसी भी सामान्य रूप से देखे जाने वाले वास्तविक उदाहरणों के बारे में नहीं सोच सकता, क्योंकि मैंने पाया कि मानव में लिंग भेद बहुत सारे नहीं हैं।
सीलिंग कैट


3

स्पर्शोन्मुख सिद्धांत सामान्य वितरण, चरम मूल्य प्रकार, स्थिर कानूनों और पॉइसन की ओर जाता है। घातांक और वीबुल वितरण को घटना के लिए पैरामीट्रिक समय के रूप में आते हैं। वेइबुल के मामले में यह एक नमूना के न्यूनतम के लिए एक चरम मूल्य प्रकार है। सामान्य रूप से वितरित टिप्पणियों के लिए पैरामीट्रिक मॉडल से संबंधित ची वर्ग, टी और एफ वितरण परिकल्पना परीक्षण और आत्मविश्वास अंतराल आकलन में उत्पन्न होते हैं। ची वर्ग आकस्मिक तालिका विश्लेषण और फिट परीक्षणों की अच्छाई में भी आता है। परीक्षणों की शक्ति का अध्ययन करने के लिए हमारे पास गैर-केंद्रीय टी और एफ वितरण हैं। आकस्मिक तालिकाओं के लिए फिशर के सटीक परीक्षण में हाइपरजोमेट्रिक वितरण उत्पन्न होता है। अनुपात का अनुमान लगाने के लिए प्रयोग करते समय द्विपद वितरण महत्वपूर्ण है। नकारात्मक द्विपद एक बिंदु प्रक्रिया में मॉडल अतिसूक्ष्मता के लिए एक महत्वपूर्ण वितरण है। यह आपको व्यावहारिक पैरामीट्रिक गड़बड़ी पर एक अच्छी शुरुआत देनी चाहिए। (0, Gam) पर गैर-यादृच्छिक यादृच्छिक चर के लिए गामा वितरण विभिन्न प्रकार के आकार प्रदान करने के लिए लचीला है और लॉग सामान्य का भी आमतौर पर उपयोग किया जाता है। [०,१] पर बीटा परिवार वर्दी सहित सममित डिस्टर्बेशन प्रदान करता है और साथ ही बांये तिरछे या तिरछे दाएं वितरण करता है।

मुझे यह भी उल्लेख करना चाहिए कि यदि आप आंकड़ों में वितरण के बारे में सभी बारीक बारीकियों को जानना चाहते हैं, तो जॉनसन और कोटज़ की पुस्तकों की क्लासिक श्रृंखलाएं हैं, जिनमें असतत वितरण, निरंतर अविभाजित वितरण और निरंतर बहुभिन्नरूपी वितरण और उन्नत सिद्धांत की मात्रा 1 भी शामिल है। केंडल और स्टुअर्ट द्वारा सांख्यिकी के।


उत्तर के लिए बहुत बहुत धन्यवाद, यह अत्यंत उपयोगी है। धन्यवाद फिर से, यह वास्तव में मेरी मदद की।
रॉर्क

2

विलियम जे फेलर के कम से कम पहले 6 अध्यायों (पहले 218 पृष्ठों) को खरीदें और पढ़ें "संभावना परिचय का परिचय और इसके अनुप्रयोग, खंड 2। http://www.amazon.com/dp/0471257095/ref=rdr_extt-tmb । कम से कम सभी समस्याओं के समाधान के लिए पढ़ें, और अधिमानतः हल करने की कोशिश करें जितना आप कर सकते हैं। आपको वॉल्यूम 1 को पढ़ने की आवश्यकता नहीं है, जो मेरी राय में विशेष रूप से मेधावी नहीं है।

लेखक के होने के बावजूद ४५ १/२ साल पहले मृत्यु हो गई, इससे पहले कि पुस्तक समाप्त भी हो गई, यह बस संभावना और स्टोकेस्टिक प्रक्रियाओं में अंतर्ज्ञान विकसित करने और विभिन्न वितरणों के लिए एक समझ विकसित करने के लिए, सबसे अच्छा पुस्तक है, बार कोई भी नहीं है। , वे वास्तविक दुनिया की घटनाओं, और विभिन्न स्टोचस्टिक घटनाओं से संबंधित हैं, जो हो सकती हैं और होती हैं। और जिस ठोस नींव से आप इसे बनाएंगे, आप आंकड़ों में अच्छी तरह से परोसेंगे।

यदि आप इसे बाद के अध्यायों में बना सकते हैं, जो कुछ हद तक कठिन हो जाता है, तो आप लगभग सभी के आगे प्रकाश वर्ष होंगे। सीधे शब्दों में कहें, यदि आप फेलर वॉल्यूम 2 ​​को जानते हैं, तो आप संभावना (और स्टोकेस्टिक प्रक्रियाओं) को जानते हैं; इसका अर्थ यह है कि कुछ भी, जो आप नहीं जानते हैं, जैसे कि नए विकास, आप उस ठोस नींव पर निर्माण करके जल्दी से उठा पाएंगे और मास्टर कर पाएंगे।

इस धागे में पहले बताई गई लगभग सभी चीजें फेलर वॉल्यूम 2 ​​में हैं (सांख्यिकी के केंडल एडवांस्ड थ्योरी में सभी सामग्री नहीं है, लेकिन उस पुस्तक को पढ़ना फेलर वॉल्यूम 2 ​​के बाद केक का एक टुकड़ा होगा), और अधिक, बहुत कुछ, यह सब। एक तरह से जो आपके रूढ़िवादी सोच और अंतर्ज्ञान को विकसित करना चाहिए। जॉनसन और Kotz विभिन्न संभावना वितरण पर minutiae के लिए अच्छा है, Feller Vol 2 सीखने के लिए उपयोगी है कि कैसे संभावित रूप से सोचने के लिए, और जॉनसन और Kotz से क्या निकालना है और इसका उपयोग कैसे करना है।


2

बस अन्य उत्कृष्ट उत्तरों को जोड़ने के लिए।

npλ=npस्थिर रहता है, शून्य और अनंत से दूर होता है। यह हमें बताता है कि यह उपयोगी है जब भी हमारे पास व्यक्तिगत रूप से बहुत ही अनुचित घटनाओं की एक बड़ी संख्या होती है। कुछ अच्छे उदाहरण हैं: दुर्घटनाएँ, जैसे न्यूयॉर्क में एक दिन में कार के दुर्घटनाग्रस्त होने की संख्या, क्योंकि हर बार दो कारें गुजरती हैं / मिलते हैं और दुर्घटना की संभावना बहुत कम होती है, और ऐसे अवसरों की संख्या वास्तव में खगोलीय है! अब आप स्वयं अन्य उदाहरणों के बारे में सोच सकते हैं, जैसे कि एक वर्ष में दुनिया में विमान दुर्घटनाओं की कुल संख्या। क्लासिक उदाहरण जहां प्रीसियन घुड़सवार सेना में घोड़ों की मौत की संख्या है!

np(1p)p1pnpλpp


0

हाल ही में प्रकाशित शोधपता चलता है कि आम प्रदर्शन के विपरीत, मानव प्रदर्शन सामान्य रूप से वितरित नहीं किया जाता है। चार क्षेत्रों के डेटा का विश्लेषण किया गया था: (1) 50 विषयों में शिक्षाविदों, सबसे पूर्व-प्रचलित अनुशासन-विशिष्ट पत्रिकाओं में प्रकाशन आवृत्ति के आधार पर। (२) मनोरंजनकर्ता, जैसे अभिनेता, संगीतकार और लेखक, और प्रतिष्ठित पुरस्कारों की संख्या, नामांकन या भेद। (३) १० राष्ट्रों में राजनेता और चुनाव / पुनः चुनाव परिणाम। (4) कॉलेजिएट और पेशेवर एथलीट उपलब्ध सबसे अधिक व्यक्तिगत उपायों को देखते हैं, जैसे कि घर के रन की संख्या, टीम के खेल में स्वागत और व्यक्तिगत खेलों में कुल जीत। लेखक लिखता है, "हमने प्रत्येक अध्ययन में स्पष्ट और सुसंगत बिजली-कानून वितरण को देखा, चाहे हम डेटा का कितना भी संकीर्ण या व्यापक विश्लेषण करें ..."


4
किसने सुझाव दिया कि मानव प्रदर्शन सामान्य रूप से वितरित किया जाता है ?! परेटो (1906!) द्वारा 80-20 सिद्धांत का सुझाव दिया गया था।
abaumann
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.