वे यहाँ एक गामा वितरण क्यों चुनेंगे?


14

मेरे पाठ्यक्रम के लिए एक अभ्यास में, हम एक कागले चिकित्सा डेटासेट का उपयोग कर रहे हैं ।

व्यायाम कहता है:

हम अलग-अलग शुल्कों के वितरण को मॉडल करना चाहते हैं और हम वास्तव में उस वितरण के बारे में अपनी अनिश्चितता को पकड़ने में सक्षम होना चाहते हैं ताकि हम उन मूल्यों की सीमा को बेहतर ढंग से पकड़ सकें जो हम देख सकते हैं। डेटा लोड हो रहा है और प्रारंभिक दृश्य कर रहा है:

भूखंड

हम ऊपर से संदेह कर सकते हैं कि यहां खेलने के समय कुछ प्रकार के घातीय-समान वितरण हैं। ... बीमा दावा शुल्क संभवतः बहुविध हो सकता है। गामा वितरण लागू हो सकता है और हम यह उन शुल्कों के वितरण के लिए परीक्षण कर सकते हैं जो पहले बीमा दावे नहीं थे।

मैं ऊपर देखा "गामा वितरण" और "एक सतत, केवल सकारात्मक, unimodal वितरण« अल्फा »के लिए आवश्यक है कि encodes समय« बीटा »के माध्य आगमन समय के साथ एक प्वासों प्रक्रिया में होने की घटनाओं" पाया

यहाँ कोई समय शामिल नहीं है, बस असंबंधित शुल्क, बीमा या नहीं।

वे एक गामा वितरण क्यों चुनेंगे?

जवाबों:


27

जब आप डेटा के सशर्त वितरण के लिए सरल पैरामीट्रिक मॉडल पर विचार कर रहे हैं (यानी प्रत्येक समूह का वितरण, या भविष्यवक्ता चर के प्रत्येक संयोजन के लिए अपेक्षित वितरण), और आप एक सकारात्मक निरंतर वितरण के साथ काम कर रहे हैं , तो दो सामान्य विकल्प गामा हैं और लॉग-सामान्य । वितरण के डोमेन के विनिर्देश (शून्य से अधिक वास्तविक संख्या) को संतुष्ट करने के अलावा, ये वितरण कम्प्यूटेशनल रूप से सुविधाजनक हैं और अक्सर यंत्रवत अर्थ बनाते हैं।

  • लॉग-सामान्य वितरण आसानी से एक सामान्य वितरण exponentiating से ली गई है (इसके विपरीत, लॉग-बदलने लॉग-सामान्य भटक सामान्य भटक देता है)। यंत्रवत दृष्टिकोण से, लॉग-नॉर्मल सेंट्रल लिमिट प्रमेय के माध्यम से उत्पन्न होता है जब प्रत्येक अवलोकन बड़ी संख्या में iid यादृच्छिक चर के उत्पाद को दर्शाता है । एक बार जब आप डेटा को लॉग-ट्रांसफ़ॉर्म कर लेते हैं, तो आपके पास कम्प्यूटेशनल और एनालिटिकल टूल की एक विशाल विविधता (जैसे, नॉर्मलिटी ग्रहण करने वाली कोई चीज़ या कम से कम-स्क्वेअर विधियों का उपयोग) तक पहुंच होती है।
  • जैसा कि आपका प्रश्न बताता है, एक तरीका है कि एक गामा वितरण उठता है जब तक प्रतीक्षा समय का वितरण होता है जब तक कि एक निरंतर प्रतीक्षा समय साथ स्वतंत्र घटनाएं नहीं होती हैं। मैं आसानी से बीमा दावों के गामा वितरण के एक यंत्रवत मॉडल के लिए एक संदर्भ नहीं पा सकता हूं , लेकिन यह एक अभूतपूर्व (यानी, डेटा विवरण / कम्प्यूटेशनल सुविधा) दृष्टिकोण से गामा वितरण का उपयोग करने के लिए भी समझ में आता है । गामा वितरण घातीय परिवार का हिस्सा है (जिसमें नॉर्मल नहीं बल्कि लॉग-नॉर्मल भी शामिल है), जिसका अर्थ है कि सामान्यीकृत लीनियर मॉडल की सभी मशीनरीnλउपलब्ध है; यह विश्लेषण के लिए एक विशेष रूप से सुविधाजनक रूप भी है।

ऐसे अन्य कारण हैं जो एक या दूसरे को उठा सकते हैं - उदाहरण के लिए, वितरण की पूंछ का "भारीपन" , जो चरम घटनाओं की आवृत्ति की भविष्यवाणी करने में महत्वपूर्ण हो सकता है। अन्य सकारात्मक, निरंतर वितरण (जैसे इस सूची को देखें ) के बहुत सारे हैं , लेकिन उनका उपयोग अधिक विशिष्ट अनुप्रयोगों में किया जाता है।

इन वितरणों में से बहुत से आप ऊपर के सीमांत वितरणों में आपके द्वारा देखी जाने वाली बहु-मॉडेलिटी पर कब्जा कर लेंगे, लेकिन देखे गए श्रेणीबद्ध भविष्यवक्ताओं द्वारा वर्णित श्रेणियों में वर्गीकृत किए जा रहे डेटा द्वारा बहु-मॉडर्लिटी को समझाया जा सकता है। यदि कोई अवलोकन योग्य भविष्यवक्ता नहीं हैं जो कि बहुउद्देशीयता की व्याख्या करते हैं, तो कोई व्यक्ति सकारात्मक छोटे वितरणों की संख्या (छोटे, असतत) के मिश्रण के आधार पर एक परिमित मिश्रण मॉडल को चुन सकता है ।


1
यह भी ध्यान देने योग्य है कि गामा और लॉगऑनॉर्मल मॉडल लगभग हमेशा समान परिणाम देते हैं
कार्लो

2
मैं स्वास्थ्य सेवा अनुसंधान में काम करता हूं। मैं इस बात की पुष्टि कर सकता हूं कि सामान्य तौर पर, स्वास्थ्य व्यय या दावा राशि के एक मॉडल के लिए एक गामा या तार्किक वितरण एक उपयुक्त विकल्प होगा। गामा वितरण का उपयोग ईवेंट मॉडल में समय पर किया जा सकता है, लेकिन वे यहां लागू नहीं होते हैं।
वीवन एनजी

धन्यवाद!! यह बहुत मददगार था।
विकी बी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.