क्या सामान्य वितरण नकारात्मक मूल्यों के लिए अनुमति नहीं देता है?
सही बात। इसकी कोई ऊपरी सीमा भी नहीं है।
मेरी पाठ्यपुस्तक के एक भाग में, यह कहता है कि एक सामान्य वितरण मॉडलिंग परीक्षा के अंकों के लिए अच्छा हो सकता है।
पिछले बयानों के बावजूद, कभी-कभी ऐसा होता है। यदि आपके पास परीक्षण के कई घटक हैं, तो बहुत अधिक दृढ़ता से संबंधित नहीं हैं (जैसे कि आप अनिवार्य रूप से एक ही सवाल एक दर्जन बार नहीं कर रहे हैं, न ही प्रत्येक भाग के पिछले भाग के लिए एक सही उत्तर की आवश्यकता है), और बहुत आसान या बहुत कठिन नहीं है ( ताकि अधिकांश निशान बीच के पास कहीं हों), तो निशान अक्सर एक सामान्य वितरण द्वारा यथोचित रूप से अच्छी तरह से अनुमानित हो सकते हैं; अक्सर अच्छी तरह से पर्याप्त है कि ठेठ विश्लेषण थोड़ा चिंता का कारण होना चाहिए।
हम जानते हैं कि वे सामान्य नहीं हैं , लेकिन यह स्वचालित रूप से एक समस्या नहीं है - जब तक हम जिन प्रक्रियाओं का उपयोग करते हैं उनका व्यवहार हमारे उद्देश्यों के लिए पर्याप्त होना चाहिए (जैसे मानक त्रुटियों, आत्मविश्वास अंतराल, महत्व का स्तर और शक्ति - जो भी आवश्यक हो - हम उनसे जो उम्मीद करते हैं, उसके करीब रहें)
अगले भाग में, यह पूछता है कि कार बीमा दावे को मॉडल करने के लिए क्या वितरण उचित होगा। इस बार, यह कहा गया कि उचित वितरण गामा या उलटा गौसियन होगा क्योंकि वे केवल सकारात्मक मूल्यों के साथ निरंतर हैं।
हां, लेकिन इससे अधिक - वे भारी तिरछा हो जाते हैं और माध्य बड़े होने पर परिवर्तनशीलता बढ़ जाती है।
यहाँ वाहन के दावों के लिए दावा-आकार वितरण का एक उदाहरण दिया गया है:
https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg
(चित्र 5, गैरिडो, जेनेस्ट एंड शुल्ज़ (2016) से "सामान्य फ़्रीज़्ड मॉडल्स पर निर्भर आवृत्ति और बीमा दावों की गंभीरता के लिए", बीमा: गणित और अर्थशास्त्र, खंड 70, सितंबर, p205-215। https: //www.adciencedirectirect । com / विज्ञान / लेख / pii / S0167668715303358 )
यह एक विशिष्ट दाहिनी-तिरछी और भारी दाहिनी पूंछ दिखाता है। हालाँकि हमें बहुत सावधान रहना चाहिए क्योंकि यह एक सीमांत वितरण है, और हम सशर्त वितरण के लिए एक मॉडल लिख रहे हैं , जो आम तौर पर बहुत कम तिरछा होगा (सीमांत वितरण हम देखते हैं कि क्या हम सिर्फ दावे के मिश्रण का हिस्टोग्राम करते हैं इन सशर्त वितरण के)। फिर भी यह आम तौर पर ऐसा होता है कि अगर हम भविष्यवक्ताओं के उपसमूहों (शायद निरंतर चर को वर्गीकृत करते हुए) में दावे के आकार को देखते हैं कि वितरण अभी भी सही ढंग से तिरछा है और दाईं ओर काफी भारी पूंछ है, यह सुझाव देता है कि एक गेम मॉडल की तरह कुछ है * एक गाऊसी मॉडल की तुलना में बहुत अधिक उपयुक्त होने की संभावना है।
* किसी भी अन्य वितरण की संख्या हो सकती है जो एक गाऊसी की तुलना में अधिक उपयुक्त होगी - उलटा गौसियन एक और विकल्प है - हालांकि कम आम; Lognormal या Weibull मॉडल, जबकि GLMs नहीं हैं क्योंकि वे खड़े हैं, काफी उपयोगी भी हो सकते हैं।
[यह शायद ही कभी होता है कि इनमें से कोई भी वितरण निकट-पूर्ण विवरण हैं; वे अस्पष्ट अनुमान हैं, लेकिन कई मामलों में पर्याप्त रूप से अच्छा है कि विश्लेषण उपयोगी है और वांछित गुणों के करीब है।]
खैर, मेरा मानना है कि परीक्षा के अंक भी केवल सकारात्मक मूल्यों के साथ जारी रहेंगे, इसलिए हम वहां एक सामान्य वितरण का उपयोग क्यों करेंगे?
क्योंकि (जिन स्थितियों के तहत मैंने पहले उल्लेख किया था - बहुत सारे घटक, बहुत अधिक निर्भर नहीं, कठिन या आसान नहीं) वितरण सममित, अनिमॉडल के काफी करीब होता है, न कि भारी-पूंछ वाला।