क्या परीक्षण स्कोर वास्तव में एक सामान्य वितरण का पालन करते हैं?


14

मैं यह जानने की कोशिश कर रहा हूं कि GLM में कौन से वितरण का उपयोग करना है, और सामान्य वितरण का उपयोग कब करना है, इस पर मैं थोड़ा हैरान हूं। मेरी पाठ्यपुस्तक के एक भाग में, यह कहता है कि एक सामान्य वितरण मॉडलिंग परीक्षा के अंकों के लिए अच्छा हो सकता है। अगले भाग में, यह पूछता है कि कार बीमा दावे को मॉडल करने के लिए क्या वितरण उचित होगा। इस बार, यह कहा गया कि उचित वितरण गामा या उलटा गौसियन होगा क्योंकि वे केवल सकारात्मक मूल्यों के साथ निरंतर हैं। खैर, मेरा मानना ​​है कि परीक्षा के अंक भी केवल सकारात्मक मूल्यों के साथ जारी रहेंगे, इसलिए हम वहां एक सामान्य वितरण का उपयोग क्यों करेंगे? क्या सामान्य वितरण नकारात्मक मूल्यों के लिए अनुमति नहीं देता है?


1
यदि आप स्कोर पर सीमा के बारे में चिंतित हैं, तो आप en.wikipedia.org/wiki/Truncated_normal_distribution
JG

6
वास्तविक दुनिया में, बेशक, परीक्षा स्कोर वितरण अक्सर एक सामान्य वितरण की तरह कुछ भी नहीं दिखता है। मेरे गणित के स्नातक दिनों से एक उदाहरण के रूप में, मुझे याद है कि टोपोलॉजी I वर्ग अपने अत्यधिक बिमोडल "डंबल कर्व" ग्रेड वितरण के लिए कुख्यात रहा है : आपने या तो प्रमुख अवधारणाओं को समझा और लगभग पूर्ण स्कोर प्राप्त किया, या आप नहीं थे और थे किसी भी अंक पाने के लिए भाग्यशाली। बहुत कम लोगों ने उन दो चरम सीमाओं के बीच में कहीं भी स्कोरिंग को समाप्त कर दिया।
इल्मरी करोनन

2
नहीं, अगला सवाल।
कार्ल विटथॉफ्ट

जवाबों:


14

उदाहरण के लिए, ऊँचाई को अक्सर सामान्य होने के रूप में चित्रित किया जाता है। हो सकता है कि पुरुषों की ऊंचाई 5 इंच 10 की तरह हो, जिसमें 2 इंच का मानक विचलन हो। हम जानते हैं कि नकारात्मक ऊँचाई अव्यवहारिक है, लेकिन इस मॉडल के तहत, एक नकारात्मक ऊँचाई के अवलोकन की संभावना अनिवार्य रूप से शून्य है। हम वैसे भी मॉडल का उपयोग करते हैं क्योंकि यह एक अच्छा पर्याप्त सन्निकटन है।

सभी मॉडल गलत हैं। सवाल यह है कि "क्या यह मॉडल अभी भी उपयोगी हो सकता है", और ऐसे उदाहरणों में जहां हम ऊंचाई और परीक्षण स्कोर जैसी चीजों की मॉडलिंग कर रहे हैं, घटना को सामान्य रूप में मॉडलिंग करना उपयोगी है, जबकि यह तकनीकी रूप से अव्यवहारिक चीजों की अनुमति देने के बावजूद उपयोगी है।


इस विशेष मामले में, यह संदिग्ध है कि क्या सामान्य वितरण भी एक उपयोगी सन्निकटन है। लगभग हर ग्रेड वितरण मैंने देखा है कुछ हद तक टिप्पणियों में उल्लेखित बिमोडल वक्र इल्मरी करोनन जैसा दिखता है। (हालांकि आमतौर पर चरम छोर पर बजाय 0.6 और 0.9 के मोड के साथ), हालांकि, अलग-अलग साधनों के साथ दो सामान्य वितरण का एक रैखिक संयोजन एक बुरा सन्निकटन नहीं होगा।
Ray

मैं यह तर्क नहीं दे रहा था कि सामान्य The BEST सन्निकटन है। मेरी टिप्पणी का पूरा बिंदु वास्तव में उस अंतिम पैराग्राफ में बनाया गया है। कम से कम अमूर्तता के इस स्तर पर वास्तविक ग्रेड वितरणों की जैव-विविधता के बारे में टिप्पणियाँ वास्तव में सहायक नहीं हैं।
डेमेट्री पैनानोस

मैं आपके उत्तर में कही गई हर बात से सहमत हूं, लेकिन सवाल का हिस्सा यह है कि क्या सामान्य वितरण विशेष रूप से मॉडलिंग ग्रेड वितरण के लिए लागू है। और उस का उत्तर आमतौर पर "नहीं" है। सभी मॉडल गलत हैं और कुछ मॉडल उपयोगी हैं, लेकिन कुछ अन्य की तुलना में अधिक गलत और कम उपयोगी हैं। तथ्य यह है कि विशेष रूप से सामान्य वितरण इस समस्या के लिए विशेष रूप से खराब फिट है, और इसका उत्तर जैसा लगता है कि यह सामान्य है कि यह केवल गलत है क्योंकि पूंछ नकारात्मक और अनंत हैं, जब वास्तव में बहुत गहरी समस्याएं हैं।
Ray

तुम यहाँ थोड़े पांडित्यपूर्ण हो रहे हो। ओपी की समस्या यह थी कि सामान्य नकारात्मक अंक की अनुमति देता है। Bimodality मुद्दा नहीं था। आप इस प्रश्न के लिए पेड़ों के लिए जंगल नहीं देख रहे हैं। मॉडलिंग विवरण अभी प्रासंगिक नहीं हैं।
डेमेट्री पैनानोस

10

क्या सामान्य वितरण नकारात्मक मूल्यों के लिए अनुमति नहीं देता है?

सही बात। इसकी कोई ऊपरी सीमा भी नहीं है।

मेरी पाठ्यपुस्तक के एक भाग में, यह कहता है कि एक सामान्य वितरण मॉडलिंग परीक्षा के अंकों के लिए अच्छा हो सकता है।

पिछले बयानों के बावजूद, कभी-कभी ऐसा होता है। यदि आपके पास परीक्षण के कई घटक हैं, तो बहुत अधिक दृढ़ता से संबंधित नहीं हैं (जैसे कि आप अनिवार्य रूप से एक ही सवाल एक दर्जन बार नहीं कर रहे हैं, न ही प्रत्येक भाग के पिछले भाग के लिए एक सही उत्तर की आवश्यकता है), और बहुत आसान या बहुत कठिन नहीं है ( ताकि अधिकांश निशान बीच के पास कहीं हों), तो निशान अक्सर एक सामान्य वितरण द्वारा यथोचित रूप से अच्छी तरह से अनुमानित हो सकते हैं; अक्सर अच्छी तरह से पर्याप्त है कि ठेठ विश्लेषण थोड़ा चिंता का कारण होना चाहिए।

हम जानते हैं कि वे सामान्य नहीं हैं , लेकिन यह स्वचालित रूप से एक समस्या नहीं है - जब तक हम जिन प्रक्रियाओं का उपयोग करते हैं उनका व्यवहार हमारे उद्देश्यों के लिए पर्याप्त होना चाहिए (जैसे मानक त्रुटियों, आत्मविश्वास अंतराल, महत्व का स्तर और शक्ति - जो भी आवश्यक हो - हम उनसे जो उम्मीद करते हैं, उसके करीब रहें)

अगले भाग में, यह पूछता है कि कार बीमा दावे को मॉडल करने के लिए क्या वितरण उचित होगा। इस बार, यह कहा गया कि उचित वितरण गामा या उलटा गौसियन होगा क्योंकि वे केवल सकारात्मक मूल्यों के साथ निरंतर हैं।

हां, लेकिन इससे अधिक - वे भारी तिरछा हो जाते हैं और माध्य बड़े होने पर परिवर्तनशीलता बढ़ जाती है।

यहाँ वाहन के दावों के लिए दावा-आकार वितरण का एक उदाहरण दिया गया है:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(चित्र 5, गैरिडो, जेनेस्ट एंड शुल्ज़ (2016) से "सामान्य फ़्रीज़्ड मॉडल्स पर निर्भर आवृत्ति और बीमा दावों की गंभीरता के लिए", बीमा: गणित और अर्थशास्त्र, खंड 70, सितंबर, p205-215। https: //www.adciencedirectirect । com / विज्ञान / लेख / pii / S0167668715303358 )

यह एक विशिष्ट दाहिनी-तिरछी और भारी दाहिनी पूंछ दिखाता है। हालाँकि हमें बहुत सावधान रहना चाहिए क्योंकि यह एक सीमांत वितरण है, और हम सशर्त वितरण के लिए एक मॉडल लिख रहे हैं , जो आम तौर पर बहुत कम तिरछा होगा (सीमांत वितरण हम देखते हैं कि क्या हम सिर्फ दावे के मिश्रण का हिस्टोग्राम करते हैं इन सशर्त वितरण के)। फिर भी यह आम तौर पर ऐसा होता है कि अगर हम भविष्यवक्ताओं के उपसमूहों (शायद निरंतर चर को वर्गीकृत करते हुए) में दावे के आकार को देखते हैं कि वितरण अभी भी सही ढंग से तिरछा है और दाईं ओर काफी भारी पूंछ है, यह सुझाव देता है कि एक गेम मॉडल की तरह कुछ है * एक गाऊसी मॉडल की तुलना में बहुत अधिक उपयुक्त होने की संभावना है।

* किसी भी अन्य वितरण की संख्या हो सकती है जो एक गाऊसी की तुलना में अधिक उपयुक्त होगी - उलटा गौसियन एक और विकल्प है - हालांकि कम आम; Lognormal या Weibull मॉडल, जबकि GLMs नहीं हैं क्योंकि वे खड़े हैं, काफी उपयोगी भी हो सकते हैं।

[यह शायद ही कभी होता है कि इनमें से कोई भी वितरण निकट-पूर्ण विवरण हैं; वे अस्पष्ट अनुमान हैं, लेकिन कई मामलों में पर्याप्त रूप से अच्छा है कि विश्लेषण उपयोगी है और वांछित गुणों के करीब है।]

खैर, मेरा मानना ​​है कि परीक्षा के अंक भी केवल सकारात्मक मूल्यों के साथ जारी रहेंगे, इसलिए हम वहां एक सामान्य वितरण का उपयोग क्यों करेंगे?

क्योंकि (जिन स्थितियों के तहत मैंने पहले उल्लेख किया था - बहुत सारे घटक, बहुत अधिक निर्भर नहीं, कठिन या आसान नहीं) वितरण सममित, अनिमॉडल के काफी करीब होता है, न कि भारी-पूंछ वाला।


0

परीक्षा के अंकों को द्विपद वितरण द्वारा बेहतर ढंग से तैयार किया जा सकता है। अत्यधिक सरलीकृत मामले में, आपके पास प्रत्येक 1 अंक के 100 सच्चे / झूठे प्रश्न हो सकते हैं, इसलिए स्कोर 0 से 100 के बीच का पूर्णांक होगा। यदि आप परीक्षार्थी की समस्या से लेकर समस्या तक की समस्या के बीच कोई संबंध नहीं मानते हैं (हालांकि संदिग्ध है) ), स्कोर स्वतंत्र यादृच्छिक चर का एक योग है, और केंद्रीय सीमा प्रमेय लागू होता है। जैसे-जैसे प्रश्नों की संख्या बढ़ती है, सही समस्याओं का अंश एक सामान्य वितरण में परिवर्तित हो जाता है।

आप 0. से कम मूल्यों के बारे में एक अच्छा सवाल पूछते हैं। आप 100% से अधिक के मूल्यों के बारे में भी यही सवाल पूछ सकते हैं। जैसे-जैसे परीक्षण प्रश्नों की संख्या बढ़ती है, राशि का विचलन कम होता जाता है, इसलिए शिखर क्षुद्र की ओर खिंच जाता है। इसी तरह, सबसे अच्छा फिट सामान्य वितरण में लघु विचरण होगा और [0, 1] अंतराल के बाहर पीडीएफ का वजन 0 की ओर जाता है, हालांकि यह हमेशा नॉनजरो होगा। "भिन्न सही" के संभावित मानों के बीच की जगह भी घट जाएगी (100 प्रश्नों के लिए 1/100, 1000 प्रश्नों के लिए 1/1000, आदि), इसलिए अनौपचारिक रूप से, पीडीएफ एक सतत पीडीएफ की तरह अधिक से अधिक व्यवहार करना शुरू कर देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.