कुछ मामलों में यह स्पष्ट लगता है कि सिद्धांत सबसे अच्छा काम कर सकता है (चूहों की पूंछ की लंबाई संभवतः सामान्य रूप से वितरित की जाती है)।
पूंछ की लंबाई निश्चित रूप से सामान्य रूप से वितरित नहीं होती है।
सामान्य वितरण में नकारात्मक मूल्यों को लेने की एक गैर-जिम्मेदार संभावना है; पूंछ की लंबाई नहीं है।
जॉर्ज बॉक्स की प्रसिद्ध लाइन , " सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं " बिंदु को अच्छी तरह से बनाता है। ऐसे मामले जहां हम यथोचित रूप से सामान्यता का दावा कर सकते हैं (केवल अनुमानित सामान्यता के बजाय) वास्तव में बहुत दुर्लभ हैं, किंवदंती के लगभग जीव, आंख के कोने से कभी-कभी लगभग झलकते हैं।
बहुत सारे मामलों में डेटा के एक सेट का वर्णन करने के लिए शायद कोई सिद्धांत नहीं है, इसलिए आप बस कुछ का उपयोग करते हैं जो आपके पास काफी अच्छी तरह से फिट बैठता है चाहे वह मूल रूप से वर्णन करने के लिए विकसित किया गया हो?
उन मामलों में जहां आपकी रुचि के अनुसार विशेष रूप से पसंद के प्रति संवेदनशील नहीं हैं (जब तक कि वितरण की व्यापक विशेषताएं क्या ज्ञात हैं के अनुरूप हैं), तो हाँ, आप बस कुछ का उपयोग कर सकते हैं जो काफी अच्छी तरह से फिट बैठता है।
ऐसे मामलों में जहां संवेदनशीलता की एक बड़ी डिग्री होती है, 'बस कुछ फिट बैठता है' का उपयोग करना अपने आप में पर्याप्त नहीं है। हम कुछ दृष्टिकोणों का उपयोग कर सकते हैं जो विशेष धारणाएं नहीं बनाते हैं (शायद वितरण मुक्त प्रक्रियाएं, जैसे क्रमपरिवर्तन, बूटस्ट्रैपिंग या अन्य पुनःसमर्पण दृष्टिकोण, या मजबूत प्रक्रियाएं)। वैकल्पिक रूप से हम वितरण की धारणा के प्रति संवेदनशीलता का मूल्यांकन कर सकते हैं, जैसे कि सिमुलेशन के माध्यम से (वास्तव में मुझे लगता है कि यह आम तौर पर एक अच्छा विचार है)।
यह समस्या प्रतीत होती है कि शायद आपको अनुभवजन्य वितरण का उपयोग करना चाहिए यदि आपको वास्तव में कोई पता नहीं है।
मैं यह वर्णन नहीं करूंगा कि समस्या के रूप में - अनुभवजन्य वितरण पर आधारभूत अनुमान निश्चित रूप से एक वैध दृष्टिकोण है जो कई प्रकार की समस्याओं के लिए उपयुक्त है (क्रमचय / यादृच्छिकता और बूटस्ट्रैपिंग दो उदाहरण हैं)।
क्या किसी के पास इस समस्या के बारे में सोचने / सोचने का एक सुसंगत तरीका है?
मोटे तौर पर, बहुत सारे मामलों में, मैं जैसे सवालों पर विचार करता हूं:
1) इस फॉर्म के डेटा के लिए मैं क्या समझ रहा हूं कि कैसे (या अन्य स्थान-प्रकार मात्रा) का व्यवहार होता है?
* (सिद्धांत से, या डेटा के इस रूप का अनुभव, या विशेषज्ञ की सलाह, या यदि आवश्यक हो, तो डेटा से ही, हालांकि समस्याओं का सामना करना पड़ता है)
2) प्रसार (विचरण, आईक्यूआर, आदि) के बारे में क्या - यह कैसे व्यवहार करता है?
3) अन्य वितरण संबंधी विशेषताओं (सीमा, तिरछापन, असंगति, आदि) के बारे में क्या
4) निर्भरता के बारे में, आबादी की विषमता, कभी-कभी बहुत ही असंगत मूल्यों की प्रवृत्ति आदि
इस तरह का विचार एक सामान्य मॉडल, एक जीएलएम, कुछ अन्य मॉडल या कुछ मजबूत या वितरण-मुक्त दृष्टिकोण (जैसे बूटस्ट्रैपिंग या क्रमोन्नति / यादृच्छिककरण दृष्टिकोण, रैंक-आधारित प्रक्रियाओं सहित) के बीच एक विकल्प का मार्गदर्शन कर सकता है।