(यह देखने के लिए कि मैंने यह क्यों लिखा है, इस प्रश्न के उत्तर के नीचे टिप्पणियों की जाँच करें ।)
III त्रुटियां और सांख्यिकीय निर्णय सिद्धांत टाइप करें
गलत प्रश्न का सही उत्तर देने को कभी-कभी टाइप III त्रुटि कहा जाता है। सांख्यिकीय निर्णय सिद्धांत अनिश्चितता के तहत निर्णय लेने का एक औपचारिककरण है; यह एक वैचारिक ढांचा प्रदान करता है जो टाइप III त्रुटियों से बचने में मदद कर सकता है। ढांचे के प्रमुख तत्व को नुकसान फ़ंक्शन कहा जाता है । यह दो तर्क लेता है: पहला है (प्रासंगिक उपसमुच्चय) दुनिया की सच्ची स्थिति (उदाहरण के लिए, पैरामीटर अनुमान समस्याओं में, वास्तविक पैरामीटर मान ); दूसरा संभावित क्रियाओं के सेट में एक तत्व है (जैसे, पैरामीटर प्राक्कलन समस्याओं में, एस्टीमेटθ )। आउटपुट दुनिया के हर संभव सच्चे राज्य के संबंध में हर संभव कार्रवाई से जुड़े नुकसान को दर्शाता है। उदाहरण के लिए, पैरामीटर अनुमान समस्याओं में, कुछ प्रसिद्ध नुकसान कार्य हैं:
- पूर्ण त्रुटि हानि
- चुकता त्रुटि हानि
- हैल वैरियन के लिनेक्स लॉस
प्रश्न खोजने के लिए उत्तर की जांच करना
ऐसा मामला है कि कोई व्यक्ति तृतीय प्रकार की त्रुटियां करने से बचने के लिए एक सही नुकसान फ़ंक्शन तैयार करने पर ध्यान केंद्रित करके और बाकी निर्णय-सिद्धांत दृष्टिकोण (यहां विस्तृत नहीं) के माध्यम से आगे बढ़ने का प्रयास कर सकता है। यह मेरा संक्षेप नहीं है - आखिरकार, सांख्यिकीविद कई तकनीकों और विधियों से अच्छी तरह से सुसज्जित हैं जो अच्छी तरह से काम करते हैं, भले ही वे इस तरह के दृष्टिकोण से उत्पन्न न हों। लेकिन अंतिम परिणाम, यह मुझे लगता है, यह है कि अधिकांश सांख्यिकीय विशेषज्ञ नहीं जानते हैं और सांख्यिकीय निर्णय सिद्धांत के बारे में परवाह नहीं करते हैं, और मुझे लगता है कि वे गायब हैं। उन सांख्यिकीविदों से, मैं तर्क करूंगा कि टाइप III त्रुटि से बचने के संदर्भ में वे सांख्यिकीय निर्णय सिद्धांत को मूल्यवान मान सकते हैं क्योंकि यह एक रूपरेखा प्रदान करता है जिसमें किसी भी प्रस्तावित डेटा विश्लेषण प्रक्रिया के बारे में पूछना है:क्या हानि कार्य (यदि कोई है) प्रक्रिया आशा के साथ सामना करती है? अर्थात्, निर्णय लेने की स्थिति में, वास्तव में, क्या यह सबसे अच्छा उत्तर प्रदान करता है?
प्रत्याशित हानि
एक बायेसियन परिप्रेक्ष्य से, नुकसान फ़ंक्शन हम सभी की जरूरत है। हम काफी निर्णय सिद्धांत के बाकी को छोड़ सकते हैं - लगभग परिभाषा के द्वारा, तो सबसे अच्छा होगा कम से कम पीछे नुकसान की उम्मीद है, यह है कि, कार्रवाई को खोजने के है कि कम करता \ टिल्ड {एल} (क) = \ पूर्णांक _ {\ थीटा} L (\ theta, a) p (\ थीटा | D) d \ थीटा ।~ एल ( एक ) = ∫ Θ एल ( θ , एक ) पी ( θ | डी ) घ θ
(और गैर-बायेसियन दृष्टिकोणों के लिए, खैर, यह लगातार निर्णय सिद्धांत का एक प्रमेय है - विशेष रूप से, वाल्ड की पूर्ण कक्षा की प्रमेय - कि इष्टतम कार्रवाई हमेशा कुछ के संबंध में बेएज़ियन पश्चगामी हानि को कम करने के लिए होगी (संभवतः अनुचित) पूर्व। इस परिणाम के साथ कठिनाई यह है कि यह एक अस्तित्व प्रमेय है जिसका उपयोग करने से पहले कोई मार्गदर्शन नहीं दिया जाता है। लेकिन यह पूरी तरह से प्रक्रियाओं के वर्ग को प्रतिबंधित करता है कि हम "इनवर्ट" कर सकते हैं यह जानने के लिए कि यह कौन सा प्रश्न है। जवाब देना। विशेष रूप से, किसी भी गैर-बायेसियन प्रक्रिया को निकालने का पहला कदम यह पता लगाना है कि (यदि कोई हो) बायेसियन प्रक्रिया इसकी प्रतिकृति या अनुमान लगाती है।)
हे सियान, तुम्हें पता है कि यह एक क्यू एंड ए साइट है, है ना?
जो मुझे एक सांख्यिकीय प्रश्न के लिए आखिरकार - लाता है। बायेसियन आँकड़ों में, जब असमान मापदंडों के लिए अंतराल अनुमान प्रदान करते हैं, तो दो सामान्य विश्वसनीय अंतराल प्रक्रियाएँ क्वांटाइल-आधारित विश्वसनीय अंतराल और उच्चतम पोस्टीरियर घनत्व विश्वसनीय अंतराल हैं। इन प्रक्रियाओं के पीछे नुकसान के कार्य क्या हैं?