परिकल्पना परीक्षण एक वर्गीकरण समस्या के समान है। तो कहते हैं, हमारे पास अवलोकन (विषय) के लिए 2 संभावित लेबल हैं - दोषी बनाम गैर-दोषी। बता दें कि नॉन-गिल्टी अशक्त परिकल्पना है। यदि हम एक वर्गीकरण दृष्टिकोण से समस्या को देखते हैं तो हम एक क्लासिफायर ट्रेन करेंगे जो डेटा को देखते हुए प्रत्येक 2 वर्गों में संबंधित विषय की संभावना की भविष्यवाणी करेगा। हम तब कक्षा को उच्चतम संभावना के साथ चुनेंगे। उस स्थिति में 0.5 संभावना प्राकृतिक सीमा होगी। यदि हमने झूठी सकारात्मक बनाम गलत नकारात्मक त्रुटियों के लिए अलग-अलग लागत सौंपी है, तो हम सीमा को अलग-अलग कर सकते हैं। लेकिन शायद ही हम 0.05 पर थ्रेशोल्ड सेट करने के लिए इतने चरम पर जाएं, अर्थात सब्जेक्ट को "दोषी" तभी असाइन करें, जब संभावना 0.95 या इससे अधिक हो। लेकिन अगर मैं अच्छी तरह से समझता हूं, जब हम एक ही समस्या को हाइपोथीसिस परीक्षण की समस्या के रूप में देखते हैं तो हम एक मानक अभ्यास के रूप में कर रहे हैं। इस बाद के मामले में, हम "गैर-दोषी" लेबल को असाइन नहीं करेंगे - लेबल "दोषी" को असाइन करने के लिए असमान - केवल अगर "गैर-दोषी" होने की संभावना 5% से कम है। और शायद यह समझ में आता है अगर हम सही मायने में निर्दोष लोगों को दोषी ठहराना चाहते हैं। लेकिन यह नियम सभी डोमेन और सभी मामलों में क्यों लागू होना चाहिए?
यह निर्णय लेना कि कौन सी परिकल्पना को अपनाना डेटा दिए गए सत्य के अनुमानक को परिभाषित करने के बराबर है। अधिकतम संभावना अनुमान में हम उस परिकल्पना को स्वीकार करते हैं जिसमें अधिक संभावना है कि डेटा दिया गया है - जरूरी नहीं कि अत्यधिक संभावना हो। नीचे दिया गया ग्राफ देखें:
एक अधिकतम संभावना दृष्टिकोण का उपयोग करते हुए हम इस उदाहरण में वैकल्पिक परिकल्पना का पक्ष लेंगे यदि प्रिडिक्टर का मान 3, 4, 4 से ऊपर था, हालांकि इस मूल्य की संभावना शून्य परिकल्पना से ली गई है, जो 0.05 से बड़ा होगा।
और जिस उदाहरण के साथ मैंने पोस्ट शुरू किया है वह शायद भावनात्मक रूप से आरोपित है, हम अन्य मामलों के बारे में सोच सकते हैं, उदाहरण के लिए तकनीकी सुधार। जब हम डेटा हमें यह बताते हैं कि नया समाधान एक संभावना है, तो संभावना यह है कि ऐसा नहीं है, इसलिए हमें इस स्थिति का लाभ क्यों देना चाहिए?