अपने शोध में मैंने निम्नलिखित सामान्य समस्या में भाग लिया है: मेरे पास दो वितरण और एक ही डोमेन पर हैं, और उन वितरणों से नमूनों की एक बड़ी (लेकिन परिमित) संख्या है। नमूने स्वतंत्र रूप से और जानबूझकर इन दो वितरणों में से एक से वितरित किए जाते हैं (हालांकि वितरण संबंधित हो सकते हैं: उदाहरण के लिए, और कुछ अन्य वितरण का मिश्रण हो सकता है ।) शून्य परिकल्पना यह है कि नमूने से आते हैं , वैकल्पिक परिकल्पना है। नमूने से आते हैं ।क्यू क्यू पी पी क्यू
मैं वितरण और जानते हुए, नमूने के परीक्षण में टाइप I और टाइप II त्रुटियों को चिह्नित करने की कोशिश कर रहा हूं । विशेष रूप से, मुझे और के ज्ञान के अलावा, एक और दी गई एक त्रुटि को बांधने में दिलचस्पी है ।क्यू पी क्यू
मैंने गणित पर एक प्रश्न पूछा है। और बीच कुल भिन्नता के संबंध के बारे में परिकल्पना परीक्षण के लिए, और मुझे उत्तर मिला कि मैंने स्वीकार कर लिया है। यह उत्तर समझ में आता है, लेकिन मैं अभी भी अपने मन को कुल भिन्नता दूरी और परिकल्पना परीक्षण के संबंध के पीछे गहरे अर्थ में लपेट नहीं पा रहा हूं क्योंकि यह मेरी समस्या से संबंधित है। इस प्रकार, मैंने इस मंच की ओर मुड़ने का फैसला किया।क्यू
मेरा पहला प्रश्न है: क्या कुल भिन्नता टाइप I और टाइप II त्रुटियों की संभावनाओं के योग पर आधारित है जो किसी एक परिकल्पना परीक्षण विधि से स्वतंत्र है? संक्षेप में, जब तक कि एक गैर-शून्य संभावना है कि नमूना वितरण में से किसी एक के द्वारा उत्पन्न किया जा सकता है, तो त्रुटियों में से कम से कम एक की संभावना गैर-शून्य होनी चाहिए। मूल रूप से, आप इस संभावना से बच नहीं सकते हैं कि आपका परिकल्पना परीक्षक एक गलती करेगा, चाहे आप कितना भी सिग्नल प्रोसेसिंग करें। और कुल भिन्नता सटीक संभावना को बांधती है। क्या मेरी समझ सही है?
टाइप I और II त्रुटियों के बीच एक और संबंध भी है और अंतर्निहित संभावना वितरण और : KL विचलन । इस प्रकार, मेरा दूसरा प्रश्न यह है: क्या केएल-डाइवर्जेंस केवल एक विशिष्ट परिकल्पना परीक्षण पद्धति पर लागू होता है (यह लॉग-लाइबिलिटी अनुपात विधि के आसपास बहुत ऊपर आता है) या क्या यह आमतौर पर सभी परिकल्पना परीक्षण विधियों में लागू हो सकता है? यदि यह सभी परिकल्पना परीक्षण विधियों पर लागू होता है, तो ऐसा क्यों लगता है कि यह कुल भिन्नता से बहुत भिन्न है? क्या यह अलग तरह से व्यवहार करता है?क्यू
और मेरा अंतर्निहित प्रश्न यह है: क्या परिस्थितियों का एक निर्धारित सेट है जब मुझे या तो बाध्य होना चाहिए, या क्या यह विशुद्ध रूप से सुविधा की बात है? जब परिणाम एक बाध्य पकड़ दूसरे का उपयोग करके प्राप्त किया जाना चाहिए?
अगर ये सवाल तुच्छ हैं, तो मैं माफी चाहता हूं। मैं एक कंप्यूटर वैज्ञानिक हूं (इसलिए यह मेरे लिए एक फैंसी पैटर्न मिलान समस्या की तरह लगता है :)।) मैं सूचना सिद्धांत को यथोचित रूप से जानता हूं, और संभावना सिद्धांत में स्नातक पृष्ठभूमि भी है। हालाँकि, मैं अभी इस सभी परिकल्पना परीक्षण सामग्री को सीखना शुरू कर रहा हूं। जरूरत पड़ने पर मैं अपने सवालों को स्पष्ट करने की पूरी कोशिश करूंगा।