मेरी पृष्ठभूमि मुख्य रूप से मशीन लर्निंग में है और मैं यह जानने की कोशिश कर रहा था कि बायेसियन हाइपोथिसिस परीक्षण का क्या मतलब है। मैं संभाव्यता की द्विअर्थी व्याख्या के साथ ठीक हूं और मैं संभाव्य चित्रमय मॉडल के संदर्भ में इससे परिचित हूं। हालांकि, जो मुझे भ्रमित कर रहा है वह है कि सांख्यिकीय अनुमान के संदर्भ में "हाइपोथीसिस" शब्द का अर्थ क्या है।
मुझे लगता है कि मैं ज्यादातर उस शब्दावली के बारे में भ्रमित हो रहा हूं जिसका उपयोग मैं मशीन लर्निंग में किया जाता हूं। आमतौर पर आंकड़ों और अनुमानों में क्या उपयोग किया जाता है।
के संदर्भ में देखरेख सीखने , मैं सामान्य रूप से भविष्य कहनेवाला समारोह है कि अपने लेबल के लिए उदाहरण के नक्शे यानी के रूप में परिकल्पना के बारे में सोच । हालाँकि, यह मुझे लगता है कि शब्द की परिकल्पना, रीडिंग में जो मैं कर रहा हूं, उसका एक ही अर्थ नहीं है। मेरे द्वारा पढ़ी जा रही रीडिंग का एक पेस्ट पेस्ट करें:
यदि आप ध्यान से पढ़ें तो यह भी कहता है:
देखा गया डेटा के लिए एक अलग मॉडल है ...
क्या वे शब्द मॉडल का उपयोग कर रहे थे। मेरे लिए शब्द मॉडल मुझे लगता है कि कार्यों के एक सेट के लिए हम एक विशिष्ट भविष्य कहनेवाला फ़ंक्शन का चयन कर रहे थे। यानी फ़ंक्शन की एक परिकल्पना कक्षा। उदाहरण के लिए, द्विघात कार्यों की परिकल्पना कक्षा हो सकती है (डिग्री 2 का बहुपद)। हालांकि, यह मुझे लगता है कि वे इस अर्क के पर्याय के रूप में मॉडल और परिकल्पना का उपयोग करते हैं (जहां मेरे लिए वे पूरी तरह से अलग शब्द हैं)।
फिर यह उल्लेख किया जाता है कि हम पादरियों को परिकल्पना के लिए रख सकते हैं (एक बायसी सेटिंग में पूरी तरह से उचित चीज):
इसके अलावा, हम वर्तमान परिकल्पना के साथ डेटा को चिह्नित कर सकते हैं:
और कुछ डेटा (और बे के नियम) दिए गए हमारे वर्तमान अपडेट को अपडेट करें:
हालांकि, मुझे लगता है कि मैं एक परिकल्पना वर्ग से एक विशेष पैरामीटर (कहना ) के लिए एक बिसियन अनुमान लगाने के लिए अधिक उपयोग किया जाता हूं बजाय पूरे परिकल्पना वर्ग के। मूल रूप से ऐसा लगता है कि ये "परिकल्पनाएं" मशीन लर्निंग के संदर्भ से समान परिकल्पना नहीं हैं, जिनका मैं उपयोग कर रहा हूं, ऐसा लगता है कि ये परिकल्पनाएं हाइपोथीसिस वर्ग की तुलना में विशिष्ट θ पैरामीटर के समान हैं ।
इस बिंदु पर मुझे यकीन था कि "परिकल्पना" का मतलब भविष्यवाणी के कार्य (पैरामीटर ) द्वारा ), उदाहरण के लिए) के समान था, लेकिन मुझे लगता है कि मैं गलत था ...
मेरे भ्रम को और भी बदतर बनाने के लिए, बाद में ये वही रीडिंग प्रत्येक प्रशिक्षण उदाहरण के लिए एक विशेष "परिकल्पना" को निर्दिष्ट करने के लिए आगे बढ़ीं जो उन्होंने देखीं। मुझे क्या मतलब है की एक पेस्ट पेस्ट:
इसका कारण यह है कि यह मुझे भ्रमित करता है, अगर मैं परिकल्पना को एक पैरामीटर के रूप में व्याख्या करता हूं, तो मेरे लिए यह प्रत्येक नमूना मूल्य के लिए एक विशिष्ट पैरामीटर निर्दिष्ट करने का कोई मतलब नहीं है जो हम देखते हैं। इस बिंदु पर मैंने निष्कर्ष निकाला कि मुझे वास्तव में नहीं पता था कि उनका अर्थ परिकल्पना से था इसलिए मैंने यह प्रश्न पोस्ट किया।
हालांकि, मैंने पूरी तरह से हार नहीं मानी, मैंने शोध किया कि लगातार आंकड़ों में परिकल्पना का क्या अर्थ है और निम्नलिखित खान अकादमी वीडियो मिला । यही कारण है कि वीडियो वास्तव में मेरे लिए भावना का एक बहुत बनाता है (हो सकता है आप एक frequentist कर रहे हैं! :) । हालांकि, ऐसा लगता है कि उन्हें डेटा का एक गुच्छा मिलता है (जैसे कुछ "नमूना सेट") और नमूना सेट के गुणों के आधार पर, वे तय करते हैं कि डेटा के बारे में अशक्त परिकल्पना को स्वीकार या अस्वीकार करना है या नहीं। हालाँकि, मैं जो बायसीयन संदर्भ में पढ़ रहा हूँ, यह मुझे लगता है कि प्रत्येक डेटा [बिंदु] वेक्टर के लिए जो मनाया जाता है, वे "संभावना अनुपात परीक्षण" के साथ एक परिकल्पना के साथ "लेबल" करते हैं:
जिस तरह से वे प्रत्येक डेटा नमूने के लिए परिकल्पना दे रहे हैं, यहां तक कि ऐसा लगता है कि एक पर्यवेक्षित सीखने की सेटिंग थी हम प्रत्येक प्रशिक्षण सेट पर एक लेबल संलग्न कर रहे हैं। हालाँकि, मुझे नहीं लगता कि वे इस संदर्भ में क्या कर रहे हैं। वे क्या कर रहे हैं? प्रत्येक डेटा नमूने के लिए एक परिकल्पना निर्दिष्ट करने का क्या मतलब है? परिकल्पना का अर्थ क्या है? मॉडल शब्द का क्या अर्थ है?
मूल रूप से, मेरे भ्रम की इस लंबी व्याख्या के बाद, क्या कोई जानता है कि इस संदर्भ में बेयसियन परिकल्पना परीक्षण का क्या अर्थ है?
यदि आपको मेरे प्रश्न को बेहतर बनाने के लिए किसी स्पष्टीकरण या किसी चीज़ की आवश्यकता है या इसलिए कि यह प्रश्न समझ में आता है, तो मैं मदद करने के लिए अधिक खुश हूँ :)
उत्तर की मेरी खोज में मुझे सांख्यिकीय परिकल्पना परीक्षण से संबंधित कुछ उपयोगी चीजें मिलीं:
यदि आप CS पृष्ठभूमि से आते हैं तो यह विषय मेरे लिए एक अच्छा परिचय देता है (मेरे जैसे):
कंप्यूटर वैज्ञानिकों के लिए सांख्यिकीय परिकल्पना परीक्षण का एक अच्छा परिचय क्या है?
कुछ बिंदु पर मैंने "डिफ़ॉल्ट मापदंडों" के बारे में पूछा (जो मुझे परिभाषित करना चाहिए था कि मेरा क्या मतलब है। मुझे लगा कि यह एक मानक शब्द है लेकिन ऐसा नहीं है, इसलिए यहां मैं इसे संबोधित करूंगा) और मुझे लगता है कि मेरा वास्तव में क्या मतलब है आप प्रत्येक परिकल्पना के लिए पैरामीटर निर्दिष्ट करते हैं जो आपके पास है। उदाहरण के लिए, आप कैसे तय करते हैं कि आपकी अशक्त परिकल्पना और उसके पैरामीटर क्या हैं। इससे संबंधित एक प्रश्न है:
परिकल्पना परीक्षण में अशक्त परिकल्पना को कैसे निर्दिष्ट करें