जैकनाइफ बनाम एलओओसीवी


15

क्या वास्तव में जैकनाइफ के बीच कोई अंतर है और एक को पार करने की वैधता को छोड़ दें? प्रक्रिया समान लगती है क्या मुझे कुछ याद आ रहा है?

जवाबों:


11

क्रॉस-वैलिडेशन में आप लेफ्ट-आउट नमूना (ओं) पर एक आंकड़े की गणना करते हैं। सबसे अधिक बार, आप रखे गए नमूनों पर निर्मित मॉडल द्वारा बाएं-बाहर के नमूने की भविष्यवाणी करते हैं। जैकक्निफिंग में, आप केवल रखे गए नमूनों में से एक आंकड़े की गणना करते हैं।


4
मुझे समझ में नहीं आता है कि मूल प्रश्न में यह उत्तर LOOCV से कैसे बोलता है। किस अर्थ में एक एकल बाएं अवलोकन पर एक "आँकड़ा की गणना" कर सकता है ?
एलेक्सिस

12

जैकनाइफ़ अक्सर 2 संबंधित लेकिन अलग-अलग प्रक्रियाओं को संदर्भित करता है, जो दोनों एक-एक-आउट दृष्टिकोण पर भरोसा करते हैं - जिससे यह बहुत भ्रम हो जाता है।

एक संदर्भ में, जैकनेफ का उपयोग जनसंख्या मापदंडों और उनके मानकों की त्रुटियों का अनुमान लगाने के लिए किया जा सकता है। उदाहरण के लिए, एक साधारण प्रतिगमन मॉडल की ढलान और अवरोधन का अनुमान लगाने के लिए एक जैकनाइफ दृष्टिकोण का उपयोग करना होगा:

  1. सभी उपलब्ध डेटा का उपयोग करके ढलान और अवरोधन का अनुमान लगाएं।
  2. 1 अवलोकन छोड़ें और ढलान और अवरोधन का अनुमान लगाएं (यह गुणांक के "आंशिक अनुमान" के रूप में भी जाना जाता है)।
  3. "आंशिक अनुमान" और ढलान और अवरोधन के "सभी डेटा" अनुमान के बीच अंतर की गणना करें (गुणांक के "छद्म मूल्य" के रूप में भी जानते हैं)।
  4. संपूर्ण डेटा सेट के लिए चरण 2 और 3 दोहराएं।
  5. प्रत्येक गुणांक के लिए छद्म मूल्यों के अर्थ की गणना करें - ये ढलान और अवरोधन के कटहल अनुमान हैं

छद्म मूल्यों और गुणांकों के कटहल अनुमानों का उपयोग मानक त्रुटियों और इस प्रकार विश्वास अंतराल को निर्धारित करने के लिए भी किया जा सकता है। आमतौर पर यह दृष्टिकोण गुणांक के लिए व्यापक आत्मविश्वास अंतराल देता है क्योंकि यह एक बेहतर, अधिक रूढ़िवादी, अनिश्चितता का माप है। इसके अलावा, इस दृष्टिकोण का उपयोग गुणांक के लिए पूर्वाग्रह का एक जैकनाइफ अनुमान प्राप्त करने के लिए भी किया जा सकता है।

अन्य संदर्भ में, मॉडल प्रदर्शन का मूल्यांकन करने के लिए जैकनाइफ का उपयोग किया जाता है। इस मामले में कटहल = छुट्टी-एक-आउट क्रॉस सत्यापन। दोनों अंशांकन डेटा सेट में से एक अवलोकन को छोड़ने, मॉडल को पुन: व्यवस्थित करने और उस अवलोकन का अनुमान लगाने का संदर्भ देते हैं जिसे छोड़ दिया गया था। अनिवार्य रूप से, प्रत्येक अवलोकन का अनुमान लगाया जा रहा है जो कि पूर्वानुमानकर्ताओं के "आंशिक अनुमान" का उपयोग कर रहा है।

यहाँ jackknife के बारे में एक अच्छा सा लिखा है जो मुझे ऑनलाइन मिला: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf


1
जब तक मैं गलत नहीं हूं (और मैं अच्छी तरह से हो सकता हूं), आपका पहला संदर्भ छुट्टी-एक-आउट क्रॉस सत्यापन का वर्णन करता है ।
एलेक्सिस

2
मैं एलओयू बनाम मान का आकलन करने के मापदंडों का अनुमान लगा रहा था कि जो मूल्य बचा था (एलओओसीवी में)। मैं उन्हें दो संबंधित लेकिन थोड़ी अलग प्रक्रियाओं के रूप में देखता हूं, लेकिन शायद दोनों को LOOCV के रूप में संदर्भित किया जा सकता है? मुझसे भी गलती हो सकती है।
jcmb 17
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.