केयरट री-सैंपलिंग के तरीके

20

मैं caretविभिन्न मॉडलिंग प्रक्रियाओं का परीक्षण करने के लिए R में लाइब्रेरी का उपयोग कर रहा हूं ।

trainControlवस्तु एक एक फिर से नमूने विधि निर्दिष्ट करने के लिए अनुमति देता है। तरीकों में वर्णित हैं प्रलेखन अनुभाग 2.3 और शामिल हैं: boot, boot632, cv, LOOCV, LGOCV, repeatedcvऔर oob। हालांकि इनमें से कुछ का अनुमान लगाना आसान है, लेकिन इन सभी तरीकों को स्पष्ट रूप से परिभाषित नहीं किया गया है।

इन पुनर्जीवन विधियों के अनुरूप प्रक्रियाएँ क्या हैं?

r resampling caret

— राम अहलूवालिया
स्रोत

प्रलेखन लिंक टूट गया है। इसकी जगह इसका इस्तेमाल करें ।

— विकस

20

ठीक है, यहाँ मेरी कोशिश है:

बूट - बूटस्ट्रैप
boot632 - 0.632 बूटस्ट्रैप
cv - क्रॉस-वेलिडेशन, शायद यह K- गुना क्रॉस-वैरिफिकेशन को संदर्भित करता है ।
LOOCV - लीव-वन-आउट क्रॉस सत्यापन, जिसे जैकनाइफ भी कहा जाता है।
LGOCV - अवकाश-समूह-बाहर क्रॉस सत्यापन, श्रेणीबद्ध डेटा के लिए LOOCV का संस्करण।
दोहरायाव - शायद यादृच्छिक उप-नमूना सत्यापन दोहराया जाता है , अर्थात डेटा को प्रशिक्षित करने और परीक्षण करने के लिए विभाजन यादृच्छिक तरीके से किया जाता है।
ओब - ब्रेमेन द्वारा प्रस्तावित आउट-ऑफ-बैग अनुमान को संदर्भित करता है , जो आगे बूटस्ट्रैप एग्रीगेटिंग से संबंधित है । (लिंक में फ़ाइल एक ps फ़ाइल नहीं है, लेकिन ps.Z फ़ाइल है, इसका नाम बदलें और फिर खोलने का प्रयास करें।)

— mpiktas
स्रोत

1

मेरा मानना है कि LGOCV एक प्रशिक्षण सेट और सत्यापन सेट के बीच यादृच्छिक विभाजन है, बार-बार n। इसलिए, ट्रेन और होल्ड-आउट (ट्रेन में मॉडल का निर्माण करें और होल्ड पर मान्य करें) के बीच डेटा को विभाजित करने के सामान्य मामले के बजाय, इस प्रक्रिया को कई बार दोहराया जाता है।

— B_Miner

3

मैं यह भी मानता हूं कि बार-बार केवीसी कई बार किए गए के-फोल्ड क्रॉस सत्यापन है।

— B_Miner

यह मानना मुश्किल है कि यह कहीं दस्तावेज नहीं है।

— andrew

4

repeatedcvयकीन के लिए 10 गुना पार सत्यापन दोहराया है, मैक्स कुहन की प्रस्तुति के अनुसार। डिफ़ॉल्ट रीसम्पलिंग स्कीम बूटस्ट्रैप है।

एक अच्छी फ़ाइल जिसे आप फिर से शुरू करने के तरीकों के बारे में देख सकते हैं, वह है प्रिडिक्टिव मॉडलिंग विथ आर एंड कैरट पैकेज ( पीडीएफ )। मैक्स ने इसे "यूज़आरआर! 2013" में प्रस्तुत किया।

— tigergopro
स्रोत