स्टैकिंग / पहनावा मॉडल कैरेट के साथ


21

मैं अक्सर अपने आप caretको आर में उपयोग करने वाले कई अलग-अलग पूर्वानुमान मॉडल का प्रशिक्षण लेता हूं। मैं उन सभी को एक ही क्रॉस सत्यापन सिलवटों पर प्रशिक्षित करता हूं, उपयोग करता हूं caret::: createFolds, फिर क्रॉस-वैरिफाइड त्रुटि के आधार पर सर्वश्रेष्ठ मॉडल का चयन करता हूं ।

हालांकि, कई मॉडलों से माध्य भविष्यवाणी अक्सर एक स्वतंत्र परीक्षण सेट पर सर्वश्रेष्ठ एकल मॉडल को बेहतर बनाती है। मैं स्टैकिंग / एसेम्बलिंग मॉडल के लिए कुछ फ़ंक्शन लिखने के बारे में सोच रहा हूं जो एक ही क्रॉस-वैलिडेशन सिलवटों के साथ प्रशिक्षित किए गए थे, उदाहरण के लिए प्रत्येक गुना पर प्रत्येक मॉडल से माध्य भविष्यवाणियां लेने के द्वारा, या "मेटा-मॉडल" प्रशिक्षण द्वारा।

बेशक, इसके लिए बाहरी क्रॉस-सत्यापन लूप की आवश्यकता हो सकती है। क्या किसी को किसी भी मौजूदा पैकेज / खुले स्रोत कोड को कैरेट मॉडल (और संभवतः उन पहनावाओं को क्रॉस-वैरिफाई करना) के बारे में पता है?

जवाबों:


19

ऐसा लगता है कि मैक्स कुह्न वास्तव में कैरेट मॉडल को इकट्ठा करने के लिए एक पैकेज पर काम करना शुरू कर दिया था, लेकिन अभी तक इसे खत्म करने का समय नहीं है। यही वह है जिसकी तलाश में मैं हूं। मुझे उम्मीद है कि परियोजना एक दिन समाप्त हो जाएगी!

संपादित करें: मैंने ऐसा करने के लिए अपना स्वयं का पैकेज लिखा: caretEnsemble


1
इस पैकेज पर बेहतरीन काम!
mikeycgto

8

आप जो खोज रहे हैं उसे "मॉडल एनसेंबलिंग" कहा जाता है। आर कोड के साथ एक सरल परिचयात्मक ट्यूटोरियल यहां पाया जा सकता है: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html


3
नाइट पिकी होने के लिए नहीं, लेकिन मेरी पोस्ट के शीर्षक में "एन्सेम्बलिंग" सही है। मैं विशेष रूप से मनमाने ढंग से मॉडल के लिए एक आर पैकेज की तलाश कर रहा हूं, जो मौजूद नहीं है। कोड पोस्ट करने के लिए धन्यवाद, यद्यपि। शायद मैं अपना पैकेज लिखूंगा!
Zach

1

मुझे यकीन नहीं है कि आप क्या देख रहे हैं, लेकिन यह मदद कर सकता है: http://www.jstatsoft.org/v28/i05/paper

यह है कि कैरेट में कई मॉडलों का उपयोग कैसे किया जाता है। जिस हिस्से में आपकी रुचि हो सकती है वह पृष्ठ 5 पर है। 13।


मैं जिस चीज की तलाश कर रहा हूं वह एक ऐसा पैकेज है जो इनपुट के रूप में कार्यवाहक वस्तुओं की एक सूची के रूप में ले जाएगा, और फिर औसत, औसत, या भारित औसत औसत उनकी भविष्यवाणियों का उत्पादन करेगा। अधिक उन्नत कार्यक्षमता में नेस्टेड-क्रॉस सत्यापन के माध्यम से वेट का अनुकूलन करना शामिल हो सकता है।
Zach
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.