मैं प्रतिगमन कार्य को हल करने की कोशिश कर रहा हूं। मुझे पता चला कि 3 मॉडल डेटा के विभिन्न सबसेट के लिए अच्छी तरह से काम कर रहे हैं: लैस्लोआरएस, एसवीआर और ग्रेडिएंट ट्री बोइंग। मैंने देखा कि जब मैं इन सभी 3 मॉडलों का उपयोग करके भविष्यवाणियाँ करता हूँ और फिर '3 ट्रू आउटपुट' की तालिका बनाता हूँ और अपने 3 मॉडलों के आउटपुट को देखता हूँ, तो हर बार कम से कम एक मॉडल वास्तव में वास्तविक आउटपुट के करीब होता है, हालाँकि 2 अन्य अपेक्षाकृत दूर हो सकता है।
जब मैं न्यूनतम संभावित त्रुटि की गणना करता हूं (यदि मैं प्रत्येक परीक्षण उदाहरण के लिए 'सर्वश्रेष्ठ' पूर्वसूचक से भविष्यवाणी करता हूं) तो मुझे एक त्रुटि मिलती है जो अकेले किसी भी मॉडल की त्रुटि से बहुत छोटी है। इसलिए मैंने इन 3 अलग-अलग मॉडलों से भविष्यवाणियों को किसी तरह के संयोजन में संयोजित करने की कोशिश करने के बारे में सोचा। सवाल है, यह कैसे ठीक से करना है? मेरे सभी 3 मॉडल का निर्माण और स्किकिट-लर्न का उपयोग करके ट्यून किया गया है, क्या यह किसी प्रकार की विधि प्रदान करता है जिसका उपयोग मॉडल को पहनावा में पैक करने के लिए किया जा सकता है? यहां समस्या यह है कि मैं सभी तीन मॉडलों से केवल औसत भविष्यवाणियां नहीं करना चाहता हूं, मैं ऐसा वजन के साथ करना चाहता हूं, जहां विशिष्ट उदाहरण के गुणों के आधार पर वजन निर्धारित किया जाना चाहिए।
यहां तक कि अगर scikit-learn इस तरह की कार्यक्षमता प्रदान नहीं करता है, तो यह अच्छा होगा यदि कोई जानता है कि संपत्ति इस कार्य को कैसे संबोधित करती है - डेटा में प्रत्येक उदाहरण के लिए प्रत्येक मॉडल के भार का पता लगाना। मुझे लगता है कि यह इन सभी 3 मॉडलों के शीर्ष पर निर्मित एक अलग रजिस्ट्रार द्वारा किया जा सकता है, जो कि प्रत्येक 3 मॉडल के लिए आउटपुट इष्टतम भार की कोशिश करेगा, लेकिन मुझे यकीन नहीं है कि यह ऐसा करने का सबसे अच्छा तरीका है।