क्या यह कला प्रतिगमन पद्धति की स्थिति है?


33

मैं एक लंबे समय से कागल प्रतियोगिताओं का पालन कर रहा हूं और मुझे पता चला है कि कई जीतने वाली रणनीतियों में कम से कम एक "बिग थ्रीज" का उपयोग करना शामिल है: बैगिंग, बूस्टिंग और स्टैकिंग।

प्रतिगमन के लिए, एक सर्वोत्तम संभव प्रतिगमन मॉडल बनाने पर ध्यान केंद्रित करने के बजाय, कई प्रतिगमन मॉडल जैसे (सामान्यीकृत) रैखिक प्रतिगमन, यादृच्छिक वन, KNN, NN और SVM प्रतिगमन मॉडल का निर्माण करना और परिणामों को एक उचित तरीके से सम्मिश्रित करना -प्रत्येक व्यक्तिगत विधि को कई बार सुधारें।

बेशक, प्रत्येक विधि की एक ठोस समझ कुंजी है और एक सहज कहानी को एक रेखीय प्रतिगमन मॉडल के आधार पर बताया जा सकता है, लेकिन मैं सोच रहा हूं कि क्या यह सर्वोत्तम संभव परिणाम प्राप्त करने के लिए कला पद्धति का राज्य बन गया है।


कुछ मामलों में, तंत्रिका नेटवर्क ने प्रतिगमन करने के "क्लासिक" तरीके को अच्छी तरह से परिभाषित किया। छूट के लिए, कितने में बारिश हुई II । लेकिन यह निश्चित रूप से एक ब्लैक बॉक्स है।
वाईसीआर

@ YCR मैं मानता हूँ कि यह एक ब्लैकबॉक्स है। काम करते समय, मैंने कुछ भयानक मशीन लर्निंग मॉडल का निर्माण किया और व्यवसाय के लोगों या किसी ऐसे व्यक्ति को समझाने की कोशिश की, जो मॉडल से परिचित नहीं है, बातचीत आमतौर पर इस तरह समाप्त होती है: मैंने एक भयानक मशीन लर्निंग मॉडल बनाया, यह जादू की तरह काम करता है, लेकिन मैं आपको एक दिलचस्प कहानी नहीं बता सकता।
मैक्सारेयो

जवाबों:


41

यह कम से कम 1960 से प्रसिद्ध है, कि अगर आप कई पूर्वानुमान ले और औसत उन्हें है, तो कई मामलों में जिसके परिणामस्वरूप कुल पूर्वानुमान व्यक्ति के पूर्वानुमान से बेहतर प्रदर्शन करेगी। बैगिंग, बूस्टिंग और स्टैकिंग सभी इस विचार पर आधारित हैं। तो हां, अगर आपका उद्देश्य पूरी तरह से भविष्यवाणी है तो ज्यादातर मामलों में यह सबसे अच्छा है जो आप कर सकते हैं। इस पद्धति के बारे में समस्याग्रस्त यह है कि यह एक ब्लैक-बॉक्स दृष्टिकोण है जो परिणाम देता है लेकिन आपको इसे समझने और व्याख्या करने में मदद नहीं करता है। जाहिर है, यह किसी भी अन्य विधि की तुलना में अधिक कम्प्यूटेशनल रूप से गहन है क्योंकि आपको एकल के बजाय कुछ पूर्वानुमानों की गणना करनी होगी।

Any यह आम तौर पर किसी भी भविष्यवाणियों के बारे में चिंता करता है, लेकिन यह अक्सर पूर्वानुमान साहित्य में वर्णित है।


विंकलर, आरएल। और मकरीदकिस, एस। (1983)। पूर्वानुमान का संयोजन। जेआर स्टेटिस। समाज। A. 146 (2), 150-157।

मकरीदकिस, एस और विंकलर, आरएल (1983)। पूर्वानुमान का लाभ: कुछ अनुभवजन्य परिणाम। प्रबंधन विज्ञान, 29 (9) 987-996।

क्लेमेन, आरटी (1989)। संयुक्त पूर्वानुमान: एक समीक्षा और व्याख्यात्मक ग्रंथ सूची। पूर्वानुमान के अंतर्राष्ट्रीय जर्नल, 5, 559-583।

बेट्स, जेएम और ग्रेंजर, सीडब्ल्यू (1969)। पूर्वानुमान का संयोजन। या, 451-468।

मकरीदकिस, एस और हिबोन, एम। (2000)। एम 3-प्रतियोगिता: परिणाम, निष्कर्ष और निहितार्थ। पूर्वानुमान की अंतर्राष्ट्रीय पत्रिका, 16 (4), 451-476।

रीड, डीजे (1968)। सकल घरेलू उत्पाद के तीन अनुमानों का मेल। इकोनोमिका, 431-444।

माक्रिडैकिस, एस।, स्पिलियोटिस, ई।, और असीमाकोपोलोस, वी। (2018)। एम 4 प्रतियोगिता: परिणाम, निष्कर्ष, निष्कर्ष और आगे का रास्ता। पूर्वानुमान के अंतर्राष्ट्रीय जर्नल।


1
डगमगाने वाले फुटनोट की लिंक मेरे लिए काम नहीं करती है?
सिल्वर फिश

@ सिल्वरफ़िश धन्यवाद, निश्चित। लिंक मामूली महत्व का था लेकिन फिर भी, अगर यह काम नहीं करता है तो यह बेकार है।
टिम

0

आर्थर (1994) के पास एक अच्छा लघु पेपर / विचार प्रयोग है जो जटिलता साहित्य में अच्छी तरह से जाना जाता है।

निष्कर्षों में से एक यह है कि एजेंट गैर-संतुलन शर्तों के तहत बेहतर पूर्वानुमान मॉडल (भले ही उनमें से "वन" इनमें से हों) का चयन नहीं कर सकते हैं। उदाहरण के लिए, यदि प्रश्न शेयर बाजार के प्रदर्शन पर लागू होता है, तो आर्थर (1994) की स्थापना लागू हो सकती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.