बैगिंग के लिए मुख्य उपयोग-केस कम-पक्षपाती मॉडलों के विचरण को एक साथ जोड़कर कम कर रहा है। यह बाउचर और कोहवी द्वारा ऐतिहासिक पेपर " वोटिंग वर्गीकरण एल्गोरिदम: बैगिंग, बूस्टिंग, और वेरिएंट्स " के एक अनुभवजन्य तुलनात्मक पेपर में अनुभवजन्य रूप से अध्ययन किया गया था । यह आमतौर पर विज्ञापित के रूप में काम करता है।
हालांकि, लोकप्रिय धारणा के विपरीत, विचरण को कम करने के लिए बैगिंग की गारंटी नहीं है । एक और हालिया और (मेरी राय में) बेहतर व्याख्या यह है कि बैगिंग लीवरेज अंक के प्रभाव को कम करता है। उत्तोलन बिंदु वे हैं जो असमान रूप से परिणामी मॉडल को प्रभावित करते हैं, जैसे कि कम से कम वर्गों में प्रतिगमन। यह उत्तोलन बिंदुओं के लिए दुर्लभ लेकिन संभव है कि परिणामस्वरूप मॉडल को सकारात्मक रूप से प्रभावित करें, जिस स्थिति में बैगिंग प्रदर्शन को कम करता है। ग्रैंडवेल्ट द्वारा " बैजिंग इज़ बराबरी इफ़ेक्ट " पर एक नज़र है ।
तो, अंत में अपने प्रश्न का उत्तर दें: बैगिंग का प्रभाव काफी हद तक उत्तोलन बिंदुओं पर निर्भर करता है। कुछ सैद्धांतिक गारंटी मौजूद है, सिवाय इसके कि बैग के आकार के मामले में रैखिक रूप से गणना समय बढ़ जाता है! उस ने कहा, यह अभी भी एक व्यापक रूप से इस्तेमाल किया और बहुत शक्तिशाली तकनीक है। उदाहरण के लिए, लेबल शोर के साथ सीखने पर, बैगिंग अधिक मजबूत क्लासिफायरफायर पैदा कर सकता है ।
राव और Tibshirani में एक बायेसियन व्याख्या दे दिया है " मॉडल औसत और चयन के लिए बाहर के बूटस्ट्रैप विधि " :
इस अर्थ में, बूटस्ट्रैप वितरण हमारे पैरामीटर के लिए एक (अनुमानित) गैर-पैरामीटर, गैर-सूचनात्मक पीछे वितरण का प्रतिनिधित्व करता है। लेकिन इस बूटस्ट्रैप वितरण को दर्द रहित रूप से प्राप्त किया जाता है- बिना पूर्ववर्ती रूप को निर्दिष्ट किए और बिना पीछे के वितरण से नमूना लिए। इसलिए हम बूटस्ट्रैप वितरण के बारे में सोच सकते हैं कि एक गरीब आदमी का "बेयर्स पीछे।"