एक उदाहरण का उपयोग करके पूर्वाग्रह - भिन्न व्यापार को दर्शाना
जैसा कि @ मैथ्यू डॉरी बताते हैं, यथार्थवादी स्थितियों में आपको अंतिम ग्राफ़ देखने को नहीं मिलता है, लेकिन निम्न खिलौना उदाहरण उन लोगों के लिए दृश्य व्याख्या और अंतर्ज्ञान प्रदान कर सकता है जो इसे उपयोगी पाते हैं।
दसेटसेट और मान्यताओं
उन डेटासेटों पर विचार करें, जिनमें से नमूने के रूप में iid नमूने शामिल हैंY
- Y= s i n ( πx - 0.5 ) + ϵε ~ यूn i चओ आर एम ( - 0.5 , 0.5 )
- Y= च( x ) + ϵ
एक्सYवीa r ( Y) = वीa r ( ϵ ) = 112
च^( x ) = β0+ β1x + β1एक्स2+ । । । + βपीएक्सपी।
विभिन्न बहुपत्नी मॉडल फिटिंग
सहज रूप से, आप एक सीधी रेखा वक्र की अपेक्षा करेंगे कि बुरी तरह से प्रदर्शन करें क्योंकि डेटासेट स्पष्ट रूप से गैर रेखीय है। इसी तरह, बहुत उच्च क्रम बहुपद की फिटिंग अत्यधिक हो सकती है। यह अंतर्ज्ञान नीचे दिए गए ग्राफ़ में परिलक्षित होता है जो विभिन्न मॉडलों और ट्रेन और परीक्षण डेटा के लिए इसी माध्य स्क्वायर त्रुटि को दर्शाता है।
उपरोक्त ग्राफ एकल ट्रेन / परीक्षण विभाजन के लिए काम करता है लेकिन हम कैसे जानते हैं कि यह सामान्य है?
अपेक्षित ट्रेन और परीक्षण MSE का अनुमान लगाना
यहां हमारे पास कई विकल्प हैं, लेकिन एक दृष्टिकोण बेतरतीब ढंग से ट्रेन / परीक्षण के बीच डेटा को विभाजित करने के लिए है - दिए गए विभाजन पर मॉडल को फिट करें, और इस प्रयोग को कई बार दोहराएं। परिणामी MSE को प्लॉट किया जा सकता है और औसत अपेक्षित त्रुटि का अनुमान है।
यह देखना दिलचस्प है कि डेटा के विभिन्न ट्रेन / परीक्षण विभाजन के लिए परीक्षण MSE में बेतहाशा उतार-चढ़ाव होता है। लेकिन औसतन पर्याप्त संख्या में प्रयोग करने से हमें बेहतर आत्मविश्वास प्राप्त होता है।
ग्रे बिंदीदार रेखा पर ध्यान दें जो कि के विचरण को दर्शाता है Yशुरुआत में गणना की। ऐसा लगता है कि औसतन परीक्षण एमएसई इस मान से कम नहीं है
पूर्वाग्रह - भिन्नता अपघटन
जैसा कि यहाँ बताया गया है कि MSE को 3 मुख्य घटकों में विभाजित किया जा सकता है:
इ[ ( Y- च^)2] = σ2ε+ B मैं एक एस2[ च^] + वीa r [ च^]
इ[ ( Y- च^)2] = σ2ε+ [ च- ई[ च^] ]2+ ई[ च^- ई[ च^] ]2
हमारे खिलौने के मामले में कहां:
- च प्रारंभिक डेटासेट से जाना जाता है
- σ2ε के समान वितरण से जाना जाता है ε
- इ[ च^] ऊपर के रूप में गणना की जा सकती है
- च^ एक हल्के रंग की रेखा से मेल खाती है
- इ[ च^-ई[ च^] ]2 औसत लेकर अनुमान लगाया जा सकता है
निम्नलिखित संबंध देते हुए
नोट: ऊपर दिया गया ग्राफ मॉडल को फिट करने के लिए प्रशिक्षण डेटा का उपयोग करता है और फिर ट्रेन + परीक्षण पर MSE की गणना करता है ।