प्रश्न
मैं यह समझने के लिए संघर्ष कर रहा हूं कि कैसे ग्रैडिएंट बूस्टिंग के साथ द्विआधारी वर्गीकरण करते समय भविष्यवाणी अंतराल के भीतर रखी जाती है ।
मान लें कि हम एक द्विआधारी वर्गीकरण समस्या पर काम कर रहे हैं, और हमारे उद्देश्य समारोह लॉग नुकसान हुआ है, , जहां y लक्ष्य चर रहा है ∈ { 0 , 1 } और एच हमारे वर्तमान मॉडल है।
अगले कमजोर शिक्षार्थी प्रशिक्षित करते समय हमारा नया मॉडल H i = H i - 1 + h i होता है , वह कौन सा तंत्र है जो H i ∈ [ 0 , 1 ] को रखने वाला है ? या, शायद एक अधिक प्रासंगिक प्रश्न, क्या ऐसा कोई तंत्र है?
मैं क्या कर रहा हूँ पर अधिक जानकारी
मैं रिग्रेशन ट्री का इस्तेमाल करते हुए ग्रेडिएंट बूस्टिंग को लागू करने की कोशिश कर रहा हूं। क्या मैं इसे से बचने के लिए करते हैं कि एक गुणा है एक पहलू से ग ∈ [ 0 , ग अधिकतम ] , ऐसा है कि एच + ग अधिकतम ज शून्य से नीचे या ऊपर जाना नहीं है, और मैं चयन ग इस श्रेणी में है कि कम करता है नुकसान समारोह।
यह निम्नलिखित समस्या लाता है: कुछ राउंड के बाद, मेरे पास एक बिंदु है जो पूरी तरह से वर्गीकृत है, और ग्रेडिएंट को ढाल की दिशा में धकेलने के लिए सबसे अच्छा विभाजन उपलब्ध है जो इस बिंदु को एक से ऊपर धकेलना चाहता है, जो मुझे यकीन नहीं होता है सेटिंग । इस प्रकार सभी अगले पुनरावृत्ति समान विभाजन और समान c = 0 का चयन करेंगे ।
मैंने सामान्य नियमितीकरण की कोशिश की
- गुणा करके सीखने दर घटाना द्वारा μ = 0.01 । यह सिर्फ समस्या को दूर करता है।
- फीचर स्पेस को सब्स्क्राइब करना, लेकिन कुछ बिंदुओं को वर्गीकृत करना बहुत आसान है, वे लगभग हर बॉक्स को "क्या यह सकारात्मक है?" फार्म, और लगभग हर "अच्छा विभाजन" इस व्यवहार को दर्शाता है।
मुझे लगता है कि यह मापदंडों की समस्या नहीं है, और इसे ठीक करने के लिए अधिक ध्वनि तरीका होना चाहिए । मैं इस संभावना को खारिज नहीं कर रहा हूं कि मेरा कार्यान्वयन टूट गया है, लेकिन मैंने इस समस्या को स्वीकार नहीं किया है।
लॉजिस्टिक लॉस के संदर्भ में हम जो हेरफेर कर रहे हैं, वह एक संभावना होनी चाहिए, तो हम इससे कैसे बचें?
मेरा अंतर्ज्ञान उस मॉडल को बनाने का होगा, जो , एक सिग्मोइड फ़ंक्शन में ऐसा है कि यह [ 0 , 1 ] से घिरा है , और मुझे लगता है कि यह काम करेगा, लेकिन मैं जानना चाहता हूं कि क्या अन्य समाधान हैं। चूंकि धीरे-धीरे बूस्टिंग का उपयोग वर्गीकरण कार्यों में सफलतापूर्वक किया जाता है, इसलिए एक "सही" (यानी, औचित्य के साथ) समाधान मौजूद होना चाहिए।