अनिश्चित डेटा के साथ सीखने की निगरानी?


11

क्या अनिश्चित डेटासेट के लिए पर्यवेक्षित शिक्षण मॉडल लागू करने के लिए एक मौजूदा पद्धति है? उदाहरण के लिए, मान लें कि हमारे पास A और B वर्ग के साथ डेटासेट है:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

हम इस पर मशीन लर्निंग मॉडल को कैसे प्रशिक्षित कर सकते हैं? धन्यवाद।

जवाबों:


11

एक संख्यात्मक गुणवत्ता के रूप में आप अपने डेटा पर निर्भर करते हैं, मुझे लगता है कि यह "निश्चितता" निश्चित रूप से वजन के रूप में इस्तेमाल की जा सकती है। उच्च "निश्चितता" स्कोर से वजन में वृद्धि होती है जो निर्णय फ़ंक्शन पर एक डेटम है, जो समझ में आता है।

कई पर्यवेक्षित शिक्षण एल्गोरिदम वजन का समर्थन करते हैं, इसलिए आपको बस उसी का एक भारित संस्करण खोजना होगा जिसे आप उपयोग करने का इरादा रखते हैं।


2
(+1) और चूंकि अनिवार्य रूप से वज़न अंक की "प्रतिकृति" के रूप में कार्य करेगा, शायद किसी भी एल्गोरिथ्म को भारित संस्करण में रखा जा सकता है, जैसे कि ओपी उदाहरण में, [5,8,10] प्रतियों में पास 3 अंक, [50,80,100]% की उनकी निश्चितता को दर्शाता है। (यह वास्तव में कभी भी आवश्यक नहीं होना चाहिए, जैसे कि यह सिद्धांत रूप में किया जा सकता है, एल्गोरिथ्म का एक समान भारित संस्करण होना चाहिए।)
GeoMatt22

5

1A0B0.6AAB01

उदाहरण के लिए, आप करने के लिए एक रेखीय मॉडल फिट कर सकते हैंlogp(A|x)p(B|x)=logp(A|x)1P(A|x)β0+β1Txp(A|x)Aβ0+β1Tx>0B


इसलिए यदि आपके पास एक बहु-श्रेणी वर्गीकरण समस्या थी, तो आप अपने लक्ष्य को वैक्टर के रूप में निर्धारित कर सकते हैं जिनकी लंबाई वर्गों की संख्या के बराबर है?
हाइपरडो

वर्गों की संख्या -1, 100% तक निश्चितता योग; उदाहरण लॉजिस्टिक प्रतिगमन के समान है। बहुत सारे क्लासीफायर कुछ मॉडल के तहत स्कोर (जैसे पी (वर्ग | डेटा) का अनुमान) का उत्पादन करते हैं। यह सब उत्तर प्रस्तावित करता है कि कक्षाओं को सीधे भविष्यवाणी करने के बजाय, निश्चितताओं को स्कोर के रूप में देखें, और इसके बजाय उनकी भविष्यवाणी करें। फिर, स्कोर के साथ कुछ करें।
बैटमैन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.