unbalanced-classes पर टैग किए गए जवाब

असतत श्रेणियों या * कक्षाओं * में आयोजित डेटा कुछ विश्लेषणों के लिए समस्या पेश कर सकता है यदि टिप्पणियों की संख्या (n) प्रत्येक वर्ग से संबंधित कक्षाओं में स्थिर नहीं है। असमान के साथ कक्षाएंn * असंतुलित * हैं।

3
लॉजिस्टिक रिग्रेशन करते समय असंतुलित नमूना क्या मायने रखता है?
ठीक है, इसलिए मुझे लगता है कि मेरे पास एक अच्छा नमूना है, जिसमें अंगूठे के 20: 1 नियम को ध्यान में रखा गया है: कुल 7 उम्मीदवार पूर्वसूचक चरों के लिए काफी बड़ा नमूना (एन = 374)। मेरी समस्या निम्नलिखित है: जो भी मैं भविष्यवाणियों के सेट का उपयोग …

6
दृढ़ता से असंतुलित कक्षाओं के साथ द्विआधारी वर्गीकरण
मेरे पास (सुविधाओं, बाइनरी आउटपुट 0 या 1) के रूप में एक डेटा सेट है, लेकिन 1 बहुत कम ही होता है, इसलिए केवल हमेशा 0 की भविष्यवाणी करने से, मुझे 70% और 90% के बीच सटीकता मिलती है (विशेष डेटा के आधार पर मैं देखता हूं )। एमएल विधियां …

5
असंतुलित डेटा कब मशीन लर्निंग में एक समस्या है?
लॉजिस्टिक रिग्रेशन , एसवीएम , डिसीजन ट्री , बैगिंग और इसी तरह के कई अन्य सवालों का उपयोग करते समय हमारे पास असंतुलित डेटा के बारे में पहले से ही कई सवाल थे , जो इसे बहुत लोकप्रिय विषय बनाता है! दुर्भाग्य से, प्रत्येक प्रश्न एल्गोरिदम-विशिष्ट प्रतीत होता है और …

4
सुपरवाइज्ड मशीन लर्निंग में क्लास असंतुलन
यह सामान्य रूप से एक प्रश्न है, किसी विधि या डेटा सेट के लिए विशिष्ट नहीं है। हम सुपरवाइज्ड मशीन लर्निंग में एक वर्ग असंतुलन की समस्या से कैसे निपटते हैं, जहां 0 की संख्या 90% के आसपास है और 1 की संख्या आपके डेटासेट में लगभग 10% है। क्या …

4
असंतुलित डेटा के खिलाफ निर्णय वृक्ष का प्रशिक्षण
मैं डेटा माइनिंग के लिए नया हूं और मैं एक डेटा सेट के खिलाफ एक निर्णय पेड़ को प्रशिक्षित करने की कोशिश कर रहा हूं जो अत्यधिक असंतुलित है। हालाँकि, मुझे खराब भविष्यवाणियाँ सटीकता के साथ समस्या हो रही हैं। डेटा में पाठ्यक्रम का अध्ययन करने वाले छात्र होते हैं, …

1
क्या डाउन-सैंपलिंग लॉजिस्टिक रिग्रेशन गुणांक को बदल देता है?
अगर मेरे पास एक बहुत ही दुर्लभ सकारात्मक वर्ग के साथ एक डेटासेट है, और मैं नकारात्मक वर्ग का नमूना देता हूं, तो एक लॉजिस्टिक प्रतिगमन करें, क्या मुझे इस तथ्य को प्रतिबिंबित करने के लिए प्रतिगमन गुणांक को समायोजित करने की आवश्यकता है कि मैंने सकारात्मक वर्ग की व्यापकता …

3
वर्ग असंतुलन समस्या का मूल कारण क्या है?
मैं हाल ही में मशीन / सांख्यिकीय सीखने में "क्लास असंतुलन समस्या" के बारे में बहुत कुछ सोच रहा हूं, और मैं कभी भी इस भावना को गहरा कर रहा हूं कि मुझे समझ नहीं आ रहा है कि क्या चल रहा है। पहले मुझे अपनी शर्तों को परिभाषित (या …

4
क्लास-असंतुलन के तहत प्रेसिजन-रिकॉल कर्व्स का अनुकूलन
मेरे पास एक वर्गीकरण कार्य है जहां मेरे पास कई भविष्यवक्ता हैं (जिनमें से एक सबसे अधिक जानकारीपूर्ण है), और मैं अपने क्लासिफायर का निर्माण करने के लिए MARS मॉडल का उपयोग कर रहा हूं (मैं किसी भी सरल मॉडल में दिलचस्पी रखता हूं, और उदाहरण के लिए चित्र का …

4
मुझे प्रशिक्षण डेटा सेट में कक्षाओं को कब संतुलित करना चाहिए?
मेरे पास एक ऑनलाइन पाठ्यक्रम था, जहां मैंने सीखा कि प्रशिक्षण डेटा में असंतुलित कक्षाएं समस्याओं का कारण बन सकती हैं, क्योंकि वर्गीकरण एल्गोरिदम बहुमत नियम के लिए जाते हैं, क्योंकि यह असंतुलित होने पर बहुत अच्छे परिणाम देता है। एक असाइनमेंट में किसी को बहुमत वर्ग को रेखांकित करके …

6
लॉजिस्टिक प्रतिगमन के लिए नमूना आकार?
मैं अपने सर्वेक्षण डेटा से एक लॉजिस्टिक मॉडल बनाना चाहता हूं। यह चार आवासीय कॉलोनियों का एक छोटा सा सर्वेक्षण है जिसमें केवल 154 उत्तरदाताओं का साक्षात्कार लिया गया था। मेरा आश्रित चर "काम करने के लिए संतोषजनक संक्रमण" है। मैंने पाया कि, 154 उत्तरदाताओं में से 73 ने कहा …

4
असंतुलित डेटासेट के लिए xgboost में scale_pos_weight का उचित उपयोग क्या है?
मेरे पास बहुत असंतुलित डेटासेट है। मैं ट्यूनिंग सलाह का पालन करने और उपयोग करने की कोशिश कर रहा हूं scale_pos_weightलेकिन यह सुनिश्चित नहीं है कि मुझे इसे कैसे ट्यून करना चाहिए। मैं देख सकता हूँ कि RegLossObj.GetGradientकरता है: if (info.labels[i] == 1.0f) w *= param_.scale_pos_weight इसलिए एक सकारात्मक नमूने …

4
ओवरसैंपलिंग, अंडरसमैंपिंग और SMOTE से क्या समस्या हल होती है?
हाल ही में, अच्छी तरह से पढ़ा गया, सवाल, टिम पूछता है कि असंतुलित डेटा वास्तव में मशीन लर्निंग में एक समस्या है ? प्रश्न का आधार यह है कि वर्ग संतुलन और असंतुलित कक्षाओं की समस्या पर चर्चा करने वाला मशीनी अधिगम साहित्य है । यह विचार है कि …

2
परीक्षण सेट और प्रशिक्षण सेट के वितरण के बीच अंतर को कैसे संभालना है?
मुझे लगता है कि मशीन सीखने या पैरामीटर के आकलन की एक बुनियादी धारणा यह है कि अनदेखी डेटा प्रशिक्षण सेट के समान वितरण से आता है। हालांकि, कुछ व्यावहारिक मामलों में, परीक्षण सेट का वितरण लगभग प्रशिक्षण सेट से अलग होगा। बड़े पैमाने पर बहु-वर्गीकरण समस्या के लिए कहें …

3
अत्यधिक असंतुलित डेटा के लिए वर्गीकरण / मूल्यांकन मेट्रिक्स
मैं एक धोखाधड़ी का पता लगाने (क्रेडिट-स्कोरिंग जैसी) समस्या से निपटता हूं। जैसे कि धोखाधड़ी और गैर-धोखाधड़ी टिप्पणियों के बीच अत्यधिक असंतुलित संबंध है। http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html विभिन्न वर्गीकरण मीट्रिक का एक बड़ा अवलोकन प्रदान करता है। Precision and Recallया kappaदोनों एक अच्छा विकल्प लगते हैं: ऐसे क्लासिफायर के परिणामों को सही …

5
प्रतिगमन में असंतुलित डेटा के लिए नमूनाकरण
वर्गीकरण में असंतुलित डेटा को संभालने पर अच्छे सवाल किए गए हैं संदर्भ , लेकिन मैं सोच रहा हूं कि लोग प्रतिगमन के लिए क्या नमूना लेते हैं। कहो समस्या डोमेन संकेत के प्रति बहुत संवेदनशील है, लेकिन केवल लक्ष्य के परिमाण के प्रति कुछ हद तक संवेदनशील है। हालांकि …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.