unbalanced-classes पर टैग किए गए जवाब

असतत श्रेणियों या * कक्षाओं * में आयोजित डेटा कुछ विश्लेषणों के लिए समस्या पेश कर सकता है यदि टिप्पणियों की संख्या (n) प्रत्येक वर्ग से संबंधित कक्षाओं में स्थिर नहीं है। असमान के साथ कक्षाएंn * असंतुलित * हैं।

2
असंतुलित डेटा के लिए लॉजिस्टिक रिग्रेशन के लिए वेट जोड़ना
मैं असंतुलित डेटा (9: 1) के साथ एक लॉजिस्टिक प्रतिगमन मॉडल करना चाहता हूं। मैं glmआर में फ़ंक्शन में वज़न विकल्प का प्रयास करना चाहता था , लेकिन मैं 100% निश्चित नहीं हूं कि यह क्या करता है। कहते हैं कि मेरा आउटपुट वेरिएबल है c(0,0,0,0,0,0,0,0,0,1)। अब मैं "1" 10 …

2
एनोवा में चर का क्रम मायने रखता है, है ना?
क्या मैं यह समझने के लिए सही हूं कि एक बहुक्रियाशील ANOVA में चर को जिस क्रम में निर्दिष्ट किया गया है, उससे कुछ फर्क पड़ता है लेकिन यह कि कई रेखीय प्रतिगमन करते समय यह क्रम मायने नहीं रखता है? तो एक परिणाम मानकर जैसे कि रक्त की हानि …

2
ओवरसाइम्ड इम्बैलेंस डेटा पर परीक्षण वर्गीकरण
मैं गंभीर रूप से असंतुलित डेटा पर काम कर रहा हूं। साहित्य में, री-सैंपलिंग (ओवर- या अंडर-सैंपलिंग) का उपयोग करके डेटा को फिर से संतुलित करने के लिए कई तरीकों का उपयोग किया जाता है। दो अच्छे दृष्टिकोण हैं: SMOTE: सिंथेटिक माइनॉरिटी ओवर-सैंपलिंग TEchnique ( SMOTE ) ADASYN: असंतुलित शिक्षण …

3
आरओसी बनाम प्रेसिजन-रिकॉल असंतुलित डेटासेट पर घटता है
मैंने अभी इस चर्चा को पढ़ना समाप्त किया है । उनका तर्क है कि PR AUC असंतुलित डेटासेट पर ROC AUC से बेहतर है। उदाहरण के लिए, हमारे पास परीक्षण डेटासेट में 10 नमूने हैं। 9 नमूने सकारात्मक हैं और 1 नकारात्मक है। हमारे पास एक भयानक मॉडल है जो …

2
क्या GBM वर्गीकरण असंतुलित वर्ग आकारों से ग्रस्त है?
मैं एक पर्यवेक्षित बाइनरी वर्गीकरण मुद्दे के साथ काम कर रहा हूं। मैं GBM पैकेज का उपयोग करना चाहता हूं ताकि वह बिना किसी संक्रमित / संक्रमित व्यक्ति को वर्गीकृत कर सके। मेरे पास संक्रमित व्यक्तियों की तुलना में 15 गुना अधिक असंक्रमित है। मैं सोच रहा था कि क्या …

3
अत्यधिक असंतुलित सेटिंग में लागत-संवेदनशील सीखने के सुझाव
मेरे पास कुछ मिलियन पंक्तियों और ~ 100 कॉलमों के साथ एक डेटासेट है। मैं डेटासेट में 1% उदाहरणों का पता लगाना चाहूंगा, जो एक सामान्य वर्ग के हैं। मेरे पास एक न्यूनतम परिशुद्धता बाधा है, लेकिन बहुत ही असममित लागत के कारण मैं किसी भी विशेष याद के लिए …

3
असंतुलित डेटा के लिए एसवीएम
मैं अपने डेटासेट पर सपोर्ट वेक्टर मशीनों (एसवीएम) का उपयोग करने का प्रयास करना चाहता हूं। इससे पहले कि मैं इस समस्या का प्रयास करूँ, मुझे चेतावनी दी गई थी कि एसवीएम बेहद असंतुलित आंकड़ों पर अच्छा प्रदर्शन नहीं करते हैं। मेरे मामले में, मेरे पास 95-98% 0 और 2-5% …



1
जब असंतुलित वर्गों से अधिक / अंडर-सैंपलिंग की जाती है, तो सटीकता को अधिकतम करने से गर्भपात की लागत कम से कम होती है?
सबसे पहले, मैं कुछ सामान्य लेआउट का वर्णन करना चाहूंगा, जो डेटा माइनिंग की किताबें बताती हैं कि असंतुलित डेटासेट से कैसे निपटना है । आमतौर पर मुख्य खंड को असंतुलित डेटासेट नाम दिया गया है और वे इन दो उपखंडों को कवर करते हैं: लागत-संवेदनशील वर्गीकरण और नमूनाकरण तकनीक। …

1
क्या 1% जैसी कम घटना दर वाले डेटा के लिए ग्रेडिंग बूस्ट उचित है?
मैं एंटरप्राइज़ माइनर का उपयोग करके लगभग 1% की दर से एक डेटासेट पर ग्रेडिंग बढ़ाने की कोशिश कर रहा हूं, लेकिन यह किसी भी आउटपुट का उत्पादन करने में विफल हो रहा है। मेरा प्रश्न यह है कि चूंकि यह एक निर्णय आधारित पेड़ है, इसलिए क्या इस तरह …

2
पी> 0.5 कटऑफ लॉजिस्टिक रिग्रेशन के लिए "इष्टतम" क्यों नहीं है?
पूर्व: मैं कटऑफ का उपयोग करने के गुणों के बारे में परवाह नहीं करता हूं या नहीं, या किसी को कटऑफ कैसे चुनना चाहिए। मेरा प्रश्न विशुद्ध रूप से गणितीय है और जिज्ञासा के कारण है। लॉजिस्टिक रिग्रेशन क्लास ए बनाम क्लास बी की पश्चवर्ती सशर्त संभावना को मॉडल करता …

1
झूठी सकारात्मकता की संख्या कैसे कम करें?
मैं पदयात्रा का पता लगाने वाले कार्य को हल करने की कोशिश कर रहा हूं और मैं बाइनरी क्लैसिफर को दो श्रेणियों सकारात्मकता - लोगों, नकारात्मक - पृष्ठभूमि पर प्रशिक्षित करता हूं। मेरे पास डाटासेट है: सकारात्मक संख्या = 3752 नकारात्मक की संख्या = 3800 मैं ट्रेन \ टेस्ट स्प्लिट …

1
एक असंतुलित डेटासेट बनाना
मैं अपने प्रशिक्षित मॉडल का असंतुलित डेटासेट पर परीक्षण करना चाहूंगा। क्या संतुलित लेबल डेटासेट (स्पैम / गैर-स्पैम) से सिंथेटिक डेटा उत्पन्न करने के लिए कोई एल्गोरिदम उपलब्ध है?

3
उच्च परिशुद्धता या उच्च रिकॉल बाइनरी क्लासिफायरफ़ायर प्राप्त करने के लिए किसी व्यक्ति को किस हानि कार्य का उपयोग करना चाहिए?
मैं वस्तुओं का एक डिटेक्टर बनाने की कोशिश कर रहा हूं जो बहुत कम (छवियों में) होता है, एक स्लाइडिंग / रिसाइज्ड विंडो में लागू सीएनएन बाइनरी क्लासिफायरियर का उपयोग करने की योजना है। मैंने संतुलित 1: 1 पॉजिटिव-निगेटिव ट्रेनिंग और टेस्ट सेट का निर्माण किया है (क्या इस तरह …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.