classification पर टैग किए गए जवाब

सांख्यिकीय वर्गीकरण उप-जनसंख्या की पहचान करने की समस्या है, जिसमें नई टिप्पणियां हैं, जहां उप-जनसंख्या की पहचान अज्ञात है, टिप्पणियों के डेटा सेट के प्रशिक्षण सेट के आधार पर जिनकी उप-जनसंख्या ज्ञात है। इसलिए इन वर्गीकरणों में एक चर व्यवहार दिखाया जाएगा जिसे आँकड़ों द्वारा अध्ययन किया जा सकता है।

3
डेटा वृद्धि और ट्रेन-मान्य विभाजन कैसे करें?
मैं मशीन लर्निंग का उपयोग करके छवि वर्गीकरण कर रहा हूं। मान लीजिए कि मेरे पास कुछ प्रशिक्षण डेटा (चित्र) हैं और डेटा को प्रशिक्षण और सत्यापन सेटों में विभाजित करेगा। और मैं यादृच्छिक घुमाव और शोर इंजेक्शन द्वारा डेटा को बढ़ाना (मूल से नई छवियां बनाना) भी चाहता हूं। …

1
लॉजिस्टिक रिग्रेशन और सपोर्ट वेक्टर मशीनों के बीच अंतर?
मुझे पता है कि लॉजिस्टिक रिग्रेशन एक हाइपरप्लेन का पता लगाता है जो प्रशिक्षण के नमूनों को अलग करता है। मुझे यह भी पता है कि सपोर्ट वेक्टर मशीनें हाइपरप्लेन को अधिकतम मार्जिन के साथ ढूंढती हैं। मेरा प्रश्न: अंतर है तो लॉजिस्टिक रिग्रेशन (LR) और सपोर्ट वेक्टर मशीन (SVM) …

1
मशीन लर्निंग क्लासीफायर बिग-ओ या जटिलता
प्रदर्शन को नए क्लासिफायर किए गए एल्गोरिथ्म के मूल्यांकन के लिए, मैं सटीकता और जटिलता (प्रशिक्षण और वर्गीकरण में बड़ा-ओ) की तुलना करने की कोशिश कर रहा हूं। से मशीन लर्निंग: एक समीक्षा मैं एक पूरी निगरानी classifiers सूची भी एक सटीकता तालिका एल्गोरिदम के बीच से 44 परीक्षण समस्याओं …

3
रैंडम फ़ॉरेस्ट मॉडल में अधिक हाल के डेटा को वेट करना
मैं 6 श्रेणियों के बीच भेदभाव करने के लिए रैंडम फ़ॉरेस्ट के साथ एक वर्गीकरण मॉडल का प्रशिक्षण दे रहा हूं। मेरे लेन-देन के डेटा में लगभग 60k + अवलोकन और 35 चर हैं। यहाँ एक उदाहरण है कि यह लगभग कैसा दिखता है। _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 …

1
यादृच्छिक वन पर LASSO का उपयोग करना
मैं निम्नलिखित प्रक्रिया का उपयोग करके एक यादृच्छिक वन बनाना चाहूंगा: विभाजन को निर्धारित करने के लिए सूचना के लाभ का उपयोग करके डेटा और सुविधाओं के यादृच्छिक नमूनों पर एक पेड़ बनाएं एक पत्ती नोड को समाप्त करें यदि यह पूर्व-परिभाषित गहराई से अधिक है या किसी भी विभाजन …

1
RandomForest - MDS प्लॉट व्याख्या
मैंने 8 चर (विभिन्न शरीर मुद्राओं और चालन) के आधार पर 6 जानवरों के व्यवहार (उदाहरण के लिए खड़े, चलना, तैरना आदि) को वर्गीकृत करने के लिए यादृच्छिक रूप से उपयोग किया। RandomForest पैकेज में MDSplot मुझे यह आउटपुट देता है और मुझे परिणाम की व्याख्या करने में समस्या है। …

3
तंत्रिका जाल छिपा सक्रियण समारोह का विकल्प
मैंने कहीं और पढ़ा है कि किसी NN में छिपे हुए लेयर एक्टिवेशन फंक्शन का चुनाव किसी की ज़रूरत पर आधारित होना चाहिए , यानी यदि आपको रेंज -1 से 1 में मानों की जरूरत है तो टैन का उपयोग करें और रेंज 0 से 1 के लिए सिग्मॉइड का …

5
वन-क्लास टेक्स्ट वर्गीकरण कैसे करें?
मुझे एक पाठ वर्गीकरण समस्या से निपटना है। एक वेब क्रॉलर एक निश्चित डोमेन के वेबपेजों को क्रॉल करता है और प्रत्येक वेबपेज के लिए मैं यह पता लगाना चाहता हूं कि यह केवल एक विशिष्ट वर्ग का है या नहीं। यही है, अगर मैं इस वर्ग को सकारात्मक कहता …

1
जब असंतुलित वर्गों से अधिक / अंडर-सैंपलिंग की जाती है, तो सटीकता को अधिकतम करने से गर्भपात की लागत कम से कम होती है?
सबसे पहले, मैं कुछ सामान्य लेआउट का वर्णन करना चाहूंगा, जो डेटा माइनिंग की किताबें बताती हैं कि असंतुलित डेटासेट से कैसे निपटना है । आमतौर पर मुख्य खंड को असंतुलित डेटासेट नाम दिया गया है और वे इन दो उपखंडों को कवर करते हैं: लागत-संवेदनशील वर्गीकरण और नमूनाकरण तकनीक। …

3
क्या CART मॉडल को मजबूत बनाया जा सकता है?
मेरे कार्यालय के एक सहकर्मी ने आज मुझसे कहा "ट्री मॉडल अच्छे नहीं हैं क्योंकि वे अत्यधिक टिप्पणियों द्वारा पकड़े जाते हैं"। यहां एक खोज के परिणामस्वरूप इस धागे का निर्माण हुआ जो मूल रूप से दावे का समर्थन करता है। जो मुझे इस सवाल की ओर ले जाता है …

2
जब चयनित सुविधाओं की संख्या कम हो जाती है, तो यादृच्छिक वन OOB त्रुटि का अनुमान क्यों सुधारता है?
मैं एक माइक्रोएरे डेटासेट पर एक क्लासिफायरियर के रूप में एक यादृच्छिक वन एल्गोरिथ्म लागू कर रहा हूं जो विभिन्न विशेषताओं के साथ दो ज्ञात समूहों में विभाजित हैं। प्रारंभिक रन के बाद मैं सुविधाओं के महत्व को देखता हूं और 5, 10 और 20 सबसे महत्वपूर्ण विशेषताओं के साथ …

1
मूल्यांकन के रूप में AUC के बजाय सामान्यीकृत Gini स्कोर का उपयोग क्यों करें?
कागल की प्रतियोगिता पोर्टो सेगुरो के सेफ ड्राइवर प्रेडिक्शन नॉर्मलाइज्ड गिनी स्कोर का मूल्यांकन मैट्रिक के रूप में करता है और इससे मुझे इस पसंद के कारणों के बारे में पता चला। मूल्यांकन के लिए एयूसी जैसे सबसे सामान्य मैट्रिक्स के बजाय सामान्यीकृत गिन्नी स्कोर का उपयोग करने के क्या …

1
कैरट glmnet बनाम cv.glmnet
वहाँ का उपयोग कर की तुलना में भ्रम का एक बहुत हो रहा है glmnetके भीतर caretएक इष्टतम लैम्ब्डा के लिए खोज करने के लिए और का उपयोग कर cv.glmnetएक ही काम करने के लिए। कई सवाल किए गए, उदाहरण के लिए: वर्गीकरण मॉडल train.glmnet बनाम cv.glmnet? कैरट के साथ …

1
GAM बनाम लोड बनाम विभाजन
प्रसंग : मैं इसलिए मैं उपयोग कर रहा हूँ एक scatterplot कि पैरामीट्रिक प्रकट नहीं होता है में एक रेखा खींच करना चाहते हैं, geom_smooth()में ggplotमें R। यह स्वचालित रूप से रिटर्न करता है geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ …

8
समान और विषम संख्याओं के बीच अंतर करने के लिए एक न्यूरल नेटवर्क को प्रशिक्षित करें
प्रश्न: क्या किसी एनएन को प्रशिक्षित करना संभव है कि वह विषम और सम संख्याओं के बीच अंतर कर सके और केवल संख्याओं को इनपुट के रूप में उपयोग कर सके? मेरे पास निम्नलिखित डेटासेट हैं: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.