classification पर टैग किए गए जवाब

सांख्यिकीय वर्गीकरण उप-जनसंख्या की पहचान करने की समस्या है, जिसमें नई टिप्पणियां हैं, जहां उप-जनसंख्या की पहचान अज्ञात है, टिप्पणियों के डेटा सेट के प्रशिक्षण सेट के आधार पर जिनकी उप-जनसंख्या ज्ञात है। इसलिए इन वर्गीकरणों में एक चर व्यवहार दिखाया जाएगा जिसे आँकड़ों द्वारा अध्ययन किया जा सकता है।

2
आंशिक रूप से "अज्ञात" डेटा के साथ वर्गीकरण
मान लीजिए मैं एक क्लासिफायरियर सीखना चाहता हूं जो इनपुट के रूप में संख्याओं का वेक्टर लेता है, और आउटपुट के रूप में एक क्लास लेबल देता है। मेरे प्रशिक्षण डेटा में बड़ी संख्या में इनपुट-आउटपुट जोड़े हैं। हालाँकि, जब मैं कुछ नए डेटा पर परीक्षण करने आता हूं, तो …

1
न्यूनतम जोखिम वर्गीकरण के लिए गणना सीमा?
मान लीजिए दो कक्षा और में एक विशेषता और इसका वितरण और । यदि हमारे पास लागत पूर्व मैट्रिक्स के लिए बराबर :C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} क्यों, न्यूनतम जोखिम (लागत) क्लासिफायर के लिए सीमा है?x0&lt;0.5x0&lt;0.5x_0 < 0.5 …

1
गिनी अशुद्धता का उपयोग कब करें और सूचना लाभ का उपयोग कब करें?
क्या कोई मुझे समझा सकता है कि निर्णय पेड़ों के लिए गिन्नी अशुद्धता और सूचना लाभ का उपयोग कब करें? क्या आप मुझे ऐसी स्थितियाँ / उदाहरण दे सकते हैं, जिनका उपयोग करना सबसे अच्छा है?

3
क्रॉस-मान्य वर्गीकरण सटीकता के लिए आत्मविश्वास अंतराल
मैं एक वर्गीकरण समस्या पर काम कर रहा हूं जो दो इनपुट एक्स-रे छवियों के बीच एक समानता मीट्रिक की गणना करता है। यदि चित्र एक ही व्यक्ति ('सही' का लेबल) के हैं, तो एक उच्च मीट्रिक की गणना की जाएगी; दो अलग-अलग लोगों की इनपुट छवियां ('गलत' का लेबल) …

1
सटीक सत्यापन का उपयोग करें और क्रॉस सत्यापन का उपयोग करते समय याद रखें
मैंने 2-लेबल वाले डेटा के लिए कई क्लासिफ़ायर का उपयोग करके वर्गीकरण का प्रदर्शन किया है, और मैंने 5-गुना क्रॉस सत्यापन का उपयोग किया है। प्रत्येक तह के लिए मैंने tp, tn, fp और fn की गणना की। फिर मैंने प्रत्येक परीक्षण के लिए सटीकता, सटीक, याद और एफ-स्कोर की …

2
समय-श्रृंखला वर्गीकरण - बहुत खराब परिणाम
मैं एक समय श्रृंखला वर्गीकरण समस्या पर काम कर रहा हूं जहां सेल फोन खाते के पहले 21 दिनों के लिए इनपुट समय श्रृंखला आवाज उपयोग डेटा (सेकंड में) है। संबंधित लक्ष्य चर 35-45 दिन की सीमा में उस खाते को रद्द किया गया है या नहीं। तो यह एक …

2
AUROC या सटीकता के आधार पर वर्गीकरण की तुलना करें?
मुझे बाइनरी वर्गीकरण की समस्या है और मैं इस पर अलग-अलग क्लासिफायर का प्रयोग करता हूं: मैं क्लासिफायर की तुलना करना चाहता हूं। कौन सा एक बेहतर उपाय AUC या सटीकता है? और क्यों? Raondom Forest: AUC: 0.828 Accuracy: 79.6667 % SVM: AUC: 0.542 Accuracy: 85.6667 %

2
वर्गीकरण समस्याओं में वर्ग पृथक्करण के उपाय
रेखीय विभेदक शिक्षार्थियों में वर्ग पृथक्करण का एक अच्छा उपाय का एक उदाहरण फिशर का रेखीय विभेदक अनुपात है। क्या यह निर्धारित करने के लिए अन्य उपयोगी मैट्रिक्स हैं कि क्या फीचर सेट लक्ष्य चर के बीच अच्छे वर्ग अलगाव प्रदान करते हैं? विशेष रूप से, मैं लक्ष्य वर्ग पृथक्करण …

3
लॉजिस्टिक प्रतिगमन में चर का महत्व
मैं शायद एक ऐसी समस्या से निपट रहा हूं जो शायद पहले सौ बार हल हो गई है, लेकिन मुझे यकीन नहीं है कि उत्तर कहां मिलेगा। रसद प्रतिगमन का उपयोग करते समय, यह देखते हुए कई सुविधाओं और बाइनरी श्रेणीबद्ध मूल्य y की भविष्यवाणी करने की कोशिश कर रहा …

2
वर्गीकरण के लिए एसवीएम के साथ Adaboost का उपयोग करना
मुझे पता है कि Adaboost कमजोर क्लासीफायर के सेट के रैखिक संयोजन का उपयोग करके एक मजबूत क्लासिफायरियर बनाने की कोशिश करता है। हालाँकि, मैंने कुछ शर्तों और मामलों में Adaboost और SVM के सामंजस्य (भले ही SVM एक मजबूत क्लासिफायरिफायर है) में काम करने वाले सुझाव देने वाले कुछ …

4
कुछ कनेक्शनों को हटाकर एक बेहतर एएनएन प्राप्त करना संभव है?
मैं सोच रहा था कि क्या कुछ परिस्थितियों में ANN के लिए बेहतर प्रदर्शन करना संभव है यदि आप उदाहरण के लिए उन पर कुछ कनेक्शन दूर करते हैं: एक एएनएन का निर्माण दो बहुस्तरीय एएनएन के ए और बी को समानांतर (समान इनपुट और आउटपुट नोड्स) में ले जाकर …

1
बहु-वर्ग समस्याओं के लिए 2-वर्ग मॉडल का विस्तार
Adaboost का यह पेपर 2-क्लास मॉडल को K- क्लास की समस्याओं के विस्तार के लिए कुछ सुझाव और कोड (पेज 17) देता है। मैं इस कोड को सामान्य बनाना चाहूंगा, जैसे कि मैं आसानी से विभिन्न 2-क्लास मॉडल में प्लग कर सकता हूं और परिणामों की तुलना कर सकता हूं। …

3
फिल्म रेटिंग भविष्यवाणी के लिए वर्गीकरण मॉडल
मैं डेटा माइनिंग में कुछ नया हूं, और मैं फिल्म रेटिंग भविष्यवाणी के लिए एक वर्गीकरण मॉडल पर काम कर रहा हूं। मैंने IMDB से डेटा सेट एकत्र किए हैं, और मैं अपने मॉडल के लिए एक निर्णय पेड़ और निकटतम पड़ोसी दृष्टिकोण का उपयोग करने की योजना बना रहा …

2
नियमों के एक सेट में एक वर्गीकरण पेड़ (रपेर में) का आयोजन?
क्या एक तरीका है कि एक बार (आर में) rpart का उपयोग करके एक जटिल वर्गीकरण वृक्ष का निर्माण किया जाता है, प्रत्येक वर्ग के लिए उत्पादित निर्णय नियमों को व्यवस्थित करने के लिए? इसलिए एक विशाल वृक्ष प्राप्त करने के बजाय, हम प्रत्येक वर्ग के लिए नियमों का एक …
11 r  classification  cart  rpart 

3
क्या स्पार्ट भविष्यवाणियों और प्रतिक्रियाओं का उपयोग करते हुए CART जैसी विधियों के लिए कोई लाइब्रेरी उपलब्ध है?
मैं आर में gbm पैकेज का उपयोग करते हुए कुछ बड़े डेटा सेट के साथ काम कर रहा हूं। मेरे पूर्वसूचक मैट्रिक्स और मेरी प्रतिक्रिया वेक्टर दोनों बहुत विरल हैं (अर्थात अधिकांश प्रविष्टियां शून्य हैं)। मैं एक एल्गोरिथ्म का उपयोग करके निर्णय पेड़ों का निर्माण करने की उम्मीद कर रहा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.