classification पर टैग किए गए जवाब

सांख्यिकीय वर्गीकरण उप-जनसंख्या की पहचान करने की समस्या है, जिसमें नई टिप्पणियां हैं, जहां उप-जनसंख्या की पहचान अज्ञात है, टिप्पणियों के डेटा सेट के प्रशिक्षण सेट के आधार पर जिनकी उप-जनसंख्या ज्ञात है। इसलिए इन वर्गीकरणों में एक चर व्यवहार दिखाया जाएगा जिसे आँकड़ों द्वारा अध्ययन किया जा सकता है।

3
कई LSTM को ढेर करने के क्या फायदे हैं?
फायदे क्या हैं, क्यों एक-एक नेटवर्क में, कई LSTM का उपयोग किया जाएगा, एक-एक करके, एक तरफ? मैं एक इनपुट के अनुक्रम का प्रतिनिधित्व करने के लिए एक LSTM का उपयोग कर रहा हूं। इसलिए एक बार मेरे पास यह एकल प्रतिनिधित्व है - मैं इसे फिर से क्यों पास …

4
ओवरसैंपलिंग, अंडरसमैंपिंग और SMOTE से क्या समस्या हल होती है?
हाल ही में, अच्छी तरह से पढ़ा गया, सवाल, टिम पूछता है कि असंतुलित डेटा वास्तव में मशीन लर्निंग में एक समस्या है ? प्रश्न का आधार यह है कि वर्ग संतुलन और असंतुलित कक्षाओं की समस्या पर चर्चा करने वाला मशीनी अधिगम साहित्य है । यह विचार है कि …

2
टेक्स्ट वर्गीकरण के लिए बैग-ऑफ-वर्ड्स: क्यों न केवल TFIDF के बजाय शब्द आवृत्तियों का उपयोग किया जाए?
पाठ वर्गीकरण के लिए एक आम दृष्टिकोण एक 'बैग-ऑफ-वर्ड्स' से एक क्लासिफायरियर को प्रशिक्षित करना है। उपयोगकर्ता पाठ को वर्गीकृत करने के लिए लेता है और प्रत्येक वस्तु में शब्दों की आवृत्तियों को गिनाता है, जिसके बाद किसी प्रकार की ट्रिमिंग होती है जिसके परिणामस्वरूप आकार का मैट्रिक्स बना रहता …

1
क्या संभावना है कि आयामों में
डेटा पॉइंट्स को देखते हुए , प्रत्येक में फीचर्स के साथ , को रूप में , अन्य को रूप में लेबल किया जाता है । प्रत्येक सुविधा यादृच्छिक रूप से (समान वितरण) से एक मान लेती है । क्या संभावना है कि एक हाइपरप्लेन मौजूद है जो दो वर्गों को …

3
वर्गीकरण प्रदर्शन का मूल्यांकन करने के लिए क्रॉस-सत्यापन या बूटस्ट्रैपिंग?
किसी विशेष डेटा सेट पर एक क्लासिफायरियर के प्रदर्शन का मूल्यांकन करने और अन्य क्लासिफायर के साथ तुलना करने के लिए सबसे उपयुक्त नमूनाकरण विधि क्या है? क्रॉस-सत्यापन मानक अभ्यास प्रतीत होता है, लेकिन मैंने पढ़ा है कि इस तरह के .632 बूटस्ट्रैप एक बेहतर विकल्प हैं। अनुवर्ती के रूप …

2
प्रशिक्षण सेट की कितनी बड़ी जरूरत है?
क्या एक सामान्य विधि का उपयोग यह निर्धारित करने के लिए किया जाता है कि न्यूनतम दहलीज सामान्यीकरण सटीकता प्राप्त करने के लिए एक क्लासिफ़ायर (इस मामले में एक एलडीए) को प्रशिक्षित करने के लिए कितने प्रशिक्षण नमूने आवश्यक हैं? मैं पूछ रहा हूं क्योंकि मैं मस्तिष्क-कंप्यूटर इंटरफ़ेस में आमतौर …

2
हानि फ़ंक्शन और निर्णय फ़ंक्शन के बीच अंतर क्या है?
मैं देखता हूं कि दोनों फ़ंक्शन डेटा माइनिंग विधियों जैसे कि ग्रेडिएंट बूस्टिंग रेजिस्टर्स का हिस्सा हैं। मैं देखता हूं कि वे अलग-अलग वस्तुएं भी हैं। दोनों का रिश्ता सामान्य रूप से कैसा है?

2
परीक्षण सेट और प्रशिक्षण सेट के वितरण के बीच अंतर को कैसे संभालना है?
मुझे लगता है कि मशीन सीखने या पैरामीटर के आकलन की एक बुनियादी धारणा यह है कि अनदेखी डेटा प्रशिक्षण सेट के समान वितरण से आता है। हालांकि, कुछ व्यावहारिक मामलों में, परीक्षण सेट का वितरण लगभग प्रशिक्षण सेट से अलग होगा। बड़े पैमाने पर बहु-वर्गीकरण समस्या के लिए कहें …

3
एक मॉडल की अनुमानित संभावना के अंशांकन को विज़ुअलाइज़ करना
मान लीजिए मेरे पास एक पूर्वानुमान मॉडल है जो प्रत्येक उदाहरण के लिए, प्रत्येक वर्ग के लिए एक संभावना है। अब मैं पहचानता हूं कि ऐसे मॉडल का मूल्यांकन करने के कई तरीके हैं यदि मैं वर्गीकरण (सटीक, याद, आदि) के लिए उन संभावनाओं का उपयोग करना चाहता हूं। मैं …

5
बेहतर भविष्य कहे जाने वाले (उदाहरण: CV) प्रदर्शन के साथ पेड़ों के वर्गीकरण के विकल्प?
मैं वर्गीकरण पेड़ों के लिए एक विकल्प की तलाश कर रहा हूं जो बेहतर भविष्य कहनेवाला शक्ति प्राप्त कर सकता है। मैं जिस डेटा के साथ काम कर रहा हूं, उसमें व्याख्यात्मक और व्याख्या किए गए चर दोनों के कारक हैं। मुझे याद है कि इस संदर्भ में यादृच्छिक जंगलों …

6
प्रशिक्षण की तुलना में परीक्षण की सटीकता अधिक है। व्याख्या कैसे करें?
मैंने कई विशेषताओं (1000 से अधिक) के साथ सबसे अधिक 150 उदाहरणों (प्रशिक्षण और परीक्षण में विभाजित) में एक डेटासेट युक्त है। मुझे क्लासिफायर की तुलना करने और चयन के तरीकों को चुनने की आवश्यकता है जो डेटा पर अच्छा प्रदर्शन करते हैं। इसलिए, मैं तीन वर्गीकरण विधियों (J48, NB, …

4
शोधकर्ता एक सत्यापन सेट पर परीक्षण के बजाय 10-गुना क्रॉस सत्यापन का उपयोग क्यों करते हैं?
मैंने भावना वर्गीकरण और संबंधित विषयों के बारे में बहुत सारे शोध पत्र पढ़े हैं। उनमें से अधिकांश प्रशिक्षकों को प्रशिक्षित करने और परीक्षण करने के लिए 10-गुना क्रॉस सत्यापन का उपयोग करते हैं। इसका मतलब है कि कोई अलग परीक्षण / सत्यापन नहीं किया जाता है। ऐसा क्यों है? …

4
शाओ के परिणाम छुट्टी-एक-आउट क्रॉस-सत्यापन पर कब लागू होते हैं?
क्रॉस-वैलिडेशन द्वारा अपने पेपर रैखिक मॉडल चयन में , जुन शाओ दर्शाता है कि बहुभिन्नरूपी रैखिक प्रतिगमन में चर चयन की समस्या के लिए, छुट्टी-एक-आउट क्रॉस सत्यापन (एलओओसीवी) की विधि 'एसिम्पटोट असंगत' है। सादे अंग्रेजी में, यह बहुत अधिक चर वाले मॉडल का चयन करता है। एक सिमुलेशन अध्ययन में, …

1
उचित स्कोरिंग नियमों में से चुनना
उचित स्कोरिंग नियमों के अधिकांश संसाधनों में लॉग-लॉस, बैरियर स्कोर या गोलाकार स्कोरिंग जैसे विभिन्न स्कोरिंग नियमों का उल्लेख है। हालांकि, वे अक्सर उनके बीच के मतभेदों पर ज्यादा मार्गदर्शन नहीं देते हैं। (प्रदर्शनी ए: विकिपीडिया ।) लॉगरिदमिक स्कोर को अधिकतम करने वाले मॉडल को चुनना अधिकतम संभावना मॉडल को …

2
प्रतिबंधित बोल्ट्जमैन मशीनों बनाम बहुपरत तंत्रिका नेटवर्क
मैं एक वर्गीकरण समस्या के लिए एक तंत्रिका नेटवर्क के साथ प्रयोग करना चाहता हूं जिसे मैं सामना कर रहा हूं। मैं RBM की बात करने वाले पत्रों में भाग गया। लेकिन मैं जो समझ सकता हूं, वे बहुपरत तंत्रिका नेटवर्क से अलग नहीं हैं। यह सटीक है? इसके अलावा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.