classification पर टैग किए गए जवाब

पर्यवेक्षित शिक्षण का एक उदाहरण जो उस श्रेणी या श्रेणियों की पहचान करता है, जो डेटासेट का एक नया उदाहरण है।

8
केरस में असंतुलित वर्गों के लिए वर्ग भार कैसे सेट करें?
मुझे पता है कि class_weightsफिटिंग में पैरामीटर शब्दकोश के साथ केरस में एक संभावना है , लेकिन मुझे कोई उदाहरण नहीं मिला। क्या कोई ऐसा प्रदान करना चाहेगा? वैसे, इस मामले में उपयुक्त प्रैक्सिस केवल अल्पसंख्यक वर्ग को आनुपातिक रूप से अपने अंडरप्रिटेशन के लिए भारित करने के लिए है?

6
दूरी मैट्रिक्स के रूप में कोसाइन समानता बनाम डॉट उत्पाद
ऐसा लगता है कि दो विशेषताओं की कोसाइन समानता केवल उनके डॉट उत्पाद को उनके परिमाण के उत्पाद द्वारा बढ़ाया जाता है। कोसाइन समानता कब डॉट उत्पाद की तुलना में बेहतर दूरी मीट्रिक बनाती है? यानी डॉट उत्पाद और कोज़ेन समानता में अलग-अलग स्थितियों में अलग-अलग ताकत या कमजोरियां हैं?

1
बहु-श्रेणी वर्गीकरण के लिए सबसे अच्छा केरस मॉडल क्या है?
मैं अनुसंधान, पर काम कर रहा हूँ, जहां तीन घटना विजेता के वर्गीकृत एक की जरूरत = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 मेरा वर्तमान …

5
डीप लर्निंग बनाम ग्रेडिएंट बूस्टिंग: कब क्या उपयोग करना है?
मुझे एक बड़े डेटासेट के साथ एक बड़ी डेटा समस्या है (उदाहरण के लिए 50 मिलियन पंक्तियाँ और 200 कॉलम लें)। डेटासेट में लगभग 100 संख्यात्मक कॉलम और 100 श्रेणीबद्ध कॉलम और एक प्रतिक्रिया स्तंभ होता है जो बाइनरी क्लास समस्या का प्रतिनिधित्व करता है। प्रत्येक श्रेणीबद्ध कॉलम की कार्डिनैलिटी …

1
स्केगन ग्रैडिएंटबॉस्टिंग क्लैसिफायर की तुलना में एक्सगबोस्ट इतना तेज क्यों है?
मैं 100 न्यूमेरिक फीचर्स के साथ 50k उदाहरणों पर एक ढाल बढ़ाने वाले मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूं। XGBClassifierमेरी मशीन पर 43 सेकंड के भीतर 500 पेड़ लगाता है, जबकि GradientBoostingClassifier1 मिनट और 2 सेकंड में केवल 10 पेड़ (!) को संभालता है :( मैंने 500 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
अत्यधिक असंतुलित डेटा सेट के प्रशिक्षण में त्वरित मार्गदर्शिका
मुझे प्रशिक्षण सेट में लगभग 1000 सकारात्मक और 10000 नकारात्मक नमूनों के साथ एक वर्गीकरण समस्या है। इसलिए यह डेटा सेट काफी असंतुलित है। सादा यादृच्छिक वन बस सभी परीक्षण नमूनों को एक बहुसंख्यक वर्ग के रूप में चिह्नित करने की कोशिश कर रहा है। उप-नमूने और भारित यादृच्छिक वन …

4
SVM पर और इसके विपरीत रैंडम फ़ॉरेस्ट का उपयोग कब करें?
जब कोई Random Forestओवर SVMऔर इसके विपरीत इस्तेमाल करेगा ? मैं समझता हूं कि cross-validationऔर मॉडल तुलना एक मॉडल को चुनने का एक महत्वपूर्ण पहलू है, लेकिन यहां मैं दो तरीकों के अंगूठे और यकृत के नियमों के बारे में अधिक जानना चाहूंगा। क्या कोई सहपाठियों की सूक्ष्मताओं, शक्तियों और …

4
रिज्यूम डेटा के आधार पर जॉब क्लासिफिकेशन करने के लिए मुझे किन एल्गोरिदम का इस्तेमाल करना चाहिए?
ध्यान दें कि मैं आर में सब कुछ कर रहा हूं। समस्या इस प्रकार है: मूल रूप से, मेरे पास रिज्यूमे (सीवी) की एक सूची है। कुछ उम्मीदवारों को पहले काम का अनुभव होगा और कुछ को नहीं। यहाँ लक्ष्य है: उनके सीवी पर पाठ के आधार पर, मैं उन्हें …

4
एक केरास मॉडल के लिए सटीकता, एफ 1, परिशुद्धता और रिकॉल कैसे प्राप्त करें?
मैं अपने बाइनरी KerasClassifier मॉडल के लिए सटीक, रिकॉल और F1-स्कोर की गणना करना चाहता हूं, लेकिन कोई समाधान नहीं ढूंढता। यहाँ मेरा वास्तविक कोड है: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …

5
क्या निर्णय ट्री एल्गोरिदम रैखिक या अरेखीय हैं
हाल ही में मेरे एक दोस्त से पूछा गया था कि क्या एक साक्षात्कार में निर्णय ट्री एल्गोरिदम रैखिक या nonlinear एल्गोरिदम हैं। मैंने इस सवाल का जवाब तलाशने की कोशिश की, लेकिन कोई संतोषजनक स्पष्टीकरण नहीं मिला। क्या कोई इस प्रश्न के समाधान का उत्तर और व्याख्या कर सकता …

3
पाठ वर्गीकरण और विषय मॉडल के बीच अंतर क्या है?
मैं मशीन लर्निंग में क्लस्टरिंग और वर्गीकरण के बीच अंतर जानता हूं, लेकिन मैं दस्तावेजों के लिए टेक्स्ट वर्गीकरण और विषय मॉडलिंग के बीच अंतर को नहीं समझता। क्या मैं किसी विषय की पहचान करने के लिए दस्तावेजों पर विषय मॉडलिंग का उपयोग कर सकता हूं? क्या मैं इन दस्तावेजों …

4
XGBoost के साथ असंतुलित मल्टीक्लास डेटा
मेरे पास इस वितरण के साथ 3 वर्ग हैं: Class 0: 0.1169 Class 1: 0.7668 Class 2: 0.1163 और मैं xgboostवर्गीकरण के लिए उपयोग कर रहा हूं । मुझे पता है कि एक पैरामीटर कहा जाता है scale_pos_weight। लेकिन इसे 'मल्टीस्कल्स' मामले के लिए कैसे संभाला जाता है, और मैं …

2
पाठ वर्गीकरण: विभिन्न प्रकार की विशेषताओं का संयोजन
मैं जिस समस्या से निपट रहा हूं, वह छोटे ग्रंथों को कई वर्गों में वर्गीकृत कर रही है। मेरा वर्तमान तरीका tf-idf वेटेड टर्म फ्रिक्वेंसी का उपयोग करना है और एक सरल रैखिक क्लासिफायरियर (लॉजिस्टिक रिग्रेशन) सीखना है। यह उचित रूप से अच्छी तरह से काम करता है (परीक्षण सेट …

4
यूक्लिडियन दूरी के विपरीत मैनहट्टन दूरी का उपयोग कब होगा?
मैं एक अच्छे तर्क की तलाश में हूं कि मशीन लर्निंग में यूक्लिडियन दूरी पर मैनहट्टन की दूरी का उपयोग क्यों किया जाए । इस MIT लेक्चर पर अब तक मुझे जो सबसे अच्छी बात लगी, वह है । 36:15 पर आप निम्नलिखित बयान देख सकते हैं: "आमतौर पर यूक्लिडियन …

2
सहपाठियों की सटीकता कैसे बढ़ाएं?
मैं OpenCV letter_recog.cpp उदाहरण का उपयोग यादृच्छिक वृक्षों और अन्य वर्गीकरणों पर करने के लिए कर रहा हूं। इस उदाहरण में छह क्लासिफायर के कार्यान्वयन हैं - यादृच्छिक पेड़, बूस्टिंग, एमएलपी, केएनएन, भोले बे और एसवीएम। 20000 उदाहरणों और 16 विशेषताओं के साथ यूसीआई अक्षर पहचान डेटासेट का उपयोग किया …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.