unbalanced-classes पर टैग किए गए जवाब

असतत श्रेणियों या * कक्षाओं * में आयोजित डेटा कुछ विश्लेषणों के लिए समस्या पेश कर सकता है यदि टिप्पणियों की संख्या (n) प्रत्येक वर्ग से संबंधित कक्षाओं में स्थिर नहीं है। असमान के साथ कक्षाएंn * असंतुलित * हैं।

2
क्या एफ-माप सटीकता का पर्याय है?
मैं समझता हूं कि एफ-माप (सटीक और याद के आधार पर) एक अनुमान है कि एक क्लासिफायरियर कितना सटीक है। जब हम असंतुलित डेटासेट होते हैं, तब भी एफ-माप सटीकता का पक्षधर है । मेरे पास एक सरल प्रश्न है (जो तकनीक के बारे में सही शब्दावली का उपयोग करने …

1
असंतुलित डेटासेट के लिए आरओसी घटता है
एक इनपुट मैट्रिक्स और एक बाइनरी आउटपुट पर विचार करें ।XXXyyy एक क्लासिफायरियर के प्रदर्शन को मापने का एक सामान्य तरीका आरओसी घटता का उपयोग करना है। एक आरओसी प्लॉट में विकर्ण वह परिणाम है जो एक यादृच्छिक क्लासिफायर से प्राप्त किया जाएगा। असंतुलित आउटपुट के मामले में, यादृच्छिक वर्गीकरण …

1
SMOTE मल्टी क्लास असंतुलन समस्या के लिए त्रुटि फेंकता है
मैं अपनी बहु-वर्ग वर्गीकरण समस्या में असंतुलन को सही करने के लिए SMOTE का उपयोग करने की कोशिश कर रहा हूं। यद्यपि SMOTE पूरी तरह से काम करता है SMOTE सहायता दस्तावेज़ के अनुसार आईरिस डेटासेट पर, यह समान डेटासेट पर काम नहीं करता है। यहां बताया गया है कि …

1
कौन सा गहन शिक्षण मॉडल उन श्रेणियों को वर्गीकृत कर सकता है जो पारस्परिक रूप से अनन्य नहीं हैं
उदाहरण: मेरे पास नौकरी के विवरण में एक वाक्य है: "यूके में जावा वरिष्ठ इंजीनियर"। मैं इसे 2 श्रेणियों के रूप में भविष्यवाणी करने के लिए एक गहरे शिक्षण मॉडल का उपयोग करना चाहता हूं: English और IT jobs। यदि मैं पारंपरिक वर्गीकरण मॉडल का उपयोग करता हूं, तो यह …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
श्रेणीबद्ध चर के साथ ओवरलैपिंग
मैं अपने डेटासेट को दो समूहों में विभाजित लगभग 4000 ग्राहकों के साथ संतुलित करने के लिए ओवरसमलिंग और अंडरस्मीपलिंग के संयोजन का प्रदर्शन करना चाहूंगा, जहां समूहों में से एक का अनुपात लगभग 15% है। मैंने SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) और ROSE ( http://cran.r-project.org/web/packages/ROSE/ ) में देखा है ROSE.pdf …

1
रैंडम फॉरेस्ट-स्केलेर में वर्गीकरण थ्रेसहोल्ड
1) मैं स्केलेर में रैंडम फ़ॉरेस्ट में वर्गीकरण थ्रेसहोल्ड (मुझे लगता है कि यह डिफ़ॉल्ट रूप से 0.5 है) कैसे बदल सकता है? 2) मैं स्केलेर में अंडर-सैंपल कैसे ले सकता हूं? 3) मेरे पास रैंडम फॉरेस्ट क्लासिफायर से निम्न परिणाम हैं: [[१६३५ १२ ९ 520] [५२० ३६२४]] precision recall …

1
सबसे अच्छा तरीका है SVM के साथ असंतुलित बहुरंगी डेटासेट को संभालने के लिए
मैं काफी असंतुलित डेटा पर एसवीएम के साथ एक भविष्यवाणी मॉडल बनाने की कोशिश कर रहा हूं। मेरे लेबल / आउटपुट में तीन वर्ग हैं, सकारात्मक, तटस्थ और नकारात्मक। मैं कहूंगा कि सकारात्मक उदाहरण मेरे डेटा का लगभग 10 - 20% बनाता है, तटस्थ लगभग 50 - 60%, और नकारात्मक …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.