सांख्यिकी और बिग डेटा classification

3

ImageNet: शीर्ष-पाँच त्रुटि का क्या अर्थ है?

ImageNet प्रतियोगिता के लिए मूल्यांकन पद्धति में से एक (1,000 श्रेणियों की छवियों को वर्गीकृत करें) शीर्ष -5 त्रुटि है, इसका क्या मतलब है? देखें: http://www.image-net.org/challenges/LSVRC/

9 machine-learning classification computer-vision

1

एलडीए को पूर्व-प्रसंस्करण कदम के रूप में उपयोग करते समय मानकीकरण सुविधाएँ

यदि एक बहु-श्रेणी रैखिक डिस्क्रिमिनेन्ट एनालिसिस (या मैं कभी-कभी मल्टीपल डिस्क्रिमिनेन्ट एनालिसिस भी पढ़ता हूं) का उपयोग डायमेंशन में कमी के लिए किया जाता है (या पीसीए के माध्यम से डायमेंशन में कमी के बाद ट्रांसफॉर्मेशन), तो मैं समझता हूं कि सामान्य तौर पर "जेड-स्कोर नॉर्मलाइजेशन" (या मानकीकरण) सुविधाएँ आवश्यक …

9 classification data-transformation normalization standardization discriminant-analysis

1

रैंडम फॉरेस्ट-स्केलेर में वर्गीकरण थ्रेसहोल्ड

1) मैं स्केलेर में रैंडम फ़ॉरेस्ट में वर्गीकरण थ्रेसहोल्ड (मुझे लगता है कि यह डिफ़ॉल्ट रूप से 0.5 है) कैसे बदल सकता है? 2) मैं स्केलेर में अंडर-सैंपल कैसे ले सकता हूं? 3) मेरे पास रैंडम फॉरेस्ट क्लासिफायर से निम्न परिणाम हैं: [[१६३५ १२ ९ 520] [५२० ३६२४]] precision recall …

9 classification random-forest precision-recall unbalanced-classes

3

तार्किक प्रतिगमन: सच्ची सकारात्मकता को अधिकतम करना - झूठी सकारात्मकता

मेरे पास एक लॉजिस्टिक रिग्रेशन मॉडल है (लोचदार नेट नियमितीकरण के साथ आर में glmnet के माध्यम से फिट), और मैं सच्चे सकारात्मक और झूठी सकारात्मक के बीच अंतर को अधिकतम करना चाहूंगा। ऐसा करने के लिए, निम्नलिखित प्रक्रिया दिमाग में आई: फ़िट मानक लॉजिस्टिक प्रतिगमन मॉडल 0.5 के रूप …

9 r regression logistic classification glmnet

2

वर्गीकरण प्रदर्शन माप जो संवेदनशीलता और विशिष्टता को जोड़ती है?

मेरे पास 2-लेबल वाले डेटा हैं, जिस पर मैं कई क्लासिफ़ायर का उपयोग करके वर्गीकरण कर रहा हूं। और डेटासेट अच्छी तरह से संतुलित हैं। क्लासिफायर के प्रदर्शन का आकलन करते समय, मुझे यह ध्यान रखना होगा कि क्लासिफायर न केवल सही सकारात्मकता का निर्धारण करने में कितना सही है, …

9 classification roc model-evaluation sensitivity-specificity

5

कक्षा लेबल के 100% के करीब होने पर एक क्लासिफायर के प्रदर्शन को कैसे मापें?

मेरे डेटा में, मेरे पास एक वर्ग चर है, जिसे रूप में दर्शाया गया । यह वर्ग चर मान (बाइनरी) हैं। लगभग सभी अवलोकन 0 हैं (100% के करीब, अधिक सटीक, 97%)। मैं विभिन्न वर्गीकरण मॉडल पर "प्रदर्शन" परीक्षण करना चाहूंगा (यह सटीकता हो सकती है)। मुझे ऐसा होने का …

9 classification binary-data model-evaluation

3

एलडीए बनाम परसेप्ट्रॉन

मैं यह जानने की कोशिश कर रहा हूं कि एलडीए अन्य पर्यवेक्षित शिक्षण तकनीकों के भीतर कैसे फिट बैठता है। एलडीए के बारे में मैंने यहां पहले ही एलडीए-एस्के के कुछ पोस्ट पढ़े हैं। मैं पहले से ही अवधारणात्मक से परिचित हूं, लेकिन अभी एलडीए सीख रहा हूं। एलडीए पर्यवेक्षित …

9 machine-learning classification discriminant-analysis supervised-learning

2

द्विआधारी वर्गीकरण समस्या के लिए किस SVM कर्नेल का उपयोग करना है?

मैं एक शुरुआत कर रहा हूँ जब यह वेक्टर मशीनों का समर्थन करने के लिए आता है। क्या कुछ दिशानिर्देश हैं जो कहते हैं कि कौन सी कर्नेल (जैसे रैखिक, बहुपद) एक विशिष्ट समस्या के लिए सबसे उपयुक्त है? मेरे मामले में, मुझे वेबपेजों को इस हिसाब से वर्गीकृत करना …

9 classification svm model-selection libsvm kernel-trick

1

घटना की भविष्यवाणी के लिए उत्तरजीविता विश्लेषण

मेरे डेटासेट में प्रत्येक रिकॉर्ड के लिए मेरे पास निम्न जानकारी है (X1 ,… ,Xm ,δ ,T )(X1 ,… ,Xm ,δ ,T ) (X_1 \ , \dots \ , X_m \ , \delta \ , T \ ) कहाँ पे XiXiX_i विशेषताएं हैं, δδ\delta यदि लक्ष्य घटना घटित होती है …

9 classification survival

2

संबंधपरक आंकड़ों से सीखना

सेटिंग्स कई एल्गोरिदम एक एकल संबंध या तालिका पर काम करते हैं, जबकि कई वास्तविक दुनिया डेटाबेस कई तालिकाओं (डोमिंगोस, 2003) में जानकारी संग्रहीत करते हैं। प्रश्न मल्टीपल (रिलेशनल) टेबल से किस प्रकार के एल्गोरिदम अच्छे से सीखते हैं। विशेष रूप से, मैं उन एल्गोरिदम में दिलचस्पी रखता हूं जो …

9 regression machine-learning classification dataset

1

मनाया बनाम अपेक्षित घटनाओं की तुलना कैसे करें?

मान लीजिए कि मेरे पास 4 संभावित घटनाओं की आवृत्तियों का एक नमूना है: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 और मुझे होने वाली मेरी घटनाओं की संभावित संभावनाएं हैं: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 मेरी चार …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

1

एक प्रमुख भविष्यवक्ता के साथ वर्गीकरण

मेरे पास एक (ककk-क्लास) वर्गीकरण समस्या, 100 वास्तविक-मूल्यवान भविष्यवक्ताओं के आदेश के साथ, जिनमें से एक में अन्य की तुलना में बहुत अधिक व्याख्यात्मक शक्ति है। मैं अन्य चर के प्रभावों में गहराई से जाना चाहता हूं। हालांकि, मानक मशीन सीखने की तकनीक (यादृच्छिक वन, एसवीएम, आदि) एक मजबूत भविष्यवक्ता …

9 machine-learning classification

2

वर्गीकरण के लिए प्रशिक्षण सेट से डुप्लिकेट निकालें

हम कहते हैं कि मेरे पास एक वर्गीकरण समस्या के लिए पंक्तियों का एक समूह है: X1,...XN,YX1,...XN,YX_1, ... X_N, Y कहाँ पे X1,...,XNX1,...,XNX_1, ..., X_N सुविधाएँ / भविष्यवाणियों और हैं YYY पंक्ति का फीचर संयोजन किस श्रेणी का है। कई फीचर संयोजन और उनकी कक्षाएं डेटासेट में दोहराई जाती हैं, …

9 machine-learning classification data-mining logistic stratification

2

एक समय श्रृंखला के शून्य माध्य भागों को खोजने के लिए अत्याधुनिक विधि (एस)

मेरे पास शोर की समय श्रृंखला है जिसे मुझे एक शून्य मतलब के साथ उन भागों में विभाजित करने की आवश्यकता है और उन शून्य भागों के बिना। सीमाओं को यथासंभव सटीक रूप से खोजना महत्वपूर्ण है (स्पष्ट रूप से जहां सीमा ठीक है, थोड़ा व्यक्तिपरक है)। मुझे लगता है …

9 time-series classification mean change-point

4

2 X 3 टेबल पर कई पोस्ट-हॉक ची-स्क्वायर टेस्ट कैसे करें?

मेरे डेटा सेट में तीन साइट प्रकारों, इंहोर, मिडचैनल और ऑफशोर में किसी भी जीव की कुल मृत्यु या जीवित रहने से संबंधित है। नीचे दी गई तालिका में संख्याएँ साइटों की संख्या को दर्शाती हैं। 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 मैं …

9 logistic multiple-comparisons chi-squared r text-mining clustering classification feature-selection unsupervised-learning time-series references mode hypothesis-testing confidence-interval bootstrap normal-distribution order-statistics correlation statistical-significance spss bayesian beta-binomial

classification पर टैग किए गए जवाब