feature-selection पर टैग किए गए जवाब

आगे मॉडलिंग में उपयोग के लिए विशेषताओं के सबसेट का चयन करने के तरीके और सिद्धांत

5
क्या हमें अभी भी रेग्युलराइजेशन एल्गोरिदम का उपयोग करते हुए फीचर चयन करने की आवश्यकता है?
मेरे पास सांख्यिकीय सीखने के एल्गोरिथ्म को चलाने से पहले सुविधा चयन विधियों (रैंडम फ़ॉरेस्ट्स फ़ीचर महत्व मान या Univariate सुविधा चयन विधियों आदि) का उपयोग करने की आवश्यकता के संबंध में एक प्रश्न है। हम जानते हैं कि ओवरफिटिंग से बचने के लिए हम वेट वैक्टर पर रेगुलराइजेशन पेनल्टी …

2
महत्व परीक्षण या क्रॉस सत्यापन?
सहसंबद्ध चर का चयन करने के लिए दो सामान्य दृष्टिकोण महत्व परीक्षण और क्रॉस सत्यापन हैं। प्रत्येक समस्या को क्या हल करने की कोशिश करता है और मैं एक दूसरे पर कब पसंद करूंगा?

2
LASSO वैरिएबल चयन के बाद OLS करना कैसे समझ में आता है?
हाल ही में मैंने पाया है कि लागू अर्थमिति साहित्य में, सुविधा चयन समस्याओं से निपटने के दौरान, चयनित चर का उपयोग करके ओएलएस प्रतिगमन के बाद LASSO प्रदर्शन करना असामान्य नहीं है। मैं सोच रहा था कि हम इस तरह की प्रक्रिया की वैधता कैसे प्राप्त कर सकते हैं। …

1
इस लस्सो साजिश (glmnet) से क्या निष्कर्ष निकाला जाए
निम्नलिखित डिफ़ॉल्ट अल्फा (1, इसलिए lasso) के साथ Glmnet की साजिश है, जिसमें mtcarsडेटा सेट का उपयोग mpgDV और अन्य के साथ भविष्यवक्ता चर के रूप में किया गया है। glmnet(as.matrix(mtcars[-1]), mtcars[,1]) विशेष रूप से am, cylऔर wt(लाल, काली और हल्की नीली रेखाओं) के संबंध में हम इस कथानक से …

2
लॉजिस्टिक रिग्रेशन में श्रेणीबद्ध भविष्यवक्ता का महत्व
मुझे लॉजिस्टिक रिग्रेशन में श्रेणीबद्ध चर के लिए z मानों की व्याख्या करने में परेशानी हो रही है। नीचे दिए गए उदाहरण में मेरे पास 3 वर्गों के साथ एक श्रेणीगत चर है और जेड मान के अनुसार, CLASS2 प्रासंगिक हो सकता है जबकि अन्य नहीं हैं। लेकिन अब इसका …

1
"फ़ीचर स्पेस" क्या है?
"फ़ीचर स्पेस" की परिभाषा क्या है? उदाहरण के लिए, एसवीएम के बारे में पढ़ते समय, मैं "स्पेसिंग फीचर की मैपिंग" के बारे में पढ़ता हूं। CART के बारे में पढ़ते समय, मैंने "स्पेसिंग फीचर के विभाजन" के बारे में पढ़ा। मैं समझता हूं कि क्या हो रहा है, विशेष रूप …

2
क्या LASSO उसी समस्याओं से पीड़ित है जो चरणबद्ध प्रतिगमन करती है?
स्टेपवाइज एल्गोरिदमिक वैरिएबल-सलेक्शन मेथड्स उन मॉडल्स के लिए सेलेक्ट होते हैं जो रिग्रेशन मॉडल्स में हर अनुमान को कम या ज्यादा आंकते हैं ( s और उनके SE, p -values, F आँकड़े इत्यादि), और सच्चे भविष्यवाणियों को बाहर करने की संभावना है एक उचित रूप से परिपक्व सिमुलेशन साहित्य के …

2
PCA, LASSO, लोचदार नेट की गति, कम्प्यूटेशनल व्यय
मैं हस्ती एट अल में प्रतिष्ठित के रूप में रैखिक प्रतिगमन के लिए तरीकों के तीन समूहों की कम्प्यूटेशनल जटिलता / आकलन की गति की तुलना करने की कोशिश कर रहा हूं। "सांख्यिकीय शिक्षा के तत्व" (दूसरा संस्करण), अध्याय 3: सबसेट का चयन संकोचन विधियाँ व्युत्पन्न इनपुट दिशाओं (पीसीआर, पीएलएस) …

1
मॉडल चयन में विरोधाभास (एआईसी, बीआईसी, समझाने या भविष्यवाणी करने के लिए?)
गैलीट श्मुइली के "टू एक्सप्लेन ऑर प्रेडिक्ट " (2010) को पढ़कर मैं एक स्पष्ट विरोधाभास से हैरान हूँ। तीन परिसर हैं, AIC- बनाम BIC- आधारित मॉडल की पसंद (पृष्ठ 300 का अंत - p। 301 की शुरुआत): सीधे शब्दों में कहें तो AIC को भविष्यवाणी के लिए बनाए गए मॉडल …

4
छवि रिज़ॉल्यूशन के आधार पर सुविधाओं की संख्या की गणना कैसे करें?
बस तंत्रिका Netowrks के एंड्रयू एनजी के गैर रेखीय हाइपोथीसिस कवर, और हम निर्धारित करने के लिए एक बहु विकल्प प्रश्न था सुविधाओं की संख्या संकल्प की एक छवि के लिए 100x100 का grescale तीव्रता। और उत्तर 50 मिलियन, x55510710710^7 हालांकि, पहले 50 x 50 पिक्सेल, ग्रे स्केल छवि के …

5
Cv.glmnet परिणामों में विविधता
मैं cv.glmnetभविष्यवक्ताओं को खोजने के लिए उपयोग कर रहा हूं । मेरे द्वारा उपयोग किया जाने वाला सेटअप इस प्रकार है: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] यह सुनिश्चित करने के परिणाम प्रतिलिपि प्रस्तुत करने योग्य मैं कर रहे हैं set.seed(1)। परिणाम अत्यधिक परिवर्तनशील हैं। मैं यह देखने के लिए कि …

3
क्या एक बहु-स्तरीय क्लासिफायरियर कई बाइनरी वाले की तुलना में बेहतर है?
मुझे URL को श्रेणियों में वर्गीकृत करना होगा। कहो कि मेरे पास 15 श्रेणियां हैं जिन्हें मैं हर URL को शून्य करने की योजना बना रहा हूं। क्या 15-रास्ता क्लासिफायर बेहतर है? जहां मेरे पास 15 लेबल हैं और प्रत्येक डेटा बिंदु के लिए सुविधाएं उत्पन्न करता है। या 15 …

5
यह समझना कि लॉजिस्टिक रिग्रेशन के लिए कौन सी विशेषताएँ सबसे महत्वपूर्ण थीं
मैंने एक लॉजिस्टिक रिग्रेशन क्लासिफ़ायर बनाया है जो मेरे डेटा पर बहुत सटीक है। अब मैं बेहतर तरीके से समझना चाहता हूं कि यह इतना अच्छा क्यों काम कर रहा है। विशेष रूप से, मैं रैंक करना चाहूंगा कि कौन सी सुविधाएँ सबसे बड़ा योगदान दे रही हैं (जो सुविधाएँ …

3
चर चयन के लिए लैस्सो का उपयोग करने के बाद इंजेक्शन
मैं अपेक्षाकृत कम आयामी सेटिंग (n >> p) में फीचर चयन के लिए लास्सो का उपयोग कर रहा हूं। एक लास्सो मॉडल फिट करने के बाद, मैं बिना किसी दंड के एक मॉडल को फिट करने के लिए नॉनज़रो गुणांक वाले कोवरिएट का उपयोग करना चाहता हूं। मैं ऐसा कर …

1
एक यादृच्छिक जंगल में, बड़ा% IncMSE बेहतर या बदतर है?
एक बार जब मैंने आर में (रिग्रेशन) रैंडम फॉरेस्ट मॉडल बनाया है, तो कॉल rf$importanceमुझे प्रत्येक प्रेडिक्टर चर के लिए दो उपाय प्रदान करता है, %IncMSEऔर IncNodePurity। क्या यह व्याख्या कि छोटे %IncMSEमूल्यों के साथ भविष्यवक्ता चर, बड़े %IncMSEमूल्यों वाले भविष्यवक्ता चर की तुलना में अधिक महत्वपूर्ण है ? कैसे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.