feature-selection पर टैग किए गए जवाब

आगे मॉडलिंग में उपयोग के लिए विशेषताओं के सबसेट का चयन करने के तरीके और सिद्धांत

1
GAM बनाम लोड बनाम विभाजन
प्रसंग : मैं इसलिए मैं उपयोग कर रहा हूँ एक scatterplot कि पैरामीट्रिक प्रकट नहीं होता है में एक रेखा खींच करना चाहते हैं, geom_smooth()में ggplotमें R। यह स्वचालित रूप से रिटर्न करता है geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ …

1
डीप न्यूरल नेटवर्क्स में संवेदनशीलता विश्लेषण
पहले से ही एक प्रश्न का उत्तर देने के बाद ( वन-लेयर फीड-फॉरवर्ड नेटवर्क से वजन महत्व को हटाकर ) मैं तंत्रिका नेटवर्क में इनपुट की प्रासंगिकता के बारे में खोज रहा हूं। एक गहरी जाल को ध्यान में रखते हुए, जहां आउटपुट नोड ऑफ इंटरेस्ट से परतों के माध्यम …

1
बेइज़ियन लासो बनाम स्पाइक और स्लैब
प्रश्न: परिवर्तनीय चयन के लिए एक के बाद एक पूर्व उपयोग करने के क्या फायदे / नुकसान हैं? मान लीजिए मैं संभावना है: मैं कहाँ रख सकते हैं या तो महंतों में से एक: डब्ल्यू मैं ~ π δ 0 + ( 1 - π ) एन ( 0 , …

3
तंत्रिका नेटवर्क को सुविधा चयन / इंजीनियरिंग की आवश्यकता क्यों है?
विशेष रूप से कागल प्रतियोगिताओं के संदर्भ में मैंने देखा है कि मॉडल का प्रदर्शन फीचर चयन / इंजीनियरिंग के बारे में है। जबकि मैं पूरी तरह से समझ सकता हूं कि अधिक परंपरागत / पुराने-स्कूल एमएल एल्गोरिदम से निपटने के दौरान ऐसा क्यों होता है, मैं यह नहीं देखता …

2
लसो की तुलना में सबसे अच्छा सबसे अच्छा चयन क्यों नहीं किया जाता है?
मैं सांख्यिकीय सीखने की किताब के तत्वों में सर्वश्रेष्ठ सबसे अच्छा चयन के बारे में पढ़ रहा हूं। अगर मेरे पास 3 भविष्यवाणियां हैं , तो मैं सबसेट बनाता हूं :x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 कोई भविष्यवाणियों के साथ सबसेट साथ सबसेटx1x1x_1 साथ सबसेटx2x2x_2 भविष्यवक्ता साथ सबसेटx3x3x_3 भविष्यवाणियों के साथ सबसेटx1,x2x1,x2x_1,x_2 भविष्यवाणियों के साथx1,x3x1,x3x_1,x_3 …

2
परिवर्तनशील चयन के लिए विरोधी दृष्टिकोण: एआईसी, पी-मान या दोनों?
मैं जो समझता हूं, पी-मान (कम से कम प्रतिगमन संदर्भ में) के आधार पर चर चयन अत्यधिक त्रुटिपूर्ण है। ऐसा प्रतीत होता है कि AIC (या समान) पर आधारित चर चयन भी कुछ इसी तरह के कारणों से त्रुटिपूर्ण माना जाता है, हालांकि यह थोड़ा अस्पष्ट लगता है (उदाहरण के …

2
सुविधा चयन और आयामीता में कमी के बीच क्या अंतर है?
मुझे पता है कि दोनों सुविधाओं के चयन और आयामीता में कमी का उद्देश्य सुविधाओं के मूल सेट में सुविधाओं की संख्या को कम करना है। यदि हम दोनों में समान कार्य कर रहे हैं, तो दोनों में क्या अंतर है?

2
यदि p> n, तो lasso अधिकांश n चरों पर चुनता है
लोचदार जाल के लिए प्रेरणा में से एक LASSO की निम्नलिखित सीमा थी: में p>np>np > n मामला है, ज्यादा से ज्यादा लैसो चयन n चर यह पहले संतृप्त, उत्तल अनुकूलन समस्या की प्रकृति की वजह से। यह एक चर चयन विधि के लिए एक सीमित सुविधा है। इसके अलावा, …

1
रैंडम फॉरेस्ट में, पेड़ के स्तर के बजाय नोड स्तर पर सुविधाओं का एक यादृच्छिक सबसेट क्यों चुना जाता है?
मेरा प्रश्न: रैंडम फ़ॉरेस्ट प्रत्येक पेड़ के बजाय नोड स्तर पर बंटवारे के लिए सुविधाओं के यादृच्छिक सबसेट पर विचार क्यों करता है ? पृष्ठभूमि: यह एक इतिहास का सवाल है। टिन कम हो ने 1998 में प्रत्येक पेड़ को उगाने के लिए सुविधाओं के एक सबसेट का चयन करके …

2
क्या ऐसी कोई परिस्थितियां हैं जहां स्टेपवाइज रिग्रेशन का इस्तेमाल किया जाना चाहिए?
अतीत में कई बायोमेडिकल पेपर्स में स्टेपवाइज रिग्रेशन का इस्तेमाल किया गया था, लेकिन इसके कई मुद्दों की बेहतर शिक्षा के साथ इसमें सुधार हुआ है। कई पुराने समीक्षक हालांकि अभी भी इसके लिए पूछते हैं। ऐसी कौन सी परिस्थितियाँ हैं जहाँ स्टेप वाइज रिग्रेशन की भूमिका होती है और …

2
लसो के बजाय समूह लसो का उपयोग क्यों करें?
मैंने पढ़ा है कि समूह lasso का उपयोग चर चयन और चर के समूह में प्रसार के लिए किया जाता है। मैं इस दावे के पीछे के अंतर्ज्ञान को जानना चाहता हूं। समूह लासो को लासो को क्यों पसंद किया जाता है? क्यों समूह lasso समाधान पथ टुकड़ा नहीं रैखिक …

1
LLE (स्थानीय रैखिक एम्बेडिंग) एल्गोरिथ्म के चरण बताएं?
मैं समझता हूं कि एलएलई के लिए एल्गोरिथ्म के पीछे मूल सिद्धांत तीन चरणों के होते हैं। कुछ मीट्रिक जैसे k-nn द्वारा प्रत्येक डेटा बिंदु के पड़ोस का पता लगाना। प्रत्येक पड़ोसी के लिए वेट खोजें, जो डेटा बिंदु पर पड़ोसी के प्रभाव को दर्शाता है। गणना की गई वज़न …

2
LASSO सहसंबद्ध भविष्यवक्ताओं का चयन कब करता है?
मैं निम्नलिखित कोड के साथ R में पैकेज 'लार्स' का उपयोग कर रहा हूं: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 …

2
इंटरेक्शन मॉडल में सबसे अच्छी विशेषताएं ढूँढना
मेरे पास उनके फीचर वैल्यू के साथ प्रोटीन की सूची है। एक नमूना तालिका इस तरह दिखती है: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 पंक्तियाँ प्रोटीन हैं और कॉलम विशेषताएं हैं। मेरे पास प्रोटीनों की एक सूची भी है जो आपस में बातचीत करते हैं; उदाहरण के लिए Protein3, Protein4 Protein1, …

3
क्लस्टरिंग संभावना वितरण - विधियों और मैट्रिक्स?
मेरे पास कुछ डेटा पॉइंट्स हैं, जिनमें से प्रत्येक में एग्लोमेरेटेड डिस्क्रीट परिणाम के 5 वैक्टर हैं, प्रत्येक वेक्टर के परिणाम एक अलग वितरण द्वारा उत्पन्न होते हैं, और विशिष्ट प्रकार जिनमें से मुझे यकीन नहीं है, मेरा सबसे अच्छा अनुमान वेइबुल है, आकार के पैरामीटर के आसपास कहीं न …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.