feature-selection पर टैग किए गए जवाब

आगे मॉडलिंग में उपयोग के लिए विशेषताओं के सबसेट का चयन करने के तरीके और सिद्धांत

2
रैंडम फ़ॉरेस्ट के साथ फ़ीचर चयन
मेरे पास ज्यादातर वित्तीय चर (120 विशेषताएं, 4k उदाहरण) के साथ एक डेटासेट है जो ज्यादातर अत्यधिक सहसंबद्ध और बहुत शोर (तकनीकी संकेतक, उदाहरण के लिए) हैं, इसलिए मैं मॉडल प्रशिक्षण (बाइनरी वर्गीकरण) के साथ अधिकतम 20-30 के बारे में चयन करना चाहूंगा - वृद्धि कमी)। मैं फीचर रैंकिंग के …

4
कम वर्गीकरण सटीकता, आगे क्या करना है?
इसलिए, मैं ML क्षेत्र में नौसिखिया हूं और मैं कुछ वर्गीकरण करने की कोशिश करता हूं। मेरा लक्ष्य एक खेल घटना के परिणाम की भविष्यवाणी करना है। मैंने कुछ ऐतिहासिक डेटा एकत्र किए हैं और अब एक क्लासिफायरियर को प्रशिक्षित करने का प्रयास करता हूं। मुझे लगभग 1200 नमूने मिले, …

1
एक लामर मॉडल के लिए किस बहुविध तुलना पद्धति का उपयोग किया जाता है: लसीन्स या ग्लेहट?
मैं एक मिश्रित प्रभाव मॉडल का उपयोग करके निर्धारित डेटा का विश्लेषण कर रहा हूं जिसमें एक निश्चित प्रभाव (स्थिति) और दो यादृच्छिक प्रभाव (विषय डिजाइन और जोड़ी के कारण प्रतिभागी) हैं। मॉडल lme4पैकेज के साथ उत्पन्न किया गया था exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp):। इसके बाद, मैंने निश्चित प्रभाव (स्थिति) के बिना मॉडल …

2
"एफ प्रतिगमन" और मूल्यों पर आधारित सुविधाओं के चयन के बीच अंतर ?
क्या F-regressionव्यक्तिगत रूप से लेबल के साथ सहसंबंधी विशेषताओं का उपयोग करके सुविधाओं की तुलना करना और मान का अवलोकन करना है ?R2R2R^2 मैंने अक्सर देखा है कि मेरे सहकर्मी F regressionअपनी मशीन लर्निंग पाइपलाइन में फ़ीचर चयन के लिए उपयोग करते हैं sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` कुछ कृपया मुझे बताएं - …

4
टेक्स्ट माइनिंग: आर्टिफिशियल इंटेलिजेंस के साथ टेक्स्ट (जैसे न्यूज आर्टिकल्स) को कैसे क्लस्टर किया जाए?
मैंने विभिन्न कार्यों के लिए कुछ न्यूरल नेटवर्क (MLP (पूरी तरह से जुड़े हुए), Elman (आवर्तक)) का निर्माण किया है, जैसे पोंग खेलना, हस्तलिखित अंकों और सामान को वर्गीकृत करना ... इसके साथ ही मैंने कुछ पहले कॉन्फिडेंशियल न्यूरल नेटवर्क बनाने की कोशिश की, जैसे कि मल्टी-डिजिट वाले हस्तलिखित नोटों …

1
गनी घटती है और गिन्नी अशुद्धता बच्चों की
मैं यादृच्छिक जंगल के लिए Gini सुविधा महत्व के उपाय पर काम कर रहा हूं। इसलिए, मुझे नोड की अशुद्धता में गिनी की कमी की गणना करने की आवश्यकता है। यहाँ मैं ऐसा कर रहा हूँ, जो परिभाषा के साथ संघर्ष की ओर ले जाता है, यह सुझाव देता है …

2
LASSO / LARS बनाम सामान्य से विशिष्ट (GETS) विधि
मैं सोच रहा था, क्यों LASSO और LARS मॉडल चयन के तरीके इतने लोकप्रिय हैं, भले ही वे मूल रूप से सौतेले वार फॉरवर्ड सिलेक्शन के भिन्नरूप हैं (और इस तरह पथ निर्भरता से पीड़ित हैं)? इसी तरह, मॉडल चयन के लिए जनरल टू स्पेसिफिक (GETS) के तरीकों को ज्यादातर …

5
छोटे नमूना नैदानिक ​​अध्ययन में मशीन सीखने की तकनीक का अनुप्रयोग
जब आप एक वर्गीकरण संदर्भ में दिलचस्प भविष्यवक्ताओं को अलग करना चाहते हैं, तो छोटे नमूना नैदानिक ​​अध्ययनों में रैंडम फ़ॉरेस्ट या दंडित प्रतिगमन (एल 1 या एल 2 दंड के साथ, या एक संयोजन) जैसी मशीन सीखने की तकनीक को लागू करने के बारे में आप क्या सोचते हैं? …

3
रैखिक क्लासिफायरियर के लिए, बड़े गुणांक अधिक महत्वपूर्ण विशेषताओं का संकेत देते हैं?
मैं एक सॉफ्टवेयर इंजीनियर हूँ जो मशीन लर्निंग पर काम कर रहा है। मेरी समझ से, लीनियर रिग्रेशन (जैसे ओएलएस) और लीनियर क्लासिफिकेशन (जैसे लॉजिस्टिक रिग्रेशन और एसवीएम) प्रशिक्षित गुणांकों के बीच एक आंतरिक उत्पाद के आधार पर एक भविष्यवाणी करते हैं और फीचर वैरिएबल → x :w⃗ w→\vec{w}एक्स⃗ एक्स→\vec{x} …

2
रैखिक एसवीएम के साथ निरंतर और द्विआधारी डेटा को मिलाकर?
इसलिए मैं एसवीएम के साथ खेल रहा हूं और मुझे आश्चर्य है कि क्या यह करना अच्छी बात है: मेरे पास निरंतर सुविधाओं का एक सेट (0 से 1) है और श्रेणीबद्ध विशेषताओं का एक सेट है जिसे मैंने डमी चर में परिवर्तित किया है। इस विशेष मामले में, मैं …

1
कैसे ची-वर्ग सुविधा चयन काम करता है?
मुझे पता है कि प्रत्येक फीचर-क्लास जोड़ी के लिए, ची-स्क्वायर स्टैटिस्टिक का मूल्य गणना किया जाता है और एक सीमा के मुकाबले तुलना की जाती है। ममmककk किसी भी स्पष्टीकरण बहुत सराहना की जाएगी। अग्रिम में धन्यवाद

5
क्या प्रशिक्षण डेटासेट पर केवल खोजपूर्ण डेटा विश्लेषण करना बेहतर है?
मैं डेटासेट पर खोजपूर्ण डेटा विश्लेषण (EDA) कर रहा हूं। फिर मैं एक आश्रित चर की भविष्यवाणी करने के लिए कुछ सुविधाओं का चयन करूंगा। सवाल यह है कि क्या मुझे अपने प्रशिक्षण डेटासेट पर EDA करना चाहिए? या क्या मुझे प्रशिक्षण और परीक्षण डेटासेट में शामिल होना चाहिए, फिर …

4
मशीन लर्निंग पाइप लाइन में फ़ीचर सेलेक्शन और हाइपरपैरिमेट ऑप्टिमाइज़ेशन का आदेश कैसे दिया जाना चाहिए?
मेरा उद्देश्य सेंसर संकेतों को वर्गीकृत करना है। मेरे समाधान की अब तक की अवधारणा है: i) कच्चे सिग्नल से इंजीनियरिंग सुविधाएँ ii) राहत के साथ प्रासंगिक सुविधाओं का चयन और क्लस्टरिंग दृष्टिकोण iii) एनएन, रैंडम फ़ॉरेस्ट और एसवीएम लागू करें हालांकि मैं एक दुविधा में फंसा हुआ हूं। Ii) …

3
बायेसियन चर चयन - क्या यह वास्तव में काम करता है?
मुझे लगा कि मैं एक अच्छा ब्लॉग पोस्ट और उसके साथ जुड़े कागजात के बाद , कुछ बायेसियन चर चयन के साथ खिलौना सकता हूं । मैंने rjags में एक कार्यक्रम लिखा था (जहां मैं काफी धोखेबाज़ हूं) और एक्सॉन मोबिल के लिए मूल्य डेटा प्राप्त किया , साथ ही …

1
आगे की स्टेजवाइज़ रिग्रेशन अल्गोरिदम क्या है?
शायद यह सिर्फ इतना है कि मैं थका हुआ हूं, लेकिन मुझे आगे की स्टेजवाइज रिग्रेशन एल्गोरिदम को समझने में परेशानी हो रही है। से "सांख्यिकीय लर्निंग के तत्वों" पृष्ठ 60: फ़ॉरवर्ड-स्टेजवाइज़ रिग्रेशन (FS) आगे-स्टेपवाइज़ रिग्रेशन की तुलना में और भी अधिक विवश है। यह आगे-स्टेपवाइज रिग्रेशन की तरह शुरू …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.