feature-selection पर टैग किए गए जवाब

आगे मॉडलिंग में उपयोग के लिए विशेषताओं के सबसेट का चयन करने के तरीके और सिद्धांत

2
विसंगति का पता लगाने: क्या एल्गोरिथ्म का उपयोग करने के लिए?
संदर्भ: मैं एक ऐसी प्रणाली विकसित कर रहा हूं, जो कि टाइप करने योग्य डेटा को छानने के लिए नैदानिक ​​डेटा का विश्लेषण करती है जो कि टाइपोस हो सकती है। मैंने अब तक क्या किया: पठनीयता की मात्रा निर्धारित करने के लिए, मेरा अब तक का प्रयास डेटा को …

1
निर्णय वृक्ष चर (सुविधा) स्केलिंग और चर (सुविधा) सामान्यीकरण (ट्यूनिंग) किस कार्यान्वयन में आवश्यक है?
कई मशीन लर्निंग एल्गोरिदम में, फीचर स्केलिंग (उर्फ वैरिएबल स्केलिंग, नॉर्मलाइजेशन) विकिपीडिया - फ़ीचर स्केलिंग का एक सामान्य प्रीपोसिंग चरण है - यह प्रश्न करीब # 41704 था - सामान्यीकरण और फ़ीचर स्केलिंग का काम कैसे और क्यों होता है? निर्णय वृक्षों के संबंध में मेरे दो प्रश्न हैं: क्या …

3
क्या सुविधा चयन केवल प्रशिक्षण डेटा (या सभी डेटा) पर किया जाना चाहिए?
क्या सुविधा चयन केवल प्रशिक्षण डेटा (या सभी डेटा) पर किया जाना चाहिए? मैं गुयोन (2003) और सिंघी और लियू (2006) जैसे कुछ चर्चाओं और पत्रों के माध्यम से चला गया , लेकिन अभी भी सही उत्तर के बारे में निश्चित नहीं है। मेरा प्रयोग सेटअप इस प्रकार है: डेटासेट: …

3
मतलाब में आपसी जानकारी का उपयोग करके सुविधा का चयन
मैं चयन करने की सुविधा के लिए पारस्परिक जानकारी के विचार को लागू करने की कोशिश कर रहा हूं, जैसा कि इन व्याख्यान नोट्स (पृष्ठ 5 पर) में वर्णित है । मेरा मंच मतलब है। अनुभवजन्य डेटा से पारस्परिक जानकारी की गणना करते समय मुझे एक समस्या यह है कि …

1
बहुत बड़ी समय-श्रृंखला डेटासेट से निपटना
मेरी पहुंच बहुत बड़े डेटासेट तक है। डेटा चार लोगों में से एक से संगीत अंश सुनने वाले एमईजी रिकॉर्डिंग से है। डेटा इस प्रकार है: 6 विषय 3 प्रायोगिक दोहराव (युग) 120 परीक्षण प्रति युग 275 MEG चैनलों से 500Hz (= 4000 नमूने) पर परीक्षण के अनुसार 8 सेकंड …

4
आर में चर / सुविधा चयन करने के लिए क्रॉस सत्यापन का उपयोग करने का एक तरीका है?
मेरे पास लगभग 70 वैरिएबल के साथ एक डेटा सेट है जिसे मैं कट करना चाहूंगा। मैं जो करना चाह रहा हूं वह निम्नलिखित फैशन में सबसे उपयोगी चर खोजने के लिए सीवी का उपयोग करना है। 1) यादृच्छिक रूप से 20 वेरिएबल्स का चयन करें। 2) सबसे महत्वपूर्ण चर …

4
मधुमेह के एसवीएम वर्गीकरण में सुधार
मैं मधुमेह का अनुमान लगाने के लिए एसवीएम का उपयोग कर रहा हूं। मैं इस उद्देश्य के लिए BRFSS डेटा सेट का उपयोग कर रहा हूं । डेटा सेट में का आयाम है और तिरछा है। लक्ष्य चर में s का प्रतिशत जबकि शेष गठन है ।11 % 89 %432607 …

2
Nonparametric प्रतिगमन के लिए सुविधा चयन के सर्वोत्तम तरीके
एक नौसिखिया सवाल यहाँ। मैं वर्तमान में आर पैकेज में एनपी पैकेज का उपयोग करके एक गैरपारंपरिक प्रतिगमन कर रहा हूं। मेरे पास 7 विशेषताएं हैं और एक क्रूर बल दृष्टिकोण का उपयोग करके मैंने सबसे अच्छी पहचान की है 3. लेकिन, जल्द ही मेरे पास 7 से अधिक विशेषताएं …

1
सुविधाओं की अतिरेक की मात्रा कैसे निर्धारित करें?
मेरे पास तीन विशेषताएं हैं जो मैं वर्गीकरण समस्या को हल करने के लिए उपयोग करता हूं। मूल रूप से, इन विशेषताओं ने बूलियन मूल्यों का उत्पादन किया, इसलिए मैं सकारात्मक और नकारात्मक वर्गीकरणों के ओवरलैप को देखते हुए उनके अतिरेक का मूल्यांकन कर सकता था। अब मैंने इसके बजाय …

3
बायेसियन मॉडल चयन और विश्वसनीय अंतराल
मेरे पास तीन चरों वाला एक डेटासेट है, जहाँ सभी चर परिमाण हैं। इसे , और । मैं MCMC के माध्यम से एक Bayesian परिप्रेक्ष्य में एक प्रतिगमन मॉडल फिटिंग कर रहा हूंyyyx1x1x_1x2x2x_2rjags मैंने एक खोजपूर्ण विश्लेषण किया और सुझाव है कि एक द्विघात शब्द का उपयोग किया जाना चाहिए। …

3
स्किटिट लर्न के साथ फीचर सेलेक्शन के बाद फिल्टर्ड फीचर्स की पहचान करना
यहाँ पायथन में सुविधा चयन विधि के लिए मेरा कोड है : from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) लेकिन नया X (आश्रित चर - X_new) प्राप्त करने के …

2
चर महत्व यादृच्छिक सबसे नकारात्मक मान
मैं खुद से पूछ रहा हूं कि क्या प्रतिगमन संदर्भ में नकारात्मक चर महत्व मूल्य ("% IncMSE") के साथ उन चर को निकालना एक अच्छा विचार है। और अगर यह मुझे एक बेहतर भविष्यवाणी देता है? तुम क्या सोचते हो?

3
भविष्यवाणियों को कैसे कम करें लॉजिस्टिक रिग्रेशन मॉडल का सही तरीका
इसलिए मैं मॉडलिंग (F. Harrell की "प्रतिगमन मॉडलिंग रणनीतियाँ" दूसरों पर) के बारे में कुछ किताबें (या उनके कुछ हिस्सों) पढ़ रहा हूं, क्योंकि मेरी वर्तमान स्थिति अभी है कि मुझे बाइनरी प्रतिक्रिया डेटा के आधार पर एक लॉजिस्टिक मॉडल करने की आवश्यकता है। मेरे डेटा सेट में मेरे पास …

3
गहरी शिक्षा का उपयोग करके सुविधा का चयन?
मैं गहरे मॉडल का उपयोग करके प्रत्येक इनपुट सुविधा के महत्व की गणना करना चाहता हूं। लेकिन मुझे गहरी सीखने - गहरी सुविधा चयन का उपयोग करके फीचर चयन के बारे में केवल एक पेपर मिला । वे प्रत्येक फ़ीचर से जुड़ी नोड्स की एक परत सीधे पहली छिपी हुई …

2
क्या क्रॉस-वेलिडेशन से पहले असुरक्षित रूप से चयन करना वास्तव में ठीक है?
में सांख्यिकीय लर्निंग के तत्वों , मैं निम्नलिखित बयान मिल गया है: एक योग्यता है: नमूनों को छोड़ दिए जाने से पहले प्रारंभिक अनचाहे स्क्रीनिंग चरण किए जा सकते हैं। उदाहरण के लिए, हम क्रॉस-सत्यापन शुरू करने से पहले, सभी 50 नमूनों में उच्चतम विचरण वाले 1000 भविष्यवाणियों का चयन …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.