feature-selection पर टैग किए गए जवाब

आगे मॉडलिंग में उपयोग के लिए विशेषताओं के सबसेट का चयन करने के तरीके और सिद्धांत

2
रिज रिग्रेशन LASSO की तुलना में बेहतर व्याख्यात्मकता क्यों नहीं प्रदान कर सकता है?
मेरे पास पहले से ही रिज रिग्रेशन और LASSO के पेशेवरों और विपक्षों के बारे में एक विचार है। LASSO के लिए, L1 पेनल्टी शब्द एक विरल गुणांक वेक्टर निकलेगा, जिसे फीचर चयन विधि के रूप में देखा जा सकता है। हालाँकि, LASSO के लिए कुछ सीमाएँ हैं। यदि सुविधाओं …

2
क्या पी-वैल्यू के आधार पर सुविधाओं का चयन करना गलत है?
सुविधाओं का चयन कैसे करें के बारे में कई पोस्ट हैं। विधि में से एक टी-आँकड़ों के आधार पर विशेषता महत्व का वर्णन करता है। मानकीकृत सुविधाओं के varImp(model)साथ रैखिक मॉडल पर लागू आर में प्रत्येक मॉडल पैरामीटर के लिए टी-स्टेटिस्टिक का निरपेक्ष मूल्य उपयोग किया जाता है। तो, मूल …

1
परिवर्तनीय चयन बनाम मॉडल चयन
इसलिए मैं समझता हूं कि परिवर्तनीय चयन मॉडल चयन का एक हिस्सा है। लेकिन वास्तव में मॉडल के चयन में क्या शामिल है? क्या यह निम्नलिखित से अधिक है: 1) अपने मॉडल के लिए एक वितरण चुनें 2) व्याख्यात्मक चर चुनें? मैं यह पूछता हूं क्योंकि मैं एक लेख पढ़ …

5
शब्द आवृत्ति / उलटा दस्तावेज़ आवृत्ति (TF / IDF): भार
मुझे एक डेटासेट मिला है जो 1000 दस्तावेजों और उसमें दिखाई देने वाले सभी शब्दों का प्रतिनिधित्व करता है। इसलिए पंक्तियाँ दस्तावेजों का प्रतिनिधित्व करती हैं और कॉलम शब्दों का प्रतिनिधित्व करते हैं। उदाहरण के लिए, सेल में मान बार शब्द के लिए खड़ा है दस्तावेज़ में होता है । …

5
आर में फ़ीचर चयन पैकेज, जो प्रतिगमन और वर्गीकरण दोनों करते हैं
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। मैं आर के लिए बहुत नया हूं। मैं अभी मशीन लर्निंग सीख रहा हूं। बहुत खेद …

2
सुविधाओं की संख्या बढ़ने से प्रदर्शन कम क्यों हो जाता है?
मैं एक अंतर्ज्ञान हासिल करने की कोशिश कर रहा हूं कि क्यों सुविधाओं की संख्या बढ़ने से प्रदर्शन कम हो सकता है। मैं वर्तमान में एक एलडीए क्लासिफायर का उपयोग कर रहा हूं, जो कुछ विशेषताओं के बीच बेहतर रूप से बेहतर प्रदर्शन करता है, लेकिन अधिक सुविधाओं को देखते …

6
कौन सी मशीन लर्निंग एल्गोरिदम यह अनुमान लगाने के लिए अच्छा है कि कौन सी सुविधाएँ अधिक महत्वपूर्ण हैं?
मेरे पास न्यूनतम सुविधाओं के साथ डेटा है जो नहीं बदलते हैं, और कुछ अतिरिक्त सुविधाएँ जो बदल सकती हैं और परिणाम पर बड़ा प्रभाव डालती हैं। मेरा डेटा-सेट इस तरह दिखता है: विशेषताएं ए, बी, सी (हमेशा मौजूद), और डी, ई, एफ, जी, एच (कभी-कभी मौजूद) हैं A = …

1
PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में
नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
आप प्रतिगमन मॉडल में चर का चयन कैसे करते हैं?
चर चयन के लिए पारंपरिक दृष्टिकोण उन चर को खोजना है जो एक नई प्रतिक्रिया की भविष्यवाणी करने में सबसे अधिक योगदान देते हैं। हाल ही में मुझे इसके विकल्प का पता चला। मॉडलिंग चर में जो एक उपचार के प्रभाव को निर्धारित करते हैं - उदाहरण के लिए एक …

2
डोमेन-अज्ञेय फीचर इंजीनियरिंग जो अर्थ अर्थ को बरकरार रखती है?
फ़ीचर इंजीनियरिंग अक्सर मशीन लर्निंग का एक महत्वपूर्ण घटक है ( 2010 में केडीडी कप जीतने के लिए इसका भारी उपयोग किया गया था )। हालाँकि, मुझे लगता है कि ज्यादातर इंजीनियरिंग तकनीकों की सुविधा है अंतर्निहित विशेषताओं के किसी भी सहज अर्थ को नष्ट करना या किसी विशेष डोमेन …

5
क्या मैं क्लस्टर विश्लेषण के लिए चर चयन करने के लिए पीसीए का उपयोग कर सकता हूं?
मुझे क्लस्टर विश्लेषण करने के लिए चर की संख्या कम करनी होगी। मेरे चर दृढ़ता से सहसंबद्ध हैं, इसलिए मैंने एक कारक विश्लेषण पीसीए (प्रमुख घटक विश्लेषण) करने के लिए सोचा । हालांकि, यदि मैं परिणामी अंकों का उपयोग करता हूं, तो मेरे क्लस्टर सही नहीं हैं (साहित्य में पिछले …

4
LASSO मॉडल में Iteratively रीवेटेड लिस्ट स्क्वायर (IRLS) पद्धति को कैसे लागू करें?
मैंने IRLS एल्गोरिथ्म का उपयोग करके एक लॉजिस्टिक रिग्रेशन प्रोग्राम किया है । मैं स्वचालित रूप से सही सुविधाओं का चयन करने के लिए एक LASSO दंड लागू करना चाहूंगा । प्रत्येक पुनरावृत्ति पर, निम्न हल किया जाता है: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Let एक गैर-नकारात्मक वास्तविक संख्या है। मैं तत्वों के …

4
फीचर चयन के लिए लैस्सो के अस्थिर होने का क्या कारण है?
कंप्रेस्ड सेंसिंग में, एक प्रमेय गारंटी है कि में एक अद्वितीय विरल समाधान है c (अधिक विवरण के लिए परिशिष्ट देखें)।argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc ccc क्या लैस्सो के लिए एक समान प्रमेय है? यदि ऐसा कोई प्रमेय है, तो न …

2
यादृच्छिक वन के लिए कैरेट के साथ फ़ीचर चयन और पैरामीटर ट्यूनिंग
मेरे पास कुछ हजार विशेषताओं के साथ डेटा है और मैं अनइनफॉर्मेटिव को हटाने के लिए पुनरावर्ती सुविधा चयन (RFE) करना चाहता हूं। मैं यह कार्यवाहक और RFE के साथ करता हूं । हालांकि, मैंने सोचना शुरू कर दिया, अगर मैं सबसे अच्छा प्रतिगमन फिट होना चाहता हूं (यादृच्छिक वन, …

1
रैखिक समारोह सन्निकटन के साथ क्यू-मूल्यों में भार कैसे फिट करें
सुदृढीकरण सीखने में, रैखिक फ़ंक्शन सन्निकटन का उपयोग अक्सर तब किया जाता है जब बड़े राज्य स्थान मौजूद होते हैं। (जब देखो टेबल बेवफा हो जाते हैं।) रैखिक फ़ंक्शन सन्निकटन के साथ मान का रूप द्वारा दिया गया हैQ−Q−Q- Q(s,a)=w1f1(s,a)+w2f2(s,a)+⋯,Q(s,a)=w1f1(s,a)+w2f2(s,a)+⋯,Q(s,a) = w_1 f_1(s,a) + w_2 f_2(s,a) + \cdots, जहां wiwiw_i …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.