मैं संक्षेप में प्रस्तुत करने के लिए क्या मैं अब तक उच्च आयामी डेटा सेट के साथ दंडित मल्टीवेरिएट विश्लेषण में समझा कोशिश कर रहा हूँ, और मैं अभी भी का एक उचित परिभाषा हो रही के माध्यम से संघर्ष नरम थ्रेशोल्डिंग बनाम कमंद (या ) दण्डनीय ठहराए।
अधिक सटीक रूप से, मैंने जीनोमिक डेटा ( एकल न्यूक्लियोटाइड बहुरूपताओं सहित 2-ब्लॉक डेटा संरचना का विश्लेषण करने के लिए विरल पीएलएस प्रतिगमन का उपयोग किया , जहां हम एक संख्यात्मक चर के रूप में माने जाने वाले रेंज {0,1,2} में मामूली एलील की आवृत्ति पर विचार करते हैं) और निरंतर फेनोटाइप (स्कोरिंग व्यक्तित्व लक्षण या मस्तिष्क विषमता, निरंतर चर के रूप में भी माना जाता है)। अंतर-व्यक्तिगत फेनोटाइपिक विविधताओं को समझाने के लिए विचार सबसे प्रभावशाली भविष्यवक्ताओं (यहां, डीएनए अनुक्रम पर आनुवंशिक विविधताएं) को अलग करना था।
मैंने शुरू में मिक्समिक्स आर पैकेज (पूर्व में integrOmics
) का इस्तेमाल किया था जिसमें पीएलएस प्रतिगमन और सीसीए को नियमित करने की सुविधा थी । R कोड को देखते हुए, हमने पाया है कि भविष्यवक्ताओं में "स्पार्सिटी" केवल वें घटक, (एल्गोरिथ्म ) पर उच्चतम लोडिंग (पूर्ण मान में) के साथ शीर्ष वेरिएबल्स का चयन करके प्रेरित है। घटकों पर पुनरावृत्ति और गणना चर लोडिंग है , प्रत्येक पुनरावृत्ति पर पूर्वसूचक ब्लॉक को परिभाषित करते हुए , स्पार्स पीएलएस देखें : ओवलिक्स डेटा को एक सिंहावलोकन के लिए एकीकृत करते समय चर चयन )। इसके विपरीत, spls पैकेज एस Keleş सह-लेखक हैं (देखेंi i = 1 , … , k k L 1इन लेखकों द्वारा किए गए दृष्टिकोण के एक अधिक औपचारिक विवरण के लिए लिटर रिग्रेसमेंट सिमलियस डायमेंशन रिडक्शन और वैरिएबल सेलेक्शन के लिए होता है) पेनलिएशन के लिए -पीनेलाइजेशन को लागू ।
मेरे लिए यह स्पष्ट नहीं है कि क्या कोई सख्त "आक्षेप" है, इसलिए यह कहना है कि सॉफ्ट- और नियमितीकरण के आधार पर पुनरावृत्ति सुविधा चयन के बीच । तो मेरा सवाल है: क्या दोनों के बीच कोई गणितीय संबंध है?
संदर्भ
- चुन, एच। और केल, एस।, एस (2010), एक साथ आयाम में कमी और चर चयन के लिए आंशिक रूप से कम से कम वर्ग । रॉयल स्टैटिस्टिकल सोसाइटी जर्नल: सीरीज बी , 72 , 3–25।
- ले काओ, के। ए।, रोसौव, डी।, रॉबर्ट-ग्रेनी, सी।, और बेसे, पी। (2008), ए स्पार्स पीएलएस फॉर वेरिएबल सिलेक्शन जब इंटीग्रेटिंग ओमिक्स डेटा । आनुवांशिकी और आणविक जीवविज्ञान में सांख्यिकीय अनुप्रयोग , 7 , अनुच्छेद 35।