कंप्रेस्ड सेंसिंग में, एक प्रमेय गारंटी है कि में एक अद्वितीय विरल समाधान है c (अधिक विवरण के लिए परिशिष्ट देखें)।
क्या लैस्सो के लिए एक समान प्रमेय है? यदि ऐसा कोई प्रमेय है, तो न केवल यह लसो की स्थिरता की गारंटी देगा, बल्कि यह लसो को और अधिक सार्थक व्याख्या प्रदान करेगा:
lasso विरल प्रतिगमन गुणांक वेक्टर कर सकता है जिसका उपयोग y = Xc द्वारा प्रतिक्रिया y उत्पन्न करने के लिए किया जाता है ।
इस सवाल के दो कारण हैं:
मुझे लगता है कि 'लस्सो एक विरल समाधान का पक्षधर है' फीचर चयन के लिए लसो का उपयोग करने का जवाब नहीं है क्योंकि हम यह भी नहीं बता सकते हैं कि हमारे द्वारा चुनी गई सुविधाओं का क्या लाभ है।
मैंने सीखा कि लैस्सो फीचर चयन के लिए अस्थिर होने के लिए कुख्यात है। व्यवहार में, हमें इसकी स्थिरता का मूल्यांकन करने के लिए बूटस्ट्रैप नमूने चलाने होंगे। इस अस्थिरता का सबसे महत्वपूर्ण कारण क्या है?
अनुबंध:
दिए गए । एक -sparse वेक्टर ( ) है। प्रक्रिया प्रतिक्रिया y उत्पन्न करता है । यदि पास आदेश \ Omega का NSP (रिक्त स्थान संपत्ति) है और X के सहसंयोजक मैट्रिक्स का शून्य के करीब कोई ईजेनवल्यू नहीं है, तो \ text {argmin} \ Vert c \ Vert_1 \\ \ text {विषय के लिए एक अनूठा समाधान होगा } y = Xc
यह प्रमेय जो बताता है वह यह भी है यदि ने ऑर्डर का NSP नहीं किया है , तो यह केवल को हल करने के लिए निराशाजनक है ।Ω argmin ग : y = एक्स सी ‖ ग ‖ 1
संपादित करें:
इन महान उत्तरों को प्राप्त करने के बाद, मुझे एहसास हुआ कि जब मैं यह सवाल पूछ रहा था तो मैं उलझन में था।
यह सवाल भ्रामक क्यों है:
मैंने एक शोध पत्र पढ़ा , जिसमें हमें यह तय करना है कि डिज़ाइन मैट्रिक्स में कितनी विशेषताएँ (कॉलम) हैं (प्राथमिक विशेषताओं को प्राथमिक सुविधाओं से बनाया गया है)। चूँकि यह एक विशिष्ट समस्या है, इसलिए का अच्छी तरह से निर्माण होने की उम्मीद है ताकि लसो का घोल असली विरल घोल का एक अच्छा सन्निकटन बन सके। एन < पी डी
तर्क उस प्रमेय से बनाया गया है जिसका मैंने परिशिष्ट में उल्लेख किया है: यदि हम एक -sparse सॉल्यूशन खोजने का लक्ष्य रखते हैं , तो का ऑर्डर का NSP बेहतर है ।सी एक्स Ω
सामान्य मैट्रिक्स के लिए, यदि का उल्लंघन होता है, तोएन > सी Ω एलएन एम
और से की कोई स्थिर और मजबूत वसूली संभव नहीं हैडी पी
एक्स पी वाई , मेल खाती है , से मेल खाती है
... जैसा कि संबंध से अपेक्षित है , डिस्क्रिप्टर का चयन अधिक अस्थिर हो जाता है, अर्थात, विभिन्न प्रशिक्षण सेटों के लिए, चयनित डिस्क्रिप्टर अक्सर अलग होता है ...
दूसरा उद्धरण वह हिस्सा है जो मुझे भ्रमित करता है। यह मुझे तब लगता है जब असमानता का उल्लंघन किया जाता है यह केवल समाधान नहीं है शायद गैर-अद्वितीय (उल्लेखित नहीं), लेकिन विवरणक भी अधिक अस्थिर हो जाएगा।