क्या किसी को प्रतिगमन मॉडल में शामिल करने के लिए विरल प्रमुख घटकों की संख्या का चयन करने के लिए दृष्टिकोण के साथ अनुभव है?
क्या किसी को प्रतिगमन मॉडल में शामिल करने के लिए विरल प्रमुख घटकों की संख्या का चयन करने के लिए दृष्टिकोण के साथ अनुभव है?
जवाबों:
जब मुझे आपके प्रश्न के बारे में प्रत्यक्ष जानकारी नहीं है, तो मैंने कुछ शोध पत्रों को चलाया , जो आपकी रुचि के हो सकते हैं। यह निश्चित रूप से, अगर मैं सही ढंग से समझता हूं कि आप विरल पीसीए , प्रमुख घटक प्रतिगमन और संबंधित विषयों के बारे में बात कर रहे हैं । उस स्थिति में, यहां कागजात हैं:
क्रॉस सत्यापन परिणाम भी LSI अंतरिक्ष के लिए आयाम की इष्टतम संख्या निर्धारित करने के लिए इस्तेमाल किया गया था। बहुत कम आयामों ने डेटा की भविष्यवाणी की शक्ति का लाभ नहीं उठाया; जबकि बहुत से आयामों का परिणाम ओवर-फिटिंग था। अंजीर। 4 LSI आयामों की विभिन्न संख्याओं वाले मॉडल के लिए औसत त्रुटियों के वितरण को दर्शाता है। चार आयामी LSI रिक्त स्थान के साथ मॉडल त्रुटियों की सबसे कम औसत संख्या और त्रुटियों की सबसे कम औसत संख्या दोनों का उत्पादन किया, इसलिए अंतिम मॉडल एक चार आयामी LSI अंतरिक्ष का उपयोग कर बनाया गया था।
मैं एक प्रतिलिपि पोस्ट कर सकते हैं अगर आप एक ieee सदस्य नहीं हैं।
यह एक कागज से है जिसे मैंने अंडरग्राउंड में लिखा था। मेरे पास एक समस्या थी जहां मुझे यह तय करने की आवश्यकता थी कि मेरे लॉजिस्टिक रिग्रेशन मॉडल में उपयोग करने के लिए कितने आयाम (अव्यक्त अर्थ इंडेक्सिंग पीसीए के समान हैं)। मैंने जो किया वह मीट्रिक था (यानी .5 की झंडोत्तोलन संभावना का उपयोग करते समय त्रुटि दर) और विभिन्न आयामों पर प्रशिक्षित विभिन्न मॉडलों के लिए इस त्रुटि दर के वितरण को देखा। मैंने तब सबसे कम त्रुटि दर वाले मॉडल को चुना। आप आरओसी वक्र के तहत क्षेत्र जैसे अन्य मैट्रिक्स का उपयोग कर सकते हैं।
आप अपने लिए आयामों की संख्या लेने के लिए स्टेप वाइज रिग्रेशन जैसी किसी चीज़ का उपयोग कर सकते हैं। आप किस प्रकार के प्रतिगमन को विशेष रूप से पसंद कर रहे हैं?
विरल btw से आपका क्या अभिप्राय है?