थोड़ी और जानकारी; मान लो कि
- आप हाथ से पहले जानते हैं कि कितने चर का चयन करना है और आपने लार्स प्रक्रिया में जटिलता का दंड निर्धारित किया है जैसे कि ठीक 0 के साथ कई चर नं 0 गुणांक के साथ,
- संगणना लागत एक मुद्दा नहीं है (चर की कुल संख्या छोटी है, 50 का कहना है),
- कि सभी चर (y, x) निरंतर हैं।
LARS मॉडल (अर्थात LARS में गैर शून्य गुणांक वाले उन चर के ओएलएस फिट) को किस सेटिंग में समान गुणांक वाले मॉडल से सबसे अलग होगा, लेकिन संपूर्ण खोज (एक ला रीजर्सेट्स ()) के माध्यम से पाया जाएगा?
संपादित करें: मैं 50 चर और 250 प्रेक्षणों का उपयोग कर रहा हूं, जिसमें 10 के सिवाय एक मानक गाऊसी से निकाले गए वास्तविक गुणांक 0 के 'वास्तविक' गुणांक वाले (और सभी विशेषताओं को एक दूसरे के साथ दृढ़ता से सहसंबद्ध किया जा रहा है)। ये सेटिंग्स स्पष्ट रूप से अच्छी नहीं हैं क्योंकि चयनित चर के दो सेट के बीच अंतर मिनट हैं। यह वास्तव में एक सवाल है कि सबसे अधिक अंतर प्राप्त करने के लिए किस प्रकार के डेटा कॉन्फ़िगरेशन को अनुकरण करना चाहिए।