मैं एक डाटासेट के लिए गुणांक के सिकुड़े हुए अनुमानों को प्राप्त करने के लिए दंडित आर पैकेज का उपयोग कर रहा हूं जहां मेरे पास बहुत सारे भविष्यवक्ता हैं और जिनमें से महत्वपूर्ण हैं थोड़ा ज्ञान। जब मैंने ट्यूनिंग पैरामीटर L1 और L2 को चुना है और मैं अपने गुणांक से संतुष्ट हूं, तो क्या मॉडल को आर-स्क्वेरड जैसी किसी चीज के साथ फिट करने के लिए एक सांख्यिकीय ध्वनि तरीका है?
इसके अलावा, मैं मॉडल के समग्र महत्व (यानी R 0 = 0 करता है, या सभी = 0) का परीक्षण करने में रुचि रखता हूं।
मैंने यहां पूछे गए एक समान प्रश्न के उत्तर के माध्यम से पढ़ा है , लेकिन यह मेरे प्रश्न का काफी जवाब नहीं देता है। आर पैकेज पर एक उत्कृष्ट ट्यूटोरियल है जो मैं यहां उपयोग कर रहा हूं , और लेखक जेले गोमैन ने दंडित प्रतिगमन मॉडल से विश्वास अंतराल के बारे में ट्यूटोरियल के अंत में निम्नलिखित नोट किया था:
प्रतिगमन गुणांक या अन्य अनुमानित मात्रा के मानक त्रुटियों के लिए पूछना एक बहुत ही स्वाभाविक प्रश्न है। सिद्धांत रूप में ऐसी मानक त्रुटियों की गणना आसानी से की जा सकती है, उदाहरण के लिए बूटस्ट्रैप का उपयोग करना।
फिर भी, यह पैकेज जानबूझकर उन्हें प्रदान नहीं करता है। इसका कारण यह है कि दंडात्मक अनुमान विधियों से उत्पन्न होने वाले दृढ़ता से पक्षपाती अनुमानों के लिए मानक त्रुटियां बहुत सार्थक नहीं हैं। दंडित अनुमान एक ऐसी प्रक्रिया है जो पर्याप्त पूर्वाग्रह की शुरुआत करके अनुमानकर्ताओं के विचरण को कम करती है। प्रत्येक अनुमानक का पूर्वाग्रह इसलिए अपनी क्षुद्र त्रुटि का एक प्रमुख घटक है, जबकि इसका विचरण केवल एक छोटे से अंश में योगदान दे सकता है।
दुर्भाग्य से, दंडित प्रतिगमन के अधिकांश अनुप्रयोगों में पूर्वाग्रह का पर्याप्त सटीक अनुमान प्राप्त करना असंभव है। किसी भी बूटस्ट्रैप-आधारित कैल्स केवल अनुमानों के विचलन का आकलन दे सकते हैं। पूर्वाग्रह के विश्वसनीय अनुमान केवल उपलब्ध हैं यदि विश्वसनीय निष्पक्ष अनुमान उपलब्ध हैं, जो आमतौर पर उन स्थितियों में नहीं होता है जिनमें दंडित अनुमान का उपयोग किया जाता है।
एक दंडित अनुमान के मानक त्रुटि की रिपोर्ट करना इसलिए कहानी का केवल एक हिस्सा बताता है। यह पूर्वाग्रह के कारण होने वाली अशुद्धि को पूरी तरह से नजरअंदाज करते हुए, महान परिशुद्धता का गलत प्रभाव दे सकता है। यह निश्चित रूप से आत्मविश्वास बयान करने के लिए एक गलती है जो केवल अनुमानों के विचलन के आकलन पर आधारित है, जैसे कि बूटस्ट्रैप-आधारित आत्मविश्वास अंतराल करते हैं।