"सांख्यिकीय शिक्षा के तत्व" से तालिका 18.1 का पुन: प्रस्तुत करना

सांख्यिकीय लर्निंग के तत्वों में तालिका 18.1 एक 14 वर्ग डेटा सेट पर कई classifiers के प्रदर्शन को सारांशित करता है। मैं इस तरह के मल्टीस्कल्स वर्गीकरण समस्याओं के लिए लसो और लोचदार नेट के साथ एक नए एल्गोरिथ्म की तुलना कर रहा हूं।

glmnet $L_1$

ध्यान दें कि धारा १ ,.३ की शुरुआत में, पृष्ठ ६५४ पर, डेटा के कुछ प्रीप्रोसेसिंग का वर्णन किया गया है।

मैंने लेखकों से संपर्क किया है - अब तक प्रतिक्रिया के बिना - और मैं पूछता हूं कि क्या कोई भी पुष्टि कर सकता है कि तालिका को पुन: प्रस्तुत करने में कोई समस्या है या तालिका को पुन: पेश करने के तरीके पर एक समाधान प्रदान करें।

classification lasso glmnet

— NRH
स्रोत

glmnet हाल ही में काफी बदलाव के दौर से गुजर रहा है और अतीत में संख्यात्मकता के साथ कुछ समस्याएं रही हैं। क्या यह संभवतः इसके कारण है? जबसे आपने लेखकों से संपर्क किया है? मैं वर्तमान संस्करण 1.7 देख रहा हूं और लगभग एक सप्ताह पहले ही CRAN में अपलोड किया गया था।

— कार्डिनल

@कार्डिनल, ग्लमैनेट के साथ आखिरी प्रयोग करने के बाद मुझे लगभग चार सप्ताह हो गए, लेकिन हमारे पास एक अलग कार्यान्वयन है जो ईएसएल में तालिका के अनुरूप नहीं होने के समान परिणाम उत्पन्न करता है। तालिका निश्चित रूप से पुरानी है, इसलिए मेरा अनुमान है कि तालिका सही नहीं है, लेकिन निश्चित रूप से जानना अच्छा होगा।

— एनआरएच

मैंने उन अनुभागों को बहुत संक्षेप में बताया और एक सवाल जो मेरे दिमाग में आया था कि पेज 661 (तीसरी प्रिंटिंग) पर (18.19) में सिकुड़न पैरामीटर को लेने के लिए क्रॉस सत्यापन कैसे किया गया था। कोई उपाय? शायद मैं इसे याद किया या यह कहीं और वर्णित है? यह एक संभावित जगह की तरह लगता है जहां आपके विश्लेषण को फिर से बनाने की कोशिशें दृष्टिकोण में अंतर के प्रति संवेदनशील हो सकती हैं।

— कार्डिनल

@कार्डिनल, इसमें रुचि लेने के लिए पहला धन्यवाद। यह सही है कि CV फर्क कर सकता है, लेकिन लेखकों के पास डेटा के साथ वेब पेज पर CV के लिए उपयोग किए जाने वाले सबसेट (सूचक) हैं। वैसे भी, CV का उपयोग केवल इष्टतम पेनल्टी पैरामीटर लैम्ब्डा के चयन के लिए किया जाता है, फिर मॉडल को फिट करने के लिए पूरे प्रशिक्षण डेटा सेट का उपयोग किया जाता है, जो तब परीक्षण डेटा पर मूल्यांकन किया जाता है। इसलिए, भले ही CV स्टेप एक अलग लैम्ब्डा का चयन करता है, लैंबडा प्रशिक्षण डेटा के लिए समाधान पथ पर है, और हम इसे नहीं पा सकते हैं ...

— NRH

क्या आपने पुस्तक के आर पैकेज की जाँच की है ? इसमें सभी डेटासेट, फ़ंक्शन और अधिकांश स्क्रिप्ट शामिल हैं जिनका उपयोग वहां किया गया है ...

— user603
स्रोत

अच्छा प्रयास। हां, मैंने पैकेज की जांच की है, लेकिन यह दावा करते हुए कि इसमें सभी डेटा, फ़ंक्शन और अधिकांश स्क्रिप्ट शामिल हैं, एक अतिशयोक्ति है। यह पूर्ण नहीं है, और इसमें प्रश्न में निर्धारित डेटा शामिल नहीं है।

— NRH