"सांख्यिकीय शिक्षा के तत्व" से तालिका 18.1 का पुन: प्रस्तुत करना


13

सांख्यिकीय लर्निंग के तत्वों में तालिका 18.1 एक 14 वर्ग डेटा सेट पर कई classifiers के प्रदर्शन को सारांशित करता है। मैं इस तरह के मल्टीस्कल्स वर्गीकरण समस्याओं के लिए लसो और लोचदार नेट के साथ एक नए एल्गोरिथ्म की तुलना कर रहा हूं।

glmnetएल1

ध्यान दें कि धारा १ ,.३ की शुरुआत में, पृष्ठ ६५४ पर, डेटा के कुछ प्रीप्रोसेसिंग का वर्णन किया गया है।

मैंने लेखकों से संपर्क किया है - अब तक प्रतिक्रिया के बिना - और मैं पूछता हूं कि क्या कोई भी पुष्टि कर सकता है कि तालिका को पुन: प्रस्तुत करने में कोई समस्या है या तालिका को पुन: पेश करने के तरीके पर एक समाधान प्रदान करें।


1
glmnet हाल ही में काफी बदलाव के दौर से गुजर रहा है और अतीत में संख्यात्मकता के साथ कुछ समस्याएं रही हैं। क्या यह संभवतः इसके कारण है? जबसे आपने लेखकों से संपर्क किया है? मैं वर्तमान संस्करण 1.7 देख रहा हूं और लगभग एक सप्ताह पहले ही CRAN में अपलोड किया गया था।
कार्डिनल

@कार्डिनल, ग्लमैनेट के साथ आखिरी प्रयोग करने के बाद मुझे लगभग चार सप्ताह हो गए, लेकिन हमारे पास एक अलग कार्यान्वयन है जो ईएसएल में तालिका के अनुरूप नहीं होने के समान परिणाम उत्पन्न करता है। तालिका निश्चित रूप से पुरानी है, इसलिए मेरा अनुमान है कि तालिका सही नहीं है, लेकिन निश्चित रूप से जानना अच्छा होगा।
एनआरएच

मैंने उन अनुभागों को बहुत संक्षेप में बताया और एक सवाल जो मेरे दिमाग में आया था कि पेज 661 (तीसरी प्रिंटिंग) पर (18.19) में सिकुड़न पैरामीटर को लेने के लिए क्रॉस सत्यापन कैसे किया गया था। कोई उपाय? शायद मैं इसे याद किया या यह कहीं और वर्णित है? यह एक संभावित जगह की तरह लगता है जहां आपके विश्लेषण को फिर से बनाने की कोशिशें दृष्टिकोण में अंतर के प्रति संवेदनशील हो सकती हैं।
कार्डिनल

@कार्डिनल, इसमें रुचि लेने के लिए पहला धन्यवाद। यह सही है कि CV फर्क कर सकता है, लेकिन लेखकों के पास डेटा के साथ वेब पेज पर CV के लिए उपयोग किए जाने वाले सबसेट (सूचक) हैं। वैसे भी, CV का उपयोग केवल इष्टतम पेनल्टी पैरामीटर लैम्ब्डा के चयन के लिए किया जाता है, फिर मॉडल को फिट करने के लिए पूरे प्रशिक्षण डेटा सेट का उपयोग किया जाता है, जो तब परीक्षण डेटा पर मूल्यांकन किया जाता है। इसलिए, भले ही CV स्टेप एक अलग लैम्ब्डा का चयन करता है, लैंबडा प्रशिक्षण डेटा के लिए समाधान पथ पर है, और हम इसे नहीं पा सकते हैं ...
NRH

जवाबों:


2

क्या आपने पुस्तक के आर पैकेज की जाँच की है ? इसमें सभी डेटासेट, फ़ंक्शन और अधिकांश स्क्रिप्ट शामिल हैं जिनका उपयोग वहां किया गया है ...


7
अच्छा प्रयास। हां, मैंने पैकेज की जांच की है, लेकिन यह दावा करते हुए कि इसमें सभी डेटा, फ़ंक्शन और अधिकांश स्क्रिप्ट शामिल हैं, एक अतिशयोक्ति है। यह पूर्ण नहीं है, और इसमें प्रश्न में निर्धारित डेटा शामिल नहीं है।
NRH
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.