सांख्यिकीय लर्निंग के तत्वों में तालिका 18.1 एक 14 वर्ग डेटा सेट पर कई classifiers के प्रदर्शन को सारांशित करता है। मैं इस तरह के मल्टीस्कल्स वर्गीकरण समस्याओं के लिए लसो और लोचदार नेट के साथ एक नए एल्गोरिथ्म की तुलना कर रहा हूं।
ध्यान दें कि धारा १ ,.३ की शुरुआत में, पृष्ठ ६५४ पर, डेटा के कुछ प्रीप्रोसेसिंग का वर्णन किया गया है।
मैंने लेखकों से संपर्क किया है - अब तक प्रतिक्रिया के बिना - और मैं पूछता हूं कि क्या कोई भी पुष्टि कर सकता है कि तालिका को पुन: प्रस्तुत करने में कोई समस्या है या तालिका को पुन: पेश करने के तरीके पर एक समाधान प्रदान करें।
1
glmnet हाल ही में काफी बदलाव के दौर से गुजर रहा है और अतीत में संख्यात्मकता के साथ कुछ समस्याएं रही हैं। क्या यह संभवतः इसके कारण है? जबसे आपने लेखकों से संपर्क किया है? मैं वर्तमान संस्करण 1.7 देख रहा हूं और लगभग एक सप्ताह पहले ही CRAN में अपलोड किया गया था।
—
कार्डिनल
@कार्डिनल, ग्लमैनेट के साथ आखिरी प्रयोग करने के बाद मुझे लगभग चार सप्ताह हो गए, लेकिन हमारे पास एक अलग कार्यान्वयन है जो ईएसएल में तालिका के अनुरूप नहीं होने के समान परिणाम उत्पन्न करता है। तालिका निश्चित रूप से पुरानी है, इसलिए मेरा अनुमान है कि तालिका सही नहीं है, लेकिन निश्चित रूप से जानना अच्छा होगा।
—
एनआरएच
मैंने उन अनुभागों को बहुत संक्षेप में बताया और एक सवाल जो मेरे दिमाग में आया था कि पेज 661 (तीसरी प्रिंटिंग) पर (18.19) में सिकुड़न पैरामीटर को लेने के लिए क्रॉस सत्यापन कैसे किया गया था। कोई उपाय? शायद मैं इसे याद किया या यह कहीं और वर्णित है? यह एक संभावित जगह की तरह लगता है जहां आपके विश्लेषण को फिर से बनाने की कोशिशें दृष्टिकोण में अंतर के प्रति संवेदनशील हो सकती हैं।
—
कार्डिनल
@कार्डिनल, इसमें रुचि लेने के लिए पहला धन्यवाद। यह सही है कि CV फर्क कर सकता है, लेकिन लेखकों के पास डेटा के साथ वेब पेज पर CV के लिए उपयोग किए जाने वाले सबसेट (सूचक) हैं। वैसे भी, CV का उपयोग केवल इष्टतम पेनल्टी पैरामीटर लैम्ब्डा के चयन के लिए किया जाता है, फिर मॉडल को फिट करने के लिए पूरे प्रशिक्षण डेटा सेट का उपयोग किया जाता है, जो तब परीक्षण डेटा पर मूल्यांकन किया जाता है। इसलिए, भले ही CV स्टेप एक अलग लैम्ब्डा का चयन करता है, लैंबडा प्रशिक्षण डेटा के लिए समाधान पथ पर है, और हम इसे नहीं पा सकते हैं ...
—
NRH