मैंने आंशिक निर्भरता भूखंडों पर अन्य विषयों के माध्यम से पढ़ा है और उनमें से अधिकांश इस बात पर हैं कि आप वास्तव में उन्हें अलग-अलग पैकेजों के साथ कैसे प्लॉट करते हैं, न कि आप कैसे उनकी सही व्याख्या कर सकते हैं, इसलिए:
मैं आंशिक निर्भरता भूखंडों की उचित मात्रा में पढ़ रहा हूं और बना रहा हूं। मुझे पता है कि वे मेरे मॉडल से अन्य सभी चर ()c) के औसत प्रभाव के साथ फ़ंक्शन χS ()S) पर एक चर thes के सीमांत प्रभाव को मापते हैं। उच्च y मान का मतलब है कि उनका मेरी कक्षा की सटीक भविष्यवाणी करने पर अधिक प्रभाव है। हालाँकि, मैं इस गुणात्मक व्याख्या से संतुष्ट नहीं हूँ।
मेरा मॉडल (यादृच्छिक वन) दो विचारशील वर्गों की भविष्यवाणी कर रहा है। "हाँ पेड़" और "पेड़ नहीं"। TRI एक ऐसा चर है जो इसके लिए एक अच्छा चर साबित हुआ है।
जो मैं सोचने लगा कि वाई मान सही वर्गीकरण के लिए एक संभावना दिखा रहा है। उदाहरण: y (0.2) दिखा रहा है कि ~ ~ 30 के TRI मानों में ट्रू पॉजिटिव वर्गीकरण की सही पहचान करने की 20% संभावना है।
जहां इसके विपरीत
y (-0.2) दिखा रहा है कि <~ 15 के TRI मानों में ट्रू निगेटिव वर्गीकरण की सही पहचान करने की 20% संभावना है।
सामान्य व्याख्याएं जो साहित्य में की जाती हैं, यह इस तरह की ध्वनि होगी "टीआरआई 30 से अधिक के मूल्य आपके मॉडल में वर्गीकरण के लिए सकारात्मक प्रभाव डालते हैं" और यही है। यह एक भूखंड के लिए इतना अस्पष्ट और व्यर्थ लगता है जो संभवतः आपके डेटा के बारे में इतना बोल सकता है।
इसके अलावा, मेरे सभी प्लॉट्स y- अक्ष के लिए -1 से 1 तक की सीमा में हैं। मैंने अन्य भूखंडों को देखा है जो -10 से 10 आदि हैं। क्या यह इस बात का एक कार्य है कि आप कितने वर्गों की भविष्यवाणी करने की कोशिश कर रहे हैं?
मैं सोच रहा था कि क्या कोई इस समस्या से बात कर सकता है। शायद मुझे दिखाओ कि कैसे मुझे इन भूखंडों या कुछ साहित्य की व्याख्या करनी चाहिए जो मेरी मदद कर सकते हैं। शायद मैं इसमें बहुत दूर पढ़ रहा हूँ?
मैंने बहुत अच्छी तरह से पढ़ा है सांख्यिकीय शिक्षा के तत्व: डेटा खनन, अनुमान और भविष्यवाणी और यह एक महान प्रारंभिक बिंदु रहा है लेकिन इसके बारे में है।