प्रशिक्षित तंत्रिका नेटवर्क के सहसंबंध को मापना


9

मैं गैर-सामान्य वितरित डेटा के साथ एक कृत्रिम तंत्रिका नेटवर्क (बैकप्रोपैजेशन, फीड-फ़ॉरवर्ड) का प्रशिक्षण दे रहा हूं। मूल माध्य चुकता त्रुटि के अलावा, साहित्य अक्सर प्रशिक्षित नेट की गुणवत्ता के मूल्यांकन के लिए पियर्सन सहसंबंध गुणांक का सुझाव देता है। लेकिन, क्या पियरसन सहसंबंध गुणांक उचित है, यदि प्रशिक्षण डेटा सामान्य रूप से वितरित नहीं किया गया है? क्या यह रैंक-आधारित सहसंबंध उपाय का उपयोग करने के लिए अधिक उचित नहीं होगा, उदाहरण के लिए स्पीयरमैन आरएचओ?


क्या आप इस बारे में विस्तार से बता सकते हैं कि कोई इसका उपयोग कैसे करेगा या एक संदर्भ देगा?
bayerj

जवाबों:


6

पियर्सन सहसंबंध गुणांक रैखिक संघ को मापता है। अनुभवजन्य दूसरे केंद्रीय क्षणों पर आधारित होने के कारण, यह अत्यधिक मूल्यों से प्रभावित होता है। इसलिए:

  • वास्तविक-बनाम-पूर्वानुमानित मानों के बिखराव में अस्वाभाविकता का प्रमाण रैंक सहसंबंध (स्पीयरमैन) गुणांक जैसे विकल्प का उपयोग करने का सुझाव देगा;

    • यदि संबंध औसत पर (जैसे चित्रण की ऊपरी पंक्ति में) मोनोटोनिक दिखता है, तो एक रैंक सहसंबंध गुणांक प्रभावी होगा;

    • अन्यथा, संबंध वक्रतापूर्ण है (जैसा कि उदाहरण के निचले पंक्ति से कुछ उदाहरणों में, सबसे बाईं या मध्य यू के आकार का एक के रूप में) और संभवतः सहसंबंध का कोई भी उपाय एक अपर्याप्त विवरण होगा; एक रैंक सहसंबंध गुणांक का उपयोग करने से यह ठीक नहीं होगा।

  • स्कैल्पप्लॉट में आउटलाइंग डेटा की उपस्थिति इंगित करती है कि पियर्सन सहसंबंध गुणांक रैखिक संबंध की ताकत को कम कर सकता है। यह सही हो भी सकता है और नहीं भी; उचित सावधानी के साथ इसका उपयोग करें। रैंक सहसंबंध गुणांक बेहतर हो सकता है या नहीं हो सकता है, इस पर निर्भर करता है कि बाहरी मान कितने विश्वसनीय हैं।

स्कैल्प्लॉट्स के उदाहरण और उनके पियर्सन सहसंबंध

( पियरसन उत्पाद-पल सहसंबंध गुणांक पर विकिपीडिया लेख से कॉपी की गई छवि ।)


क्या आप प्रतिगमन प्रदर्शन को मापने के लिए रैंक सहसंबंध का उपयोग करने के बारे में अपने बयान के लिए कुछ स्रोत दे सकते हैं?
शमौन कुआंग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.