मेरे पास डेटा है जिसके लिए मैंने स्पीयरमैन सहसंबंध की गणना की और इसे प्रकाशन के लिए कल्पना करना चाहता हूं। निर्भर चर को रैंक किया गया है, स्वतंत्र चर नहीं है। जो मैं कल्पना करना चाहता हूं वह वास्तविक ढलान की तुलना में सामान्य प्रवृत्ति है, इसलिए मैंने स्वतंत्र को स्थान दिया और स्पीयरमैन सहसंबंध / प्रतिगमन लागू किया। लेकिन जब मैंने अपना डेटा प्लॉट किया और इसे अपनी पांडुलिपि में सम्मिलित करने वाला था, तो मैं इस कथन पर अड़ गया (अपनी वेबसाइट पर :
जब आप स्पीयरमैन रैंक सहसंबंध करते हैं तो आप विवरण या भविष्यवाणी के लिए एक प्रतिगमन रेखा का उपयोग कभी नहीं करेंगे, इसलिए प्रतिगमन रेखा के बराबर की गणना न करें ।
और बादमें
आप स्पीयरमैन रैंक सहसंबंध डेटा को उसी तरह से ग्राफ़ कर सकते हैं जैसे आप एक रेखीय प्रतिगमन या सहसंबंध के लिए करेंगे। हालांकि, ग्राफ पर एक प्रतिगमन लाइन मत डालो ; जब आप रैंक सहसंबंध के साथ इसका विश्लेषण करेंगे तो रेखीय प्रतिगमन रेखा को ग्राफ पर रखना भ्रामक होगा।
बात यह है कि, प्रतिगमन रेखाएं अलग नहीं हैं जब मैं स्वतंत्र रैंक नहीं करता हूं और पियर्सन सहसंबंध की गणना करता हूं । प्रवृत्ति समान है, लेकिन पत्रिकाओं में रंगीन ग्राफिक्स के लिए अत्यधिक शुल्क के कारण मैं मोनोक्रोम प्रतिनिधित्व के साथ गया था और वास्तविक डेटा अंक इतने अधिक ओवरलैप कर रहे हैं कि यह पहचानने योग्य नहीं है।
मैं इसके चारों ओर अपना काम कर सकता था, बेशक, दो अलग-अलग भूखंड बनाकर: डेटा बिंदुओं के लिए एक (रैंक) और प्रतिगमन लाइन के लिए एक (अनक्रैक्ड), लेकिन अगर यह पता चला कि मेरे द्वारा उद्धृत स्रोत गलत है या मुद्दा मेरे मामले में समस्याग्रस्त नहीं है, यह मेरे जीवन को आसान बना देगा। (मैंने भी यह प्रश्न देखा , लेकिन इसने मेरी मदद नहीं की।)
अतिरिक्त जानकारी के लिए संपादित करें:
एक्स-अक्ष पर स्वतंत्र चर सुविधाओं की संख्या का प्रतिनिधित्व करता है और वाई-अक्ष पर आश्रित चर रैंक का प्रतिनिधित्व करता है यदि उनके प्रदर्शन की तुलना में वर्गीकरण एल्गोरिदम। अब मेरे पास कुछ एल्गोरिदम हैं जो औसत पर तुलनीय हैं, लेकिन मैं अपने प्लॉट के साथ जो कहना चाहता हूं वह कुछ इस तरह है: "जबकि क्लासिफायर ए बेहतर हो जाता है और अधिक सुविधाएँ मौजूद होती हैं, कम सुविधाओं के मौजूद होने पर क्लासिफायर बी बेहतर होता है"
मेरे भूखंडों को शामिल करने के लिए 2 संपादित करें:
एल्गोरिदम की रैंक सुविधाओं की संख्या बनाम प्लॉट की गई
एल्गोरिदम के रैंक रैंक बनाम सुविधाओं की संख्या
इसलिए, शीर्षक से प्रश्न को दोहराने के लिए:
क्या स्पीयरमैन सहसंबंध / प्रतिगमन के रैंक किए गए डेटा के लिए एक प्रतिगमन रेखा की साजिश करना ठीक है?