विशेष रूप से, मैं पियरसन उत्पाद-पल सहसंबंध गुणांक का उल्लेख कर रहा हूं।
विशेष रूप से, मैं पियरसन उत्पाद-पल सहसंबंध गुणांक का उल्लेख कर रहा हूं।
जवाबों:
और Y के बीच सहसंबंध और X से Y की भविष्यवाणी करने वाले एक रेखीय प्रतिगमन में क्या अंतर है ?
सबसे पहले, कुछ समानताएँ :
दूसरा, कुछ अंतर :
lm
और cor.test
में किया गया R
। समान पी-वैल्यू देगा।
यहाँ एक जवाब है जो मैंने graphpad.com वेबसाइट पर पोस्ट किया है :
सहसंबंध और रैखिक प्रतिगमन समान नहीं हैं। इन अंतरों पर विचार करें:
रैखिक प्रतिगमन के एकल पूर्वसूचक मामले में, मानकीकृत ढलान का सहसंबंध गुणांक के समान मूल्य है। रैखिक प्रतिगमन का लाभ यह है कि रिश्ते को इस तरह से वर्णित किया जा सकता है कि आप भविष्यवाणी कर सकते हैं (दो चर के बीच संबंध के आधार पर) पूर्वानुमानित चर पर स्कोर पूर्वसूचक चर के किसी विशेष मूल्य को देखते हुए। विशेष रूप से जानकारी का एक टुकड़ा एक रैखिक प्रतिगमन आपको देता है कि एक सहसंबंध अवरोधन नहीं है, पूर्वानुमानित चर पर मूल्य जब भविष्यवक्ता 0 होता है।
संक्षेप में - वे समान परिणाम का कम्प्यूटेशनल रूप से उत्पादन करते हैं, लेकिन अधिक तत्व हैं जो सरल रेखीय प्रतिगमन में व्याख्या करने में सक्षम हैं। यदि आप केवल दो चर के बीच संबंध की परिमाण को चिह्नित करने में रुचि रखते हैं, तो सहसंबंध का उपयोग करें - यदि आप उन विशेष मूल्यों के संदर्भ में अपने परिणामों की भविष्यवाणी या व्याख्या करने में रुचि रखते हैं जो आप शायद प्रतिगमन चाहते हैं।
सहसंबंध विश्लेषण केवल दो चर के बीच के संबंध को अनदेखा करता है जो निर्भर चर है और जो स्वतंत्र है। लेकिन appliyng प्रतिगमन से पहले आपको उस प्रभाव को शांत करना होगा जिस चर को आप दूसरे चर पर जांचना चाहते हैं।
अब तक दिए गए सभी उत्तर महत्वपूर्ण अंतर्दृष्टि प्रदान करते हैं, लेकिन यह नहीं भूलना चाहिए कि आप एक के मापदंडों को दूसरे में बदल सकते हैं:
इसलिए आप अपने मापदंडों को स्केलिंग और शिफ्ट करके दोनों को एक दूसरे में बदल सकते हैं।
R में एक उदाहरण:
y <- c(4.17, 5.58, 5.18, 6.11, 4.50, 4.61, 5.17, 4.53, 5.33, 5.14)
x <- c(4.81, 4.17, 4.41, 3.59, 5.87, 3.83, 6.03, 4.89, 4.32, 4.69)
lm(y ~ x)
##
## Call:
## lm(formula = y ~ x)
##
## Coefficients:
## (Intercept) x
## 6.5992 -0.3362
(m <- cov(y, x) / var(x)) # slope of regression
## [1] -0.3362361
cor(y, x) * sd(y) / sd(x) # the same with correlation
## [1] -0.3362361
mean(y) - m*mean(x) # intercept
## [1] 6.599196
अल्टमैन डीजी का हवाला देते हुए, "चिकित्सा अनुसंधान के लिए व्यावहारिक आँकड़े" चैपमैन एंड हॉल, 1991, पृष्ठ 321: "सहसंबंध एक डेटा की एक संख्या को कम करता है जो वास्तविक डेटा से कोई सीधा संबंध नहीं रखता है। प्रतिगमन एक बहुत अधिक महत्वपूर्ण विधि है। परिणाम जो स्पष्ट रूप से प्राप्त माप से संबंधित हैं। संबंध की ताकत स्पष्ट है, और अनिश्चितता आत्मविश्वास अंतराल या भविष्यवाणी अंतराल से स्पष्ट रूप से देखी जा सकती है "
प्रतिगमन विश्लेषण दो चर के बीच एक संबंध के प्रभाव के कारण का अध्ययन करने की एक तकनीक है। जबकि, सहसंबंध विश्लेषण दो चरों के बीच संबंध को निर्धारित करता है।
सहसंबंध रिश्ते की मजबूती का एक सूचकांक (सिर्फ एक संख्या) है। प्रतिगमन एक विशेष कार्यात्मक संबंध की पर्याप्तता का एक विश्लेषण (उनके महत्व के एक मॉडल और सांख्यिकीय परीक्षण के मापदंडों का आकलन) है। सहसंबंध का आकार इस बात से संबंधित है कि प्रतिगमन की भविष्यवाणियां कितनी सटीक होंगी।
सहसंबंध एक आंकड़े में एक शब्द है जो यह निर्धारित करता है कि क्या दो और फिर रिश्ते की डिग्री के बीच संबंध है। यह रेंज -1 से +1 तक है। जबकि प्रतिगमन का अर्थ है औसत की ओर वापस जाना। प्रतिगमन से हम एक चर पर निर्भर और अन्य स्वतंत्र रखकर मूल्य की भविष्यवाणी करते हैं लेकिन यह स्पष्ट करना चाहिए कि हम किस चर की भविष्यवाणी करना चाहते हैं।