जब मैंने कुछ उदाहरणों को चलाया, तो rho के लिए p-मान और रैंक के पियर्सन सहसंबंध के टी-टेस्ट के लिए हमेशा मिलान किया, पिछले कुछ अंकों के लिए सहेजें
अच्छा तो आप गलत उदाहरण चला रहे हैं!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
वैक्टर a
और b
एक अच्छा है, लेकिन सही रैखिक (पियर्सन) सहसंबंध से दूर है। हालांकि, उनके पास सही रैंक सहसंबंध है। देखें - स्पीयरमैन के लिएρइस मामले में, यह मायने नहीं रखता कि अंतिम अंक b
8.1, 9, 90 या 9000 है (इसे आज़माएं!), यह तभी मायने रखता है जब यह 8 से बड़ा हो । यही कारण है कि एक अंतर सहसंबद्ध रैंक बनाता है।
इसके विपरीत, जबकि a
और b
सही रैंक सहसंबंध है, उनका पियर्सन सहसंबंध गुणांक 1 से छोटा है। यह दर्शाता है कि पियर्सन सहसंबंध रैंक को प्रतिबिंबित नहीं कर रहा है।
एक पियर्सन सहसंबंध एक रेखीय कार्य को दर्शाता है, एक रैंक सहसंबंध बस एक मोनोटोनिक फ़ंक्शन। सामान्य डेटा के मामले में, दोनों दृढ़ता से एक दूसरे से मिलते जुलते होंगे, और मुझे इस बात पर संदेह है कि आपके डेटा में स्पीयरमैन और पीयरसन के बीच बड़े अंतर नहीं दिखाई देते हैं।
एक व्यावहारिक उदाहरण के लिए, निम्नलिखित पर विचार करें; आप देखना चाहते हैं कि क्या लम्बे लोग अधिक वजन करते हैं। हां, यह एक मूर्खतापूर्ण सवाल है ... लेकिन यह मानकर चलिए कि आपको क्या परवाह है। अब, द्रव्यमान वजन के साथ रैखिक रूप से पैमाने पर नहीं होता है, क्योंकि छोटे लोगों की तुलना में लंबे लोग भी व्यापक होते हैं; इतना वजन ऊंचाई का एक रैखिक कार्य नहीं है । कोई है जो आप की तुलना में 10% लंबा है (औसतन) 10% से अधिक भारी है। यही कारण है कि शरीर / द्रव्यमान सूचकांक घन का उपयोग भाजक में करता है।
नतीजतन, आप एक रैखिक संबंध को गलत तरीके से ऊंचाई / वजन संबंध को प्रतिबिंबित करेंगे। इसके विपरीत, रैंक सहसंबंध इस मामले में भौतिकी और जीव विज्ञान के कष्टप्रद कानूनों के प्रति असंवेदनशील है; यह प्रतिबिंबित नहीं करता है कि लोग ऊंचाई में बड़े पैमाने पर रैखिक रूप से बढ़ते हैं, यह केवल यह दर्शाता है कि यदि लम्बे लोग (एक पैमाने पर रैंक में उच्च) भारी हैं (दूसरे पैमाने पर रैंक में उच्च)।
एक और अधिक विशिष्ट उदाहरण हो सकता है कि लाइकर्ट जैसी प्रश्नावली रैंकिंग, जैसे कि लोग "पूर्ण / अच्छा / सभ्य / औसत दर्जे का / बुरा / भयानक" के रूप में कुछ रेटिंग देते हैं। "परिपूर्ण" "सभ्य" से उतना ही दूर है जितना "सभ्य" पैमाने पर "बुरा" से है , लेकिन क्या हम वास्तव में कह सकते हैं कि दोनों के बीच की दूरी समान है? एक रैखिक सहसंबंध आवश्यक रूप से उचित नहीं है। रैंक सहसंबंध अधिक स्वाभाविक है।
अपने प्रश्न को सीधे संबोधित करने के लिए: नहीं, Pearson और Spearman सहसंबंधों के लिए p मानों की गणना अलग-अलग नहीं की जानी चाहिए । दोनों के बारे में बहुत अलग है, वैचारिक रूप से और साथ ही संख्यात्मक रूप से, लेकिन अगर परीक्षण सांख्यिकीय समान है, तो पी मूल्य बराबर होगा।
पियर्सन सहसंबंध में सामान्य की धारणा के सवाल पर, देखना यह ।
अधिक आम तौर पर, अन्य लोगों ने मैं पैरामीट्रिक बनाम गैर पैरामीट्रिक सहसंबंधों ( यहां भी देखें ) के विषय के बारे में बहुत कुछ बेहतर समझा है , और वितरण की धारणाओं के बारे में इसका मतलब क्या है।