क्या हम प्रतिगमन ढलानों की तुलना करके समूहों के बीच सहसंबंधों की तुलना कर सकते हैं?


10

में इस सवाल का वे दो स्वतंत्र समूहों के लिए पियर्सन आर तुलना करने के लिए (जैसे कि पुरुषों महिलाओं बनाम के रूप में) के लिए कहें। उत्तर और टिप्पणियों ने दो तरीके सुझाए:

  1. आर के "जेड-ट्रांसफॉर्मेशन" का उपयोग करके फिशर के प्रसिद्ध सूत्र का उपयोग करें;
  2. ढलानों (प्रतिगमन गुणांक) की तुलना का उपयोग करें।

उत्तरार्द्ध को केवल संतृप्त रैखिक मॉडल के माध्यम से आसानी से किया जा सकता है: Y=+एक्स+सीजी+एक्सजी, कहाँ पे एक्स तथा Y सहसंबद्ध चर हैं और जीएक डमी (0 बनाम 1) चर है जो दो समूहों को दर्शाता है। की परिमाण (इंटरेक्शन शब्द गुणांक) गुणांक में बिल्कुल अंतर है मॉडल के बाद Y=+एक्स व्यक्तिगत रूप से दो समूहों में आयोजित किया जाता है, और इसके (इस प्रकार महत्व समूहों के बीच ढलान में अंतर का परीक्षण है।

अब, ढलान या प्रतिगमन चट्टान। अभी तक सहसंबंध नहीं है। लेकिन अगर हम मानकीकरण करते हैंएक्स तथा Y- दो समूहों में अलग - अलगसमूह 0 में समूह 1 माइनस आर में अंतर आर के बराबर होगा और इसलिए इसका महत्व दो सहसंबंधों के बीच अंतर का परीक्षण करेगा: हम ढलानों का परीक्षण कर रहे हैं, लेकिन ऐसा प्रतीत होता है [जैसे कि?] हम सहसंबंधों का परीक्षण कर रहे हैं।

क्या मैंने सही लिखा है?

यदि हाँ, तो यह प्रश्न छोड़ दिया गया है कि सहसंबंधों की बेहतर परीक्षा क्या है - यह एक या फिशर का वर्णन है? क्योंकि वे समान परिणाम नहीं देंगे। तुम क्या सोचते हो?

बाद में संपादित करें: अपने उत्तर के लिए @Wolfgang को धन्यवाद देते हुए मुझे लगता है कि मैं यह समझने में चूक गया कि फिशर का परीक्षण ऊपर वर्णित ढलान-अंडर-मानकीकरण दृष्टिकोण की तुलना में r के लिए परीक्षण सही क्यों है। तो, अधिक जवाब का स्वागत है। धन्यवाद।

जवाबों:


10

आपने जो कुछ भी लिखा है वह सही है। आप हमेशा खिलौनों के उदाहरण के साथ चीजों का परीक्षण कर सकते हैं। यहाँ R के साथ एक उदाहरण दिया गया है:

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

आप क्या पाएंगे कि अंतःक्रिया अत्यधिक महत्वपूर्ण है, भले ही दोनों समूहों में सच्चा संबंध समान हो। ऐसा क्यों होता है? क्योंकि दो समूहों में कच्चे प्रतिगमन गुणांक न केवल सहसंबंध की ताकत को दर्शाते हैं, बल्कि दो समूहों में एक्स (और वाई) के स्केलिंग को भी दर्शाते हैं। चूंकि उन स्केलिंग में अंतर होता है, इसलिए बातचीत महत्वपूर्ण है। यह एक महत्वपूर्ण बिंदु है, क्योंकि यह अक्सर माना जाता है कि सहसंबंध में अंतर का परीक्षण करने के लिए, आपको बस ऊपर दिए गए मॉडल में इंटरैक्शन का परीक्षण करने की आवश्यकता है। आगे बढाते हैं:

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

यह आपको दिखाएगा कि दो समूहों में अलग-अलग फिट किए गए मॉडल के लिए प्रतिगमन गुणांक में अंतर आपको अंतःक्रिया शब्द के समान मूल्य देगा।

क्या हम वास्तव में रुचि रखते हैं हालांकि सहसंबंधों में अंतर है:

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

आप पाएंगे कि यह अंतर अनिवार्य रूप से शून्य है। आइए X और Y को दो समूहों में मानकीकृत करें और पूर्ण मॉडल को परिष्कृत करें:

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

ध्यान दें कि मैं यहां इंटरसेप्ट या ग्रुप मेन इफेक्ट सहित नहीं हूं, क्योंकि वे परिभाषा के अनुसार शून्य हैं। आप पाएंगे कि x के लिए गुणांक समूह 1 के लिए सहसंबंध के बराबर है और बातचीत के लिए गुणांक दो समूहों के लिए सहसंबंध के अंतर के बराबर है।

अब, आपके प्रश्न के लिए कि क्या इस दृष्टिकोण का उपयोग करना बेहतर होगा बनाम फिशर के आर-टू-जेड परिवर्तन का उपयोग करने वाले परीक्षण का उपयोग करना।

संपादित करें

जब आप समूहों के भीतर X और Y मानों का मानकीकरण करते हैं तो प्रतिगमन गुणांक के मानक त्रुटियां इस मानकीकरण को ध्यान में नहीं रखती हैं। इसलिए, वे सही नहीं हैं। तदनुसार, इंटरैक्शन के लिए टी-टेस्ट टाइप I त्रुटि दर को पर्याप्त रूप से नियंत्रित नहीं करता है। मैंने इसकी जांच के लिए एक सिमुलेशन अध्ययन किया। कबρ1=ρ2=0, तब टाइप I त्रुटि नियंत्रित होती है। हालाँकि, जबρ1=ρ20, तब टाइप I की टी-टेस्ट की त्रुटि अत्यधिक रूढ़िवादी हो जाती है (यानी, यह किसी दिए गए के लिए अक्सर अस्वीकार नहीं करता है αमूल्य)। दूसरी ओर, फिशर के आर-टू-जेड परिवर्तन का उपयोग करने वाला परीक्षण पर्याप्त रूप से प्रदर्शन करता है, भले ही दोनों समूहों में वास्तविक सहसंबंधों के आकार की परवाह किए बिना (जब समूह आकार बहुत छोटे होते हैं और दो समूहों में सही संबंध होते हैं के बहुत करीब हो±1

निष्कर्ष: यदि आप सहसंबंधों में अंतर के लिए परीक्षण करना चाहते हैं, तो फिशर के आर-टू-जेड परिवर्तन का उपयोग करें और उन मूल्यों के बीच अंतर का परीक्षण करें।


क्या फिशर ट्रांसफॉर्मेशन का अन्य परीक्षण पर कोई लाभ है?
mark999

पता चलता है कि मैं थोड़ा जल्दी था। मेरे संपादन देखें। कि उम्मीद है कि आपके सवाल का जवाब देना चाहिए।
वोल्फगैंग

तो, @Wolfgang, आप मानते हैं कि तुलना-की-ढलान-अंडर-मानकीकरण दृष्टिकोण आर की एक वैध तुलना है। फिशर का प्रसिद्ध विकल्प वास्तव में उसी का एक अनुमान है। क्या मैंने आपको सही समझा?
ttnphns 10

मेरे संपादन देखें। मैं अपने प्रारंभिक निष्कर्षों के साथ बहुत जल्दी था।
वोल्फगैंग

@Wolfgang, ने बाद में आपके उत्तर के EDIT में कहा कि फिशर बेहतर है। तुलना-की-ढलान-अंडर-मानकीकरण दृष्टिकोण अपर्याप्त है क्योंकि "मानक त्रुटियां ... जब आप मानकीकृत करते हैं ... तो इस मानकीकरण को ध्यान में न रखें"। कृपया मुझे समझाएं कि कैसे उन्हें मानकीकरण को ध्यान में रखना चाहिए ताकि तुलना-ढलान-अंडर-मानकीकरण दृष्टिकोण फिशर के परीक्षण के रूप में मान्य हो जाए।
ttnphns
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.