औसत सहसंबंध गुणांक का महत्व


11

डिस्क्लेमर: यदि आपको यह प्रश्न किसी दूसरे के समान लगता है, तो मैं इसके विलय से खुश हूं। हालांकि, मुझे कहीं और (और टिप्पणी या उत्थान के लिए "प्रतिष्ठा" नहीं है) एक संतोषजनक जवाब नहीं मिला, इसलिए मैंने सोचा कि खुद से एक नया सवाल पूछना सबसे अच्छा होगा।

मेरा सवाल यह है। 12 मानव विषयों में से प्रत्येक के लिए, मैंने एक स्वतंत्र चर एक्स के 6 स्तरों के बीच सहसंबंध गुणांक (स्पीयरमैन की आरएचओ) की गणना की है, और एक आश्रित चर वाई के संबंधित अवलोकन। (नोट: एक्स का स्तर विषयों के बराबर नहीं है।) मेरा। अशक्त परिकल्पना यह है कि सामान्य आबादी में, यह सहसंबंध शून्य के बराबर है। मैंने इस परिकल्पना का दो तरह से परीक्षण किया है:

  1. मेरे 12 विषयों से प्राप्त सहसंबंध गुणांक पर एक-नमूना टी-परीक्षण का उपयोग करना।

  2. X के मेरे स्तरों को ध्यान में रखते हुए और Y के अवलोकन जैसे कि प्रत्येक प्रतिभागी के लिए, माध्य (X) = 0 और माध्य (Y) = 0, और फिर समग्र डेटा पर एक सहसंबंध की गणना करना (X का 72 स्तर और Y का 72 अवलोकन) ।

अब, सहसंबंध गुणांक (यहां और अन्य जगहों पर) के साथ काम करने के बारे में पढ़ने से मुझे संदेह होने लगा है कि क्या पहला दृष्टिकोण वैध है। विशेष रूप से, मैंने कई समीकरणों को कई स्थानों पर देखा है, प्रस्तुत (जाहिरा तौर पर) औसत प्रवाल गुणांक के लिए एक टी-टेस्ट के रूप में:

t=rSEr=n21r2

जहां औसत सहसंबंध गुणांक होगा और (और चलो हम इस प्राप्त कर लिया है पर प्रति-विषय गुणांक पहले फिशर के परिवर्तन का उपयोग कर मान) n टिप्पणियों की संख्या। सहज रूप से, यह मुझे गलत लगता है क्योंकि इसमें विषय-वस्तु की परिवर्तनशीलता का कोई माप शामिल नहीं है। दूसरे शब्दों में, यदि मेरे 3 सहसंबंध गुणांक थे, तो मुझे वही टी-स्टेटिस्टिक मिलेगा, चाहे वे [0.1, 0.5, 0.9] या [0.45 0.5 0.55] या समान माध्य (और n = 3 ) वाले किसी भी मान होंrnn=3

मुझे संदेह है, इसलिए, कि उपरोक्त समीकरण वास्तव में सहसंबंध गुणांक के औसत के महत्व का परीक्षण करते समय लागू नहीं होता है, लेकिन जब 2 चर की टिप्पणियों के आधार पर एकल सहसंबंध गुणांक के महत्व का परीक्षण करते हैं ।n

यहाँ कोई भी इस अंतर्ज्ञान की पुष्टि कर सकता है या समझा सकता है कि यह गलत क्यों है? इसके अलावा, अगर यह फॉर्मूला मेरे मामले पर लागू नहीं होता है, तो क्या कोई सही दृष्टिकोण जानता है? या शायद मेरा अपना टेस्ट नंबर 2 पहले से ही मान्य है? किसी भी मदद की बहुत सराहना की जाती है (पिछले उत्तरों के संकेत सहित जो मुझे याद हो या गलत व्याख्या की गई हो)।


2
पियर्सन की केंद्रीकरण और स्केलिंग परिवर्तनों के प्रति असंवेदनशील है, इसलिए मुझे लगता है कि आपके प्रश्न को केंद्रित करना अप्रासंगिक है। उदाहरण के लिए, कोर ( एक्स , वाई ) = कोर ( एक्स , वाई - ˉ वाई ) = कोर ( एक्स , वाई + 1000 ) = कोर ( एक्स , वाई × 1000 )। आरX,YX,Y-Y¯एक्स,Y+1000एक्स,Y×1000
एलेक्सिस

मैं आपसे सहमत हुँ। इसलिए मैंने "प्रत्येक चर को एक साथ रखने से पहले अलग-अलग केंद्रित करने" के रूप में केंद्रित करने की व्याख्या की।
फेडरिको टेडेची

1
@FedericoTedeschi "प्रत्येक एक साथ रखने से पहले अलग-अलग चर को केंद्रित नहीं करता" क्या Y - means Y का अर्थ है? Y-Y¯
एलेक्सिस

@ एलेक्सिस मैंने अपने जवाब के तल पर आपको उत्तर दिया है (इसे टिप्पणी में लिखना बहुत लंबा होगा, और मुझे WYSINWYG समस्या के कारण इसे कई बार सही भी करना होगा)।
फेडेरिको टेडेस्की 20

जवाबों:


2

इस डेटा का विश्लेषण करने के लिए एक बेहतर तरीका (उर्फ मिश्रित प्रभाव मॉडल, श्रेणीबद्ध मॉडल) का उपयोग subjectयादृच्छिक प्रभाव (यादृच्छिक अवरोधन या यादृच्छिक अवरोधन + ढलान) के रूप में किया जाता है। मेरा एक अलग जवाब संक्षेप में प्रस्तुत करने के लिए :

यह अनिवार्य रूप से एक प्रतिगमन है जो उस रिश्ते को समूहों (मानव विषयों) के बीच अंतर करने की अनुमति देते हुए एकल संबंध बनाता है। यह दृष्टिकोण आंशिक पूलिंग से लाभ देता है और आपके डेटा का अधिक कुशलता से उपयोग करता है।


-1

मुझे लगता है कि चर ( 6 X 's और 6 Y ' s) सभी व्यक्तियों के लिए समान हैं (वास्तव में मुझे यकीन नहीं है कि मैं समझ गया हूं कि आपके कहने का मतलब यह है कि विषयों के स्तर समान नहीं हैं: मुझे आशा है कि आप हैं चर की श्रेणियों के बीच स्वतंत्रता के बारे में जिक्र करते हुए, जिसके बारे में प्रत्येक व्यक्ति के लिए चर नहीं मापा जाता है)। हां, आपके द्वारा दिखाया गया फॉर्मूला दो चर के बीच सहसंबंध गुणांक पर लागू होता है।126 X6 Y

अपनी बात 2 में, आप सामान्य करने के बारे में बात करते हैं: मुझे लगता है कि यह समझ में आता है अगर आपने इसे चर में से प्रत्येक के लिए अलग-अलग किया। हालांकि, फिर भी, इस दृष्टिकोण के साथ समस्या यह है कि यह व्यक्तिगत-निर्भरता के लिए नियंत्रित नहीं करता है।62

मेरा मानना ​​है कि आपका दृष्टिकोण 1 या तो मान्य नहीं है, क्योंकि यह केवल 10 डिग्री की स्वतंत्रता के साथ वितरण टी के साथ चर के बीच एक परीक्षण होगा , इसलिए मुझे नहीं लगता कि आप इस मामले में केंद्रीय सीमा प्रमेय को लागू कर सकते हैं।6t10

हो सकता है, बड़ी संख्या के साथ, आप एक यादृच्छिक प्रभाव दृष्टिकोण का उपयोग कर सकते हैं, एक यादृच्छिक ढलान के लिए अनुमति दे सकते हैं और साथ ही एक अशक्त औसत गुणांक ( पर Y i ) और एक यादृच्छिक गुणांक के गैर-अस्तित्व दोनों के लिए परीक्षण कर रहे हैं । मेरा मानना ​​है कि हालांकि 6 चर और 12 अवलोकन इसके लिए पर्याप्त नहीं हैं।XiYi

मेरा सुझाव है कि आप इसे 6 मानों पर परीक्षण के रूप में देखें (12 बनने पर यदि आप भी सहसंबंध मैट्रिक्स के नीचे के मानों पर विचार करते हैं) चर ( X और Y दोनों ) के बीच, यानी 2 के विकर्ण पर ( 3) चतुर्थांश के बराबर। इस प्रकार, मैं प्रतिबंधित और अप्रतिबंधित मॉडल के बीच संभावना अनुपात परीक्षण करूंगा।12XY

@Alexis मेरे समझ है कि केंद्रित , Y 1 , ... , वाई 6 , उन लोगों के साथ की जगह एक्स * 1 = एक्स 1 - ¯ एक्स 1 , ... , एक्स * 6 = एक्स 6 - ¯ एक्स 6 , वाई * 1 = Y 1 - ¯ Y 1 , ... , Y *X1,,X6Y1,,Y6 मतलब होता है (मुझे लगता है कि यह भी मतलब होगा उनके द्वारा विभाजित करने के लिए उनकेएस * मैं ,1मैं6रूप में यदि वे एक अद्वितीय चर की घटनाओं, और के लिए एक ही थेY * मैं ) सब एक के लिए होता है0मतलब। इसके विपरीत, यदि हम दो चर निर्माणएक्स,वाईपहले (विचार द्वारा बनाईएक्सX1=X1X1¯,,X6=X6X6¯,Y1=Y1Y1¯,,Y6=Y6Y6¯SE'एस)। इस तरह, चर और Y * (पर विचार के द्वारा बनाई गई एक्सXYXi,1i6Yi0X,Y रूप में यदि वे एक अद्वितीय चर की घटनाओं, और के लिए एक ही थे Y मैं ), तो निश्चित रूप से मतलब घटाकर (और यह भी की एसई से विभाजित की एक्स और वाई ) चीजों को बदलना नहीं होता।Xi,1i6YiXY

EDIT 01/01/18

चलो चर और संकेत मिलता है जे ( 1 जे 12 ) अलग-अलग। फिर, मान लीजिए कि हमारे पास है:ij1j12

;X1j=Y1j=10,j

;X2j=Y2j=8,j

;X3j=Y3j=6,j

;X4j=Y4j=4,j

;X5j=Y5j=2,j

X6j=Y6j=j,j

इस मामले में सहसंबंध होना चाहिए ।0.5428

हम के लिए प्रत्येक चर, कि दिए गए, केंद्र हैं , दोनों एक्स मैं और वाई मैं कोई भिन्नता है, हमने: एक्स * मैं j = Y * मैं1i5XiYi। के रूप मेंमैं=6, हम मूल्यों को प्राप्तएक्स * 6 j =j-6.5,वाई * जे 6 =(13-जे)-6.5=6.5-Xij=Yij=0i=6 (यानी, एक्स के लिए: - 5.5 , - 4.5 , - 3.5 , - 2.5 , - 1.5 1.5 वाई के) । के बाद से 0 = - 0 और जे - 6.5 = - ( 6.5 - जे ) , हम पाते हैं: एक्स *X6j=j6.5,Yj6=(13j)6.5=6.5jX , और वास्तव में के लिए विपरीत मैं j = - वाई *5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5Y0=0j6.5=(6.5j), का एक संबंध जिसका अर्थ है-1Xij=Yiji,jX=Y1


मैं आपसे सहमत हूं, अगर हम दूसरी प्रक्रिया का पालन करते हैं। इसलिए मेरा मानना ​​है कि रुबेन वैन बर्गन का मतलब था कि मैंने 1 प्रक्रिया में क्या वर्णित किया है। इस मामले में, हम है: , लेकिनcor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)आम तौर पर सच नहीं है। मैं अपनी पोस्ट को काउंटर-उदाहरण दिखाने के लिए संपादित कर रहा हूं।
फेडेरिको टेडेस्की

सहसंबंध देने वाले मूल्य इस प्रकार हैं: X = 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 8 , 8 , 8 , 8 , 8 , 8 , 8 , 8 , 8 , 8 , 8 , 6 , 6 ,0.5428 ; Y = 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 10 , 8 , 8 , 8X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12 । इससे कोई फर्क नहीं पड़ता कि सहसंबंध वास्तव में 0.5428 है या नहींY=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.5428, क्योंकि यह स्पष्ट रूप से अलग है 1
फेडरिको टेडेस्की

के बीच संबंध और एक्स * = 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 ,0 ,X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5 है - । तथ्य जो आप कहते हैं कि X = 1 ,X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51 और Y = 12 , ... , 1 सुराग के लिए सी आर ( एक्स , वाई ) = सी आर ( एक्स * ,X=1,,12Y=12,,1 सत्य है, लेकिन यह केवल सच है इसका मतलब है कि c o r ( X i)cor(X,Y)=cor(X,Y)=1 , कुछ मैं पहले से ही लिखा है है। cor(Xi,Yi)=cor(Xi,Yi)
फेडेरिको टेडेची

बेशक : इस रैखिक परिवर्तनों को सहसंबंध का निश्चरता का परिणाम है। यह कुछ ऐसा है जिस पर मैंने अपनी पहली टिप्पणी में पहले ही सहमति व्यक्त कर दी है, "मैं आपसे सहमत हूं। इसीलिए मैंने" प्रत्येक चर को एक साथ रखने से पहले अलग-अलग केंद्रित करते हुए "के रूप में व्याख्या की है।" - फेडेरिको टेडेस्की 27 दिसंबर 17 को 10:27 बजेcor(X;Y)=cor(XX¯;YY¯)
फेडेरिको। टेडेची

शायद, मुझे समझ में नहीं आता है कि "प्रत्येक चर को एक साथ रखने से पहले अलग-अलग केंद्रित करने का क्या मतलब है"। मेरे लिए, साधन एक्स 1 - ˉ एक्स , एक्स 2 - ˉ एक्सXX¯X1X¯,X2X¯,,XnX¯ कि "उन्हें एक साथ डालने से पहले अलग से प्रत्येक चर केंद्रित"। क्या आप हमारी स्पष्ट भिन्न समझ को समझने में मेरी मदद कर सकते हैं?
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.