क्या पीयर्सन के सहसंबंध परीक्षण के लिए पी-मूल्यों को केवल सहसंबंध गुणांक और नमूना आकार से गणना की जा सकती है?


12

पृष्ठभूमि: मैंने एक लेख पढ़ा जहां लेखक पियरसन सहसंबंध 0.754 को नमूना आकार 878 से रिपोर्ट करते हैं। सहसंबंध परीक्षण के लिए परिणामी पी-मान "दो सितारा" महत्वपूर्ण है (यानी p <0.01)। हालाँकि, मुझे लगता है कि इतने बड़े सैंपल साइज़ के साथ, संबंधित पी-वैल्यू 0.001 (यानी तीन स्टार महत्वपूर्ण) से कम होना चाहिए।

  • क्या इस परीक्षण के लिए पी-वैल्यू की गणना केवल पीयरसन सहसंबंध गुणांक और नमूना आकार से की जा सकती है?
  • यदि हाँ, तो R में यह कैसे किया जा सकता है?

जवाबों:


14

हां, यह किया जा सकता है, यदि आप फिशर के आर-टू-जेड परिवर्तन का उपयोग करते हैं। अन्य तरीकों (जैसे बूटस्ट्रैप) के कुछ फायदे हो सकते हैं लेकिन मूल डेटा की आवश्यकता होती है। आर में ( आर नमूना सहसंबंध गुणांक है, n टिप्पणियों की संख्या है):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

मेरे ब्लॉग पर इस पोस्ट को भी देखें ।

उस ने कहा, चाहे वह .01 हो या .001 उतना मायने नहीं रखता। जैसा कि आपने कहा, यह ज्यादातर नमूना आकार का एक कार्य है और आप पहले से ही जानते हैं कि नमूना आकार बड़ा है। तार्किक निष्कर्ष यह है कि आपको संभवतः परीक्षण की आवश्यकता नहीं है (विशेष रूप से तथाकथित 'नील' की परिकल्पना का परीक्षण नहीं है कि सहसंबंध 0 है)। साथ एन = 878, आप अनुमान और इसे सीधे व्याख्या पर ध्यान केंद्रित करने की शुद्धता में काफी आश्वस्त हो सकते हैं (यानी अपने क्षेत्र में .75 बड़ी है?)।

औपचारिक रूप से, जब आप नेमन-पियर्सन ढांचे में एक सांख्यिकीय परीक्षण करते हैं, तो आपको अग्रिम में त्रुटि स्तर को निर्दिष्ट करने की आवश्यकता होती है। इसलिए, यदि परीक्षण के परिणाम वास्तव में मायने रखते हैं और अध्ययन की योजना थी .01 को सीमा के रूप में, यह केवल रिपोर्ट पी <.01 के लिए समझ में आता है और आपको प्राप्त पी मूल्य के आधार पर इसे अवसरवादी रूप से पी <.001 नहीं करना चाहिए । इस प्रकार का अघोषित लचीलापन छोटे सितारों की आलोचना के मुख्य कारणों में से एक है और सामान्य तौर पर सामाजिक विज्ञान में शून्य-परिकल्पना महत्व परीक्षण का अधिक अभ्यास है।

Meehl, PE (1978) भी देखें। सैद्धांतिक जोखिम और सारणीबद्ध तारांकन: सर कार्ल, सर रोनाल्ड और नरम मनोविज्ञान की धीमी प्रगति। परामर्श और नैदानिक ​​मनोविज्ञान जर्नल, 46 (4), 806-834। (शीर्षक में इन "सितारों" का संदर्भ है लेकिन सामग्री महत्व परीक्षण की भूमिका की बहुत व्यापक चर्चा है।)


1
मैं शायद उन्हें सलाह दूंगा कि छोटे सितारों को छोड़ दें, भले ही परिणाम सही हों लेकिन मैं आपकी बात देखता हूं।
गाला

1
मैंने इस समस्या के बारे में टिप्पणी जोड़ने के लिए अपना उत्तर संपादित किया। ध्यान दें कि 0.001 <0.01 इसलिए लेखक किसी भी मामले में औपचारिक रूप से "सही" हैं, यह इस बात का अधिक मामला है कि परिणामों का पता लगाने का तरीका क्या है। मुझे लगता है कि, एक सटीक त्रुटि के विपरीत जो एक समीक्षक को निश्चित रूप से सही होना चाहिए, इस मुद्दे को लेखकों को तय करने के लिए छोड़ दिया जाना चाहिए।
गाला

1
आप सही हैं, लेकिन अभी तक मैंने कभी भी p <0.01 की रिपोर्टिंग नहीं देखी है यदि p वास्तव में 0.001 से कम है (बिना यह कहे कि लेख के लिए आत्मविश्वास का स्तर 0.01 है)। इसके अलावा, मैं जिस लेख के बारे में बात करता हूं, उसमें लेखक to३ to से ०. on५४ तक के सहसंबंधों के साथ to३ to से with६ तक के नमूने के आकार के आधार पर ३० सहसंबंध परीक्षणों की रिपोर्ट करते हैं और सभी को दो सितारा महत्वपूर्ण के रूप में रिपोर्ट किया जाता है।
मिरोस्लाव सबो

1
मुझे यहां अपना कोड पोस्ट करने के लिए एक समस्या है, लेकिन मैं सिमुलेशन चलाता हूं और आपके कोड से पी-वैल्यू कोरटेस्ट से पी-वैल्यू के समान नहीं है।
मिरोस्लाव सबो

4
मैंने stata-journal.com/sjpdf.html?articlenum=pr0041 पर सुलभ सहसंबंधों के लिए फिशर के जेड के उपयोग की एक ट्यूटोरियल समीक्षा लिखी थी, मैं विश्वास अंतराल के अधिक उपयोग की सिफारिश करता हूं और 95% की सीमा पर 0.724, 0.781 की गणना करता हूं। मैं और भी अधिक डेटा को देखने और एक प्रतिगमन पर काम करने की सलाह दूंगा।
निक कॉक्स

2

आप फिशर के आर-टू-जेड परिवर्तन का उपयोग करते हैं।

एक वैकल्पिक आँकड़ा है:

abs(r)*sqrt((n-2)/(1-r^2)) ~ t.dist(d.f.=n-2)

कि स्वतंत्रता के n-2 डिग्री के साथ टी-वितरण है। उदाहरण के लिए यह कैसे काम करता है: http://www.danielsoper.com/statcalc3/calc.aspx?id=44

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.