फिशर का जेड-ट्रांसफॉर्म कब उचित है?


13

मैं महत्व के लिए एक नमूना सहसंबंध का परीक्षण करना चाहता हूं , जो कि p- मानों का उपयोग कर रहा हैr

H0:ρ=0,H1:ρ0.

मैं समझ गया हूं कि मैं इसके द्वारा गणना करने के लिए फिशर के जेड-ट्रांसफॉर्म का उपयोग कर सकता हूं

zobs=n32ln(1+r1r)

और इसके द्वारा पी-मान का पता लगाना

p=2P(Z>zobs)

मानक सामान्य वितरण का उपयोग करना।

मेरा प्रश्न है: कितना बड़ा इस एक उचित परिवर्तन होने के लिए किया जाना चाहिए? जाहिर है, 3 से बड़ा होना चाहिए। मेरी पाठ्यपुस्तक में किसी भी प्रतिबंध का उल्लेख नहीं है, लेकिन इस प्रस्तुति की स्लाइड 29 पर यह कहता है कि को 10 से बड़ा होना चाहिए। मैं जिस डेटा पर विचार कर रहा हूं, उसके लिए मेरे पास जैसा कुछ होगा ।nnn5 n 10n5n10


2
विकिपीडिया पृष्ठ सूचियों की मानक त्रुटि जो द्वारा दिया जाता है जहां नमूने का आकार है। तो आपको कम से कम 4 पूर्ण जोड़े की आवश्यकता होगी। मैं नमूना आकार के संबंध में किसी भी प्रतिबंध से अवगत नहीं हूं। 1 / zobs एन1/N3N
COOLSerdash

8
निश्चित नहीं है कि किसी ऐसे व्यक्ति की प्रस्तुति पर भरोसा कैसे किया जाए जो खुद के विश्वविद्यालय का नाम नहीं बता सकता। अधिक गंभीरता से, उन सभी सलाहों से सावधान रहें, जिनका तात्पर्य है कि चीजें एक निश्चित नमूने के आकार के ऊपर ठीक हैं और अन्यथा खराब हो जाती हैं। यह नमूना आकार के साथ सुचारू रूप से बढ़ती गुणवत्ता की बात है और डेटा के वितरण पर भी निर्भर करता है। सरल सलाह बहुत सतर्क रहना है, सब कुछ साजिश और बूटस्ट्रैप्ड आत्मविश्वास अंतराल के साथ क्रॉस-चेक करना है।
निक कॉक्स

1
स्लाइड 17 विशेष केस लिए एक टी-टेस्ट का वर्णन करता है । ρ=0
whuber

जवाबों:


8

इन जैसे सवालों के लिए मैं सिर्फ एक सिमुलेशन चलाऊंगा और देखूंगा कि क्या वे व्यवहार करते हैं जैसा कि मैं उनसे उम्मीद करता हूं। -value बेतरतीब ढंग से एक नमूना डेटा के रूप में अशक्त-परिकल्पना से ज्यादा के रूप में कम से कम है कि भटक आप अगर शून्य-परिकल्पना सच है मनाया निकलने की संभावना है। तो अगर हम इस तरह के कई नमूने था, और उनमें से एक एक था .04 की -value तो हम .04 से एक मूल्य कम करने के लिए उन लोगों के नमूनों की 4% अधिक संभावना होगी। एक ही अन्य सभी संभव के लिए सच है -values।पी पी पीpppp

नीचे स्टैटा में एक सिमुलेशन है। रेखांकन जाँच करें कि क्या -values उपाय क्या वे को मापने के लिए अपेक्षा की जाती है, यह है कि, वे पता चलता है कि कितना साथ नमूने का अनुपात नाममात्र की तुलना में -values कम नाममात्र से -value भटक -value। जैसा कि आप देख सकते हैं कि इतनी कम संख्या में टिप्पणियों के साथ परीक्षण कुछ समस्याग्रस्त है। आपके शोध के लिए यह समस्यापूर्ण है या नहीं, यह आपका निर्णय कॉल है।पी पी पीpppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

यहाँ छवि विवरण दर्ज करें

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

यहाँ छवि विवरण दर्ज करें


1
से 3 के बजाय 2.5 को घटाने की कोशिश करें :-)। n
whuber

5

एफडब्ल्यूआईडब्ल्यू मुझे मायर्स एंड वेल (अनुसंधान डिजाइन और सांख्यिकीय विश्लेषण, द्वितीय संस्करण 2003, पी। 492) में सिफारिश देख रहा है । फुटनोट कहता है:N10

सख्ती से बोलना, परिवर्तन राशि द्वारा पक्षपाती है : पीयरसन और हार्टले (1954, पी। 29) देखें। यह पूर्वाग्रह आमतौर पर तब तक नगण्य होगा जब तक कि छोटा और बड़ा न हो, और हम इसे यहाँ अनदेखा करते हैं।आर / ( 2 ( एन - 1 ) ) एन ρZr/(2(N1))Nρ


3
ऐसा लगता है कि यह मेरे लिए एक जवाब है।
गंग -

1

सुनिश्चित नहीं हैं कि एक फिशर चाहे को बदलने यहाँ उचित है। के लिए (एनबी: शून्य परिकल्पना की आबादी के लिए है , नहीं नमूना ), सहसंबंध गुणांक का नमूना वितरण पहले से ही सममित है, इसलिए तिरछापन कम करने के लिए कोई जरूरत नहीं है, जो है फिशर क्या उद्देश्य क्या करना है, और आप छात्र के सन्निकटन का उपयोग कर सकते हैं ।zH0:ρ=0ρrzt

यदि आप मानते हैं कि , तो उस PDF का , के प्रस्तावित मूल्य पर निर्भर करेगा , इसलिए कोई भी सामान्य उत्तर नहीं होगा कि कितना बड़ा होना चाहिए। इसके अलावा, कम से कम मूल्यों महत्व स्तर पर निर्भर करेगा है कि आप की ओर काम कर रहे हैं। आपने इसका मूल्य नहीं बताया है।H0:ρ=ρ00ρ0nnα

निक का बिंदु एक उचित है: कुछ ग्रे क्षेत्र में सन्निकटन और सिफारिशें हमेशा संचालित होती हैं।

यदि, फिर, आपका फिशर सन्निकटन अच्छा (= सममित) पर्याप्त है, तो मैं बाध्य उपयोग -distributions पर लागू होता है , जहां नमूना मानक है विचलन। यदि यह सामान्यता के काफी करीब है, तो यह ।n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
मुझे लगता है कि यह फिशर के के "उद्देश्य" की देखरेख करता है, जो आंशिक रूप से उद्देश्य के साथ-साथ गणित भी है। तिरछापन या न केवल चित्र का हिस्सा है; एक बंधे हुए वितरण को एक अनबाउंड में बदल देता है, जो आत्मविश्वास के अंतराल के लिए महत्वपूर्ण है। वास्तव में, मैं यह तर्क दूंगा कि जब तक शून्य सहसंबंध की एक शून्य परिकल्पना वैज्ञानिक सवाल नहीं है, तब तक आत्मविश्वास के अंतराल के लिए फिशर की का उपयोग पी-मूल्य प्राप्त करने की कोशिश करने की तुलना में बहुत अधिक फलदायी है। zzz
निक कॉक्स

1
मुझे क्षमा करें, मैं फिशर के -ransransform में नया हूं। अगर मुझे का परीक्षण करना है तो क्या मुझे इसका उपयोग करना चाहिए ? पी-मानों की गणना करने का कारण यह है कि मैं कई तुलनाएं करते समय परिवार-वार त्रुटि दर को नियंत्रित करने के लिए होल्म-बोनफेरोनी विधि का उपयोग करना चाहता हूं। मैं नहीं बल्कि एक विद्यार्थी का से पी-मूल्यों की गणना करना चाहिए वितरण? zH0:ρ=ρ00t
गनहिल्ड

3
प्रश्न गलत तरीका है, मुझे लगता है। फिशर का आत्मविश्वास अंतराल और आम तौर पर अनुमान के लिए एक बेहतर तरीका है। अधिकांश सॉफ़्टवेयर, मेरा अनुमान है, परीक्षण के लिए -based गणना का उपयोग करता है । यदि संदेह है तो यह दिखाना महत्वपूर्ण है कि क्या किसी एक विधि का उपयोग करने से आपके डेटा पर फर्क पड़ता है। इसलिए, यदि विधियाँ सहमत हैं, तो कोई समस्या नहीं है। ztρ=0
निक कॉक्स

1
आप यहां फिशर के ट्रांसफ़ॉर्मेशन के बारे में और अधिक पढ़ सकते हैं : stata-journal.com/article.html?article=pr0041z
Maarten Buis

ठीक है, धन्यवाद @NickCox! @ ल्यूकोडे, पर बाउंड में क्या है ? ϵn
गनहिल्ड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.