सामान्य रूप से वितरित डेटा के लिए स्टूडेंट के टी-टेस्ट की तुलना में विलकॉक्सन टेस्ट की एसिम्प्टोटिक सापेक्ष दक्षता क्यों है ?


13

यह सर्वविदित है कि विलकॉक्सन हस्ताक्षरित रैंक परीक्षण की एसिम्प्टोटिक सापेक्ष दक्षता (हैं) स्टूडेंट के t की तुलना में है , यदि डेटा सामान्य रूप से वितरित जनसंख्या से खींचा जाता है। यह बुनियादी एक-नमूना परीक्षण और दो स्वतंत्र नमूनों (विल्कोक्सन-मान-व्हिटनी यू) के लिए संस्करण के लिए सच है। सामान्य डेटा के लिए, एनोवा एफ -टेस्ट की तुलना में यह क्रुस्कल-वालिस परीक्षण के प्रकार भी हैं ।3π0.955

यह उल्लेखनीय है (मेरे लिए, "में से एक के सबसे अप्रत्याशित रूप से सामने आएπ ") एक, व्यावहारिक उल्लेखनीय या साधारण सबूत है और उल्लेखनीय सरल परिणाम है?


सामान्य cdf में की उपस्थिति को देखते हुए , the की उपस्थिति में वास्तव में यह सब आश्चर्यजनक नहीं होना चाहिए । मैं एक उत्तर दूंगा, लेकिन एक अच्छा बनाने में थोड़ा समय लगेगा। πππ
Glen_b -Reinstate Monica

1
@Glen_b दरअसल - मैंने देखा है एक "क्यों करता है से पहले चर्चा मैं एक बहुत ऊपर फसलों पता है" सामान्य वितरण की वजह से "इतना आंकड़ों में दिखाया" (हालांकि अगर यह सीवी पर नहीं था या याद नहीं कर सकते) और , लेकिन पहली बार देखने के बाद भी सुखद आश्चर्यचकित है। तुलना के लिए मान-व्हिटनी बनाम दो-नमूना टी-परीक्षण घातीय डेटा पर 3, डबल घातीय पर 1.5 और वर्दी पर 1 - बहुत राउंडर है! 3 / ππ3/π
सिल्वरफिश

1
@Silverfish मैंने van der Vaart के पेज 197 को "Asymptotic सांख्यिकी" से जोड़ा है। एक-नमूने के लिए, साइन-टेस्ट में टी-टेस्ट के सापेक्ष । 2/π
खाशा

1
@Silverfish ... और लॉजिस्टिक में यह । वहाँ बहुत कुछ ज्ञात क्षेत्र (या तो एक या दो नमूना मामलों में) में शामिल हैं और काफी कुछ जो पूर्णांकों के सरल अनुपात हैं। π(π/3)2π
Glen_b -Reinstate मोनिका

1
एक नमूना हस्ताक्षरित रैंक परीक्षण के लिए, यह लगता है । एक-नमूना हस्ताक्षर परीक्षण के लिए, यह । इसलिए, हमने अपनी स्थिति स्पष्ट की। मुझे लगता है कि यह एक अच्छा संकेत है। 2 / π3/π2/π
खाशा

जवाबों:


10

एक नमूना - टेस्ट, हस्ताक्षरित परीक्षण और हस्ताक्षरित-रैंक परीक्षण के लिए संक्षिप्त संक्षिप्त विवरणt

मुझे उम्मीद है कि @ Glen_b के उत्तर के लंबे संस्करण में दो-नमूना हस्ताक्षरित रैंक परीक्षण के लिए विस्तृत विश्लेषण के साथ विस्तृत विवरण शामिल हैं। तो मैं सबसे व्युत्पत्ति छोड़ दूँगा। (एक-नमूना मामला, आप लेहमैन टीएसएच में लापता विवरण पा सकते हैं)।

परीक्षण समस्या : को स्थान मॉडल से एक यादृच्छिक नमूना होना चाहिए , शून्य के बारे में सममित। हम गणना परीक्षण के हैं, परिकल्पना के लिए हस्ताक्षरित रैंक परीक्षण टी-परीक्षण के सापेक्ष।( एक्स - θ ) एच 0 : θ = 0X1,,Xnf(xθ)H0:θ=0

परीक्षणों की सापेक्ष दक्षता का आकलन करने के लिए, केवल स्थानीय विकल्पों पर विचार किया जाता है क्योंकि लगातार परीक्षणों में निर्धारित विकल्प के मुकाबले 1 तक शक्ति होती है। स्थानीय विकल्प जो एसिम्प्टोटिक पॉवर को जन्म देते हैं, अक्सर फिक्स्ड के लिए फॉर्म होता है, जिसे कुछ साहित्य में पिटमैन ड्रिफ्ट कहा जाता है। एचθn=h/nh

आगे हमारा काम है

  • नल के तहत प्रत्येक परीक्षण सांख्यिकीय की सीमा वितरण का पता लगाएं
  • विकल्प के तहत प्रत्येक परीक्षण सांख्यिकीय की सीमा वितरण का पता लगाएं
  • प्रत्येक परीक्षण की स्थानीय विषम शक्ति की गणना करें

टेस्ट स्टैटिसिक्स और एसिम्पोटिक्स

  1. t-test ( के अस्तित्व को देखते हुए ) टी एन = σt n = √ के तहत
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • इसलिए परीक्षण जो अस्वीकार करता है अगर शक्ति कार्य है 1 - Φ ( z α - h 1)tn>zα
      1Φ(zαh1σ)
  2. हस्ताक्षरित परीक्षण और स्थानीय शक्ति है Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. हस्ताक्षरित-रैंक परीक्षण और स्थानीय असममित शक्ति
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

इसलिए, यदि मानक सामान्य घनत्व है, तो ,

ARE(Sn)=(2f(0)σ)2
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

यदि [-1,1] पर समान है, तो ,fARE(Sn)=1/3ARE(Wn)=1/3

विकल्प के तहत वितरण की व्युत्पत्ति पर टिप्पणी

विकल्प के तहत सीमित वितरण को प्राप्त करने के कई तरीके हैं। एक सामान्य दृष्टिकोण ले कैम के तीसरे लेम्मा का उपयोग करना है। इसका सरलीकृत संस्करण बताता है

आज्ञा दें संभावना अनुपात का लॉग हो। कुछ आँकड़ा , यदि null के तहत, फिरΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

द्विघात माध्य भिन्नताओं के लिए, स्थानीय स्पर्शोन्मुख सामान्यता और आकस्मिकता स्वचालित रूप से संतुष्ट होती है, जिसका अर्थ है ले कैम लेम्मा। इस लेम्मा का उपयोग करके, हमें केवल null के तहत गणना करने की आवश्यकता है । obeys LAN जहाँ है स्कोर फ़ंक्शन, सूचना मैट्रिक्स है। फिर, उदाहरण के लिए, हस्ताक्षरित परीक्षणcov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 मैं बहुत अधिक विवरण में नहीं जा रहा था (वास्तव में, आपके उत्तर को बहुत पहले से ही चीजों को कवर करने के साथ, मैं शायद अब मेरे पास जो कुछ भी है उसे कुछ भी नहीं जोड़ूंगा) यदि आप अधिक विवरण डालना चाहते हैं, तो डॉन ' t मेरे खाते पर वापस जाएं मुझे अभी भी कई दिन हुए होंगे (और अभी भी आपके लिए पहले से कम है), इसलिए यह एक अच्छी बात है जो आप में आए हैं।
Glen_b -Reinstate Monica

यह विशेष रूप से ले कैम के लेम्मा (+1) में जोड़ने के लिए एक अच्छा जवाब है। यह मुझे लगता है कि 1, 2, और 3 में एसिम्पोटिक्स की स्थापना और "इसलिए" बिट के बीच काफी बड़ा उछाल है जहां आप एरे लिखते हैं। मुझे लगता है कि अगर मैं इसे लिख रहा था, तो मैं इस बिंदु पर (या शायद पहले, इसलिए अंक 1, 2 और 3 के अपोजिट दक्षता को परिभाषित करूँगा) प्रत्येक मामले में AE केवल स्थानीय असममित शक्तियां नहीं होगी और फिर कदम भविष्य के पाठकों के लिए यह आसान होगा।
सिल्वरफिश

शायद यह आपके निर्दिष्ट करने के लायक है ? एक तरफा और दो तरफा मामलों में अलग-अलग दिखने वाली अस्मितावादी शक्तियां हैं (हालांकि वे एक ही तरह के हैं)। H1
सिल्वरफिश

मेरे उत्तर को संपादित करने के लिए स्वतंत्र महसूस करें या इसे ओपी में जोड़ें।
खाशा

1
@ खाशा धन्यवाद जब मेरे सामने सही सामान होगा तो मैं आपकी पोस्ट को संपादित करूंगा। क्या आप अंतिम समीकरण में का अर्थ स्पष्ट करेंगे ?
सिल्वरफिश

6

इसका यह बताने में कोई लेना-देना नहीं है कि क्यों प्रकट होता है (जिसे दूसरों द्वारा अच्छी तरह से समझाया गया था) लेकिन यह सहज रूप से मदद कर सकता है। विलकॉक्सन परीक्षण के रैंक पर एक - टेस्ट है जबकि पैरामीट्रिक टेस्ट की गणना कच्चे डेटा पर की जाती है। - टेस्ट के संबंध में विल्कोक्सन परीक्षण की दक्षता दो परीक्षणों के लिए उपयोग किए गए स्कोर के बीच सहसंबंध का वर्ग है। के रूप में के वर्ग सह-संबंध और converges । आप आसानी से आर के उपयोग से इस अनुभव को देख सकते हैं:πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

यह वास्तव में एक बहुत ही उपयोगी टिप्पणी है। क्या यह करने के लिए थोड़ा वैचारिक रूप से करीब है n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(जो स्पष्ट रूप से एक ही परिणाम पैदा करता है)?
सिल्वर फिश


इस उत्तर के बारे में मुझे कुछ समझ नहीं आ रहा है कि सहसंबंध निम्न मूल्यों के लिए अधिक है (मुझे लगता है कि समीपस्थ कारण यह है कि हम छोटे लिए बहुत अच्छी तरह से पूंछ नहीं देखते हैं )। Naively कि इसका मतलब है कि विलकॉक्सन की सापेक्ष दक्षता छोटे लिए अधिक है , जो मुझे आश्चर्यचकित करती है ... ?? (मैं कुछ सिमुलेशन कर सकता हूं, लेकिन (ए) अगर कोई आसान जवाब है ... और (बी) क्या मुझे एक वैचारिक बिंदु याद आ रहा है?)nnn
बेन बोल्कर

मेरे स्मरण के लिए दोनों विल्कोक्सन हस्ताक्षरित रैंक परीक्षण की छोटी नमूना दक्षता और डब्लूएमडब्ल्यू सामान्य वितरण पर शिफ्ट विकल्प पर एसिम्प्टोटिक मूल्य से थोड़ा कम है।
Glen_b -Reinstate मोनिका

5

लघु संस्करण: एक शिफ्ट विकल्प के तहत विलकॉक्सन-मैन-व्हिटनी के साथ मूल कारण यह है कि असममित सापेक्ष दक्षता (WMW / t) को खोजने के लिए का मूल्यांकन किया जाता है जहां अशक्त पर आम घनत्व है और आम विचरण है।σ12σ2[f2(x)dx]2fσ

तो सामान्य तौर पर, प्रभावी रूप से का एक छोटा संस्करण है ; इसके अभिन्न अंग में एक शब्द होगा; जब चुकता हो, तो यह का स्रोत है ।f2f1ππ

एक ही शब्द - एक ही अभिन्न के साथ - हस्ताक्षरित रैंक परीक्षण के लिए शामिल हैं, इसलिए यह समान मूल्य लेता है।

T के सापेक्ष साइन टेस्ट के लिए, हैं ... और फिर से एक है।( 0 ) 24σ2f(0)2f(0)2π

इसलिए अनिवार्य रूप से जैसा कि मैंने टिप्पणियों में कहा है; में कम से, Wilcoxon-मन-व्हिटनी दो नमूना टी परीक्षण बनाम हैं के लिए Wilcoxon बनाम एक नमूना टी और संकेत परीक्षण एक नमूना टी परीक्षण बनाम रैंक परीक्षण पर हस्ताक्षर किए (प्रत्येक मामले में है सामान्य) काफी शाब्दिक क्योंकि यह सामान्य घनत्व में प्रकट होता है।π

संदर्भ:

जेएल हॉजेस और ईएल लेहमन (1956),
"द टेस्ट ऑफ़ द नॉन अपरमेट्रिक कॉम्पिटिटर्स ऑफ़ द टी-टेस्ट",
एन। गणित। सांख्यिकीविद। , 27 : 2, 324-335।


मैं भाजक में की उपस्थिति के लिए अंतर्ज्ञान के लिए स्पष्टीकरण पसंद करता हूं ; क्या यह आवश्यक रूप से संयोग है कि रेनी एन्ट्रापी WMW / विलकॉक्स इंटीग्रल्स में बदल जाती है? π
सिल्वरफिश

@Silverfish That बदल जाता है निश्चित रूप से यह संयोग नहीं है। हालाँकि, ऐसा इसलिए नहीं है क्योंकि यह रेनी एन्ट्रॉपी से जुड़ा है, या कम से कम मुझे कोई सीधा संबंध नहीं दिखता है। हम सामान में हो रहे हैं मैं वास्तव में अब के बारे में पता नहीं है, हालांकि। f2dx
Glen_b -Reinstate मोनिका

@Silverfish यह केवल लिए एक रेनी एन्ट्रॉपी है । अन्यथा, यह सिर्फ एक सादा पुराना वर्ग है जो एक मिलियन अलग-अलग तरीकों से आ सकता है। α=2
19-02 को 198
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.