चूंकि चर्चा लंबी हो गई, इसलिए मैंने अपनी प्रतिक्रियाएँ एक उत्तर के लिए ले ली हैं। लेकिन मैंने आदेश बदल दिया है।
क्रमपरिवर्तन परीक्षण "सटीक" हैं, बजाय स्पर्शोन्मुख (तुलना, उदाहरण के लिए, संभावना अनुपात परीक्षण)। इसलिए, उदाहरण के लिए, आप शून्य के तहत साधनों में अंतर के वितरण की गणना किए बिना भी साधनों का परीक्षण कर सकते हैं; आप भी शामिल वितरण निर्दिष्ट करने की आवश्यकता नहीं है। आप एक परीक्षण आँकड़ा तैयार कर सकते हैं जिसमें पूरी तरह से पैरामीट्रिक धारणा के रूप में उनके प्रति संवेदनशील होने के बिना मान्यताओं के एक सेट के तहत अच्छी शक्ति है (आप एक सांख्यिकीय का उपयोग कर सकते हैं जो मजबूत है, लेकिन अच्छे हैं)।
ध्यान दें कि आप जो परिभाषाएँ देते हैं (या यों कहें, जिसे आप वहाँ उद्धृत कर रहे हैं) सार्वभौमिक नहीं हैं; कुछ लोग U को क्रमपरिवर्तन परीक्षण आँकड़ा कहेंगे (जो क्रमपरिवर्तन परीक्षण बनाता है वह आँकड़ा नहीं है लेकिन आप p- मान का मूल्यांकन कैसे करते हैं)। लेकिन एक बार जब आप क्रमपरिवर्तन परीक्षण कर रहे होते हैं और आपने एक दिशा निर्दिष्ट कर दी होती है, क्योंकि 'H के साथ यह चरम है' असंगत है, तो T के लिए इस तरह की परिभाषा मूल रूप से है कि आप पी-वैल्यू कैसे काम करते हैं - यह सिर्फ वास्तविक अनुपात है नल (पी-वैल्यू की बहुत परिभाषा) के तहत नमूना के रूप में कम से कम चरम पर क्रमिक वितरण।
इसलिए, उदाहरण के लिए, यदि मैं टू-सैंपल टी-टेस्ट की तरह साधनों के परीक्षण के लिए (वन-टेल्ड, सादगी के लिए) करना चाहता हूं, तो मैं अपने स्टेटमेंट को टी-स्टेटिस्टिक, या टी-स्टेटिस्टिक का अंश बना सकता हूं, या पहले नमूने का योग (उन परिभाषाओं में से प्रत्येक दूसरों में मोनोटोनिक है, संयुक्त नमूने पर सशर्त), या उनमें से किसी भी मोनोटोनिक परिवर्तन, और एक ही परीक्षण है, क्योंकि वे समान पी-मूल्यों का उत्पादन करते हैं। मुझे केवल यह देखने की जरूरत है कि मैं जो कुछ भी आँकड़ा चुनता हूं, उसके अनुपात के क्रमबद्ध वितरण (नमूना अनुपात) के बारे में कितनी मात्रा में है। टी जैसा कि ऊपर परिभाषित किया गया है, केवल एक और आँकड़ा है, जितना कि कोई भी अन्य मैं चुन सकता है (टी यू के रूप में परिभाषित किया जा रहा है)।
टी बिल्कुल समान नहीं होगा, क्योंकि इसके लिए निरंतर वितरण की आवश्यकता होगी और टी आवश्यक रूप से असतत है। क्योंकि यू और इसलिए टी किसी दिए गए आंकड़े के लिए एक से अधिक क्रमांकन को मैप कर सकते हैं, परिणाम समान-संभावित नहीं हैं, लेकिन उनके पास "समान-समान" सीएफडी ** है, लेकिन एक जहां कदम जरूरी नहीं कि आकार में बराबर हैं ।
** ( , और कड़ाई से प्रत्येक कूद की सही सीमा पर इसके बराबर है - वास्तव में जो है उसके लिए एक नाम है)F(x)≤x
उचित आँकड़ों के लिए रूप में अनंत तक जाता है का वितरण एकरूपता तक पहुंचता है। मुझे लगता है कि उन्हें समझने के लिए शुरू करने का सबसे अच्छा तरीका वास्तव में उन्हें विभिन्न स्थितियों में करना है। nT
क्या किसी नमूने के लिए T (X) U (X) के आधार पर P- मान के बराबर होना चाहिए? अगर मैं सही तरीके से समझूं, तो मैंने इसे इस स्लाइड के पेज 5 पर पाया।
टी पी-मूल्य है (उन मामलों के लिए जहां बड़े यू नल से विचलन को इंगित करता है और छोटा यू इसके अनुरूप है)। ध्यान दें कि वितरण नमूना पर सशर्त है। इसलिए इसका वितरण 'किसी नमूने के लिए' नहीं है।
तो क्रमपरिवर्तन परीक्षण का उपयोग करने का लाभ X के वितरण के तहत एक्स के वितरण को जानने के बिना मूल परीक्षण सांख्यिकीय यू के पी-मूल्य की गणना करना है? इसलिए, टी (एक्स) का वितरण आवश्यक रूप से एक समान नहीं हो सकता है?
मैंने पहले ही समझाया कि T एक समान नहीं है।
मुझे लगता है कि मैंने पहले ही स्पष्ट कर दिया है कि मैं क्रमपरिवर्तन परीक्षणों के लाभों के रूप में क्या देखता हूं; अन्य लोग अन्य लाभ ( जैसे ) सुझाएंगे ।
क्या "टी पी-मान है (उन मामलों के लिए जहां बड़े यू नल से विचलन को इंगित करता है और छोटा यू इसके अनुरूप है)", इसका मतलब है कि परीक्षण सांख्यिकीय यू और नमूना एक्स के लिए पी-मूल्य टी (एक्स) है? क्यों? क्या यह समझाने के लिए कुछ संदर्भ है?
आपके द्वारा उद्धृत वाक्य में स्पष्ट रूप से लिखा गया है कि T एक पी-वैल्यू है, और जब यह होता है। यदि आप बता सकते हैं कि इसके बारे में क्या अस्पष्ट है तो शायद मैं और कह सकता हूं। क्यों, पी-मान की परिभाषा (लिंक पर पहला वाक्य) देखें - यह काफी सीधे उस से इस प्रकार है
यहाँ क्रमपरिवर्तन परीक्षणों की एक अच्छी प्राथमिक चर्चा है ।
-
संपादित करें: मैं यहां एक छोटे क्रमचय परीक्षण उदाहरण को जोड़ता हूं; यह (R) कोड केवल छोटे नमूनों के लिए उपयुक्त है - आपको मध्यम नमूनों में चरम संयोजनों को खोजने के लिए बेहतर एल्गोरिदम की आवश्यकता है।
एक-पूंछ वाले विकल्प के खिलाफ एक क्रमचय परीक्षण पर विचार करें:
H0:μx=μy (कुछ लोग * पर जोर देते हैं )μx≥μy
H1:μx<μy
* लेकिन मैं आमतौर पर इससे बचता हूं क्योंकि यह विशेष रूप से छात्रों के लिए इस मुद्दे को भ्रमित करने के लिए जाता है जब अशक्त वितरण का काम करने की कोशिश की जाती है
निम्नलिखित डेटा पर:
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
7 अवलोकनों को आकार 3 और 4 के नमूनों में विभाजित करने के 35 तरीके हैं:
> choose(7,3)
[1] 35
जैसा कि पहले उल्लेख किया गया है, 7 डेटा मान दिए गए हैं, पहले नमूने का योग साधनों में अंतर में एकरस है, इसलिए आइए इसका उपयोग एक परीक्षण सांख्यिकीय के रूप में करें। तो मूल नमूने का एक परीक्षण आँकड़ा है:
> sum(x)
[1] 64.77
अब यहां वितरण की अनुमति है:
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(उन्हें क्रमबद्ध करना आवश्यक नहीं है, मैंने सिर्फ यही किया है कि परीक्षण को देखना आसान बनाने के लिए अंत से दूसरा मूल्य था।)
हम देख सकते हैं (निरीक्षण द्वारा इस मामले में) कि 2/35 है, याp
> 2/35
[1] 0.05714286
(ध्यान दें कि केवल बिना xy ओवरलैप के मामले में, यह संभव है कि यहां .05 से नीचे पी-वैल्यू हो। इस मामले में, असतत वर्दी होगी क्योंकि में कोई बंधे हुए मूल्य नहीं हैं ।)TU
गुलाबी तीर x- अक्ष पर नमूना आँकड़ा, और y- अक्ष पर p- मान का संकेत देते हैं।