ठीक है, अगर आपको पता था कि अनपेयर और पेयर में वेरिएंस (जो आमतौर पर एक छोटा सौदा होगा), तो समूहों में अंतर के दो अनुमानों के लिए इष्टतम वजन का मतलब होगा वेटर्स का अलग-अलग वेरिएंट के समानुपातिक होना। साधनों में अंतर का अनुमान।
[संपादित करें: पता चलता है कि जब परिवर्तन का अनुमान लगाया जाता है, तो इसे ग्रेबिल-डील अनुमानक कहा जाता है। इस पर काफी कुछ कागजात हैं। यहाँ एक है]
विचरण का अनुमान लगाने की आवश्यकता कुछ कठिनाई का कारण बनती है (विचरण अनुमानों का परिणामी अनुपात F है, और मुझे लगता है कि परिणामी भार का एक बीटा वितरण होता है, और एक परिणामी आँकड़ा जटिल होता है), लेकिन चूंकि आप बूटस्ट्रैपिंग पर विचार कर रहे हैं, यह हो सकता है एक चिंता का विषय है।
एक वैकल्पिक संभावना जो कुछ अर्थों में अच्छी हो सकती है (या कम से कम गैर-सामान्यता के लिए थोड़ा अधिक मजबूत हो, क्योंकि हम सामान्य रूप से दक्षता में बहुत कम नुकसान के साथ विचरण अनुपात के साथ खेल रहे हैं) शिफ्ट के संयुक्त अनुमान को आधार बनाना है युग्मित और अप्रकाशित रैंक परीक्षण - प्रत्येक मामले में एक प्रकार का होजेस-लेहमन का अनुमान, जोड़ीदार क्रॉस-सैंपल के अंतर के मध्यस्थों के आधार पर अनियोजित मामले में और युग्मित-औसत-ऑफ-द-युग्म अंतर के मध्यस्थों के युग्मित मामले में। फिर से, दोनों के न्यूनतम विचरण भारित रैखिक संयोजन, भिन्नताओं के व्युत्क्रमानुपाती वजन के साथ होंगे। उस मामले में मैं शायद बूटस्ट्रैप के बजाय एक क्रमपरिवर्तन (/ रैंडमाइजेशन) की ओर झुक जाऊंगा - लेकिन इस बात पर निर्भर करता है कि आप अपने बूटस्ट्रैप को कैसे लागू करते हैं, वे उसी स्थान पर समाप्त हो सकते हैं।
या तो मामले में आप अपने संस्करण को मजबूत करना चाहते हैं / अपने विचरण अनुपात को कम कर सकते हैं। वजन के लिए सही बॉलपार्क में प्राप्त करना अच्छा है, लेकिन आप इसे थोड़ा मजबूत बनाकर सामान्य रूप से बहुत कम दक्षता खो देंगे। ---
कुछ अतिरिक्त विचार जो मैंने स्पष्ट रूप से पर्याप्त नहीं किए थे पहले मेरे सिर में हल कर दिए थे:
इस समस्या के Behrens-Fisher समस्या के लिए अलग समानताएं हैं, लेकिन और भी कठिन है।
यदि हम वज़न तय करते हैं, तो हम एक वेल्च-स्टरथवेट प्रकार सन्निकटन में अजीब कर सकते हैं ; समस्या की संरचना समान है।
हमारा मुद्दा यह है कि हम वज़न का अनुकूलन करना चाहते हैं, जिसका प्रभावी अर्थ है कि वेटिंग तय नहीं है - और वास्तव में, बड़े नमूनों में अधिकतम (कम से कम लगभग और अधिक लगभग) को अधिकतम करने की प्रवृत्ति है, क्योंकि वजन का कोई भी सेट एक यादृच्छिक मात्रा है जो उसी का आकलन करता है। अंश, और हम हर को कम करने की कोशिश कर रहे हैं; दोनों स्वतंत्र नहीं हैं)।
यह, मैं उम्मीद करता हूं, ची-वर्ग के सन्निकटन को और खराब कर देगा, और लगभग निश्चित रूप से आगे भी एक सन्निकटन के df को प्रभावित करेगा।
[यदि यह समस्या है, तो यह भी निश्चित रूप से हो सकता है कि अंगूठे का एक अच्छा नियम हो जो कहेंगे 'आप लगभग ऐसा ही कर सकते हैं यदि आप परिस्थितियों के इन सेटों के तहत केवल युग्मित डेटा का उपयोग करते हैं, केवल इन अन्य सेटों के तहत अप्रभावित स्थितियाँ और बाकी हिस्सों में, यह निश्चित वजन-योजना आमतौर पर इष्टतम के बहुत करीब है '- लेकिन मैं अपनी सांस को उस मौके पर इंतजार नहीं करूंगा। इस तरह का निर्णय नियम निस्संदेह प्रत्येक मामले में वास्तविक महत्व पर कुछ प्रभाव डालता है, लेकिन अगर वह प्रभाव इतना बड़ा नहीं था, तो अंगूठे का ऐसा नियम लोगों को मौजूदा विरासत सॉफ्टवेयर का उपयोग करने का एक आसान तरीका देगा, इसलिए यह वांछनीय हो सकता है ऐसी स्थिति में उपयोगकर्ताओं के लिए एक नियम की पहचान करने का प्रयास करें।]
---
संपादित करें: स्वयं पर ध्यान दें - 'ओवरलैपिंग सैंपल' परीक्षणों, विशेषकर ओवरलैपिंग सैंपल्स टी- टेस्ट्स पर काम के विवरण को वापस लाने और भरने की आवश्यकता है
---
यह मेरे लिए होता है कि एक यादृच्छिककरण परीक्षण ठीक काम करना चाहिए -
जहां डेटा जोड़े जाते हैं, आप जोड़े के भीतर समूह लेबल को बेतरतीब ढंग से अनुमति देते हैं
जहां डेटा अप्रकाशित हैं, लेकिन माना जाता है कि सामान्य वितरण (शून्य के तहत) है, तो आप समूह असाइनमेंट की अनुमति देते हैं
अब आप सापेक्ष परिवर्तन अनुमानों ( से दो बदलाव के अनुमानों को आधार बना सकते हैंw1=1/(1+v1v2)
(बहुत बाद में जोड़ा गया)
संभवतः प्रासंगिक कागज:
डेरिक, बी।, रस बी।, टोहेर, डी।, और व्हाइट, पी। (2017),
"दो नमूनों के लिए साधनों की तुलना के लिए टेस्ट सांख्यिकी, जिसमें दोनों जोड़ी और स्वतंत्र अवलोकन शामिल हैं"
आधुनिक एप्लाइड सांख्यिकीय विधियों के जर्नल , मई , वॉल्यूम। 16, नंबर 1, 137-157।
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm