मैं सोच रहा था कि बूटस्ट्रैप CI (और बारिक्युलर में BCa) सामान्य रूप से वितरित डेटा पर कैसा प्रदर्शन करता है। विभिन्न प्रकार के वितरणों पर उनके प्रदर्शन की जांच करने के लिए बहुत सारे काम लगते हैं, लेकिन सामान्य रूप से वितरित डेटा पर कुछ भी नहीं मिला। चूंकि पहले अध्ययन करने के लिए यह एक स्पष्ट बात लगती है, मुझे लगता है कि कागजात अभी बहुत पुराने हैं।
मैंने आर बूट पैकेज का उपयोग करते हुए कुछ मोंटे कार्लो सिमुलेशन किए और बूटस्ट्रैप सीआई को सटीक सीआई के साथ समझौते में पाया, हालांकि छोटे नमूनों (एन <20) के लिए वे थोड़ा उदार (छोटे सीआई) होते हैं। बड़े पर्याप्त नमूनों के लिए, वे अनिवार्य रूप से समान हैं।
इससे मुझे आश्चर्य होता है कि क्या कोई अच्छा कारण हमेशा बूटस्ट्रैपिंग का उपयोग नहीं करना है । वितरण सामान्य है या नहीं इसके पीछे के कई नुकसान का आकलन करने की कठिनाई को देखते हुए, यह उचित है कि वितरण के बावजूद बूट सीआईएसपी को तय न करें और रिपोर्ट न करें। मैं व्यवस्थित रूप से गैर-पैरामीट्रिक परीक्षणों का उपयोग न करने की प्रेरणा को समझता हूं, क्योंकि उनके पास कम शक्ति है, लेकिन मेरे सिमुलेशन मुझे बताते हैं कि बूटस्ट्रैप सीआईएस के लिए यह मामला नहीं है। वे और भी छोटे हैं।
इसी तरह का एक सवाल जो मुझे परेशान करता है, वह यह है कि हमेशा मध्य प्रवृत्ति के माप के रूप में माध्यिका का उपयोग क्यों न किया जाए। लोग अक्सर गैर-वितरित डेटा को चिह्नित करने के लिए इसका उपयोग करने की सलाह देते हैं, लेकिन चूंकि माध्य सामान्य रूप से वितरित डेटा के लिए माध्य के समान है, तो अंतर क्यों बनाते हैं? यह काफी फायदेमंद होगा यदि हम यह तय करने के लिए प्रक्रियाओं से छुटकारा पा सकते हैं कि क्या वितरण सामान्य है या नहीं।
मैं इन मुद्दों पर आपके विचारों के बारे में बहुत उत्सुक हूं, और क्या उनसे पहले चर्चा की गई है। संदर्भ की बहुत सराहना की जाएगी।
धन्यवाद!
पियरे