मैं बहु-प्रतीक्षित डेटा सेटों में पी-मान को बूटस्ट्रैप कैसे कर सकता हूं?


12

मैं इस समस्या से चिंतित हूं कि मैं बहु -अनुमानित डेटा (MI) डेटा से एक अनुमान के लिए p-value को बूटस्ट्रैप करना चाहूंगा , लेकिन यह मेरे लिए स्पष्ट नहीं है कि एमआई सेट में पी-वैल्यू को कैसे संयोजित किया जाए।θ

एमआई डेटा सेट के लिए, अनुमानों के कुल विचरण के लिए मानक दृष्टिकोण रुबिन के नियमों का उपयोग करता है। एमआई डेटा सेट को पूल करने की समीक्षा के लिए यहां देखें । कुल भिन्नता का वर्गमूल मानक मानक त्रुटि अनुमान के रूप में कार्य करता है । हालांकि, कुछ अनुमानकों के लिए कुल विचरण का कोई ज्ञात रूप नहीं है या नमूना वितरण सामान्य नहीं है। आँकड़ा तब t-वितरित नहीं किया जा सकता है, यहां तक ​​कि asymptotically भी नहीं।θθ/रों(θ)

इसलिए, पूर्ण डेटा मामले में, एक वैकल्पिक विकल्प वैरिएंट को बूटस्ट्रैप करने के लिए है ताकि वैरिएशन, एक पी-वैल्यू और एक आत्मविश्वास अंतराल का पता लगाया जा सके, भले ही समलिंग वितरण सामान्य न हो और इसका बंद रूप अज्ञात हो। एमआई मामले में फिर दो विकल्प हैं:

  • एमआई डेटा सेट में बूटस्ट्रैप्ड विचरण को पूल करें
  • MI डेटा सेट में पी-वैल्यू या विश्वास सीमा को पूल करें

पहला विकल्प फिर रुबिन के नियमों का उपयोग करेगा। हालाँकि, मेरा मानना ​​है कि यह समस्याग्रस्त है, अगर का गैर-सामान्य नमूना वितरण है। इस स्थिति में (या आमतौर पर, सभी स्थितियों में) बूटस्ट्रैप किए गए पी-मूल्य का उपयोग सीधे किया जा सकता है। हालाँकि, MI के मामले में, यह कई पी-वैल्यूज़ या कॉन्फिडेंस अंतराल की ओर ले जाएगा, जिसे MI डेटा सेटों में जमा करना होगा।θ

तो मेरा सवाल यह है: मुझे बहु-प्रतिक्षित डेटा सेटों में एकाधिक बूटस्ट्रैप किए गए पी-वैल्यू (या विश्वास अंतराल) को कैसे पूल करना चाहिए?

मैं आगे बढ़ने के किसी भी सुझाव का स्वागत करूंगा, धन्यवाद।


शायद मददगार: मिसिंग डेटा, इम्प्यूटेशन और बूटस्ट्रैप (एफ्रॉन 1992) के आँकड़े
।stanford.edu/sites/default/files/BIO%2520153.pdf

@ डॉल्मली हम्म, मैं उस कागज से परिचित नहीं हूं, लेकिन यह विचार पहले बूटस्ट्रैप के लिए लगता है , और फिर कई प्रतिरूपण का प्रदर्शन करता है। ओपी एमआई डेटासेट से अनुमान लगाता है।
tchakravarty

@fgnu वास्तव में, बूटस्ट्रैप द्वारा एक अनुमान के कुल विचरण करने के लिए मानक प्रक्रिया प्रत्येक MI डाटासेट के भीतर विचरण को बूटस्ट्रैप करना होगा, और फिर रुबिन के नियमों को MI डेटा सेट में बूटस्ट्रैप्ड विचरण पूल के लिए लागू करना होगा।
13

जवाबों:


6

मुझे लगता है कि दोनों विकल्पों के परिणामस्वरूप सही उत्तर मिलता है। सामान्य तौर पर, मैं विधि 1 को पसंद करूंगा क्योंकि यह संपूर्ण वितरण को संरक्षित करता है।

विधि 1 के लिए, एमआई समाधान में से प्रत्येक के भीतर पैरामीटर समय को बूटस्ट्रैप करें । फिर बस अपने अंतिम घनत्व को प्राप्त करने के लिए बूटस्ट्रैप्ड वितरणों को मिलाएं , अब नमूनों से मिलकर जो बीच-बीच में परिवर्तन को शामिल करता है। फिर विश्वास अंतराल प्राप्त करने के लिए एक पारंपरिक बूटस्ट्रैप नमूने के रूप में व्यवहार करें। छोटे नमूनों के लिए बायेसियन बूटस्ट्रैप का उपयोग करें। मैं इस प्रक्रिया की जांच करने वाले किसी भी अनुकार कार्य के बारे में नहीं जानता, और यह वास्तव में जांच की जाने वाली एक खुली समस्या है।×

विधि 2 के लिए, लिच-रुबिन प्रक्रिया का उपयोग करें। देखें कि कई प्रतिक्षित डेटासेट में किए गए परीक्षणों पर पूल किए गए पी-मान कैसे प्राप्त करें?


+1 - यदि लक्ष्य MI डेटासेट पर अनुमानों की परिवर्तनशीलता को समझना है, तो मैं प्रत्येक एमआई डेटासेट के अंदर बूटस्ट्रैप करूँगा और पैरामीटर के कुल और एमआई-विशिष्ट वितरण को देखूंगा।
DL Dahly

@ Stef-van-Buuren ऐसा लगता है कि DL Dahly क्या सुझाव देता है कि MI सेट में वर्जन को बढ़ाया गया है। क्या आप अभी भी इस 'अप्रत्यक्ष' दृष्टिकोण पर अपनी विधि एक (सभी बूटस्ट्रैप किए गए डेटा सेटों को जोड़ेंगे) पसंद करेंगे?
टॉमका

@tomka। मैं निश्चित रूप से डीएल दहली के रूप में ही करूंगा, और प्रतिरूपण वितरण के भीतर और बीच का अध्ययन करूंगा। दोनों प्रकार के वितरण को एकीकृत करने के लिए, हमें उन्हें किसी तरह से संयोजित करने की आवश्यकता है। मेरा सुझाव बस उन्हें मिलाना है।
स्टेफ वैन बुरेन

6

यह एक ऐसा साहित्य नहीं है जिससे मैं परिचित हूं, लेकिन इस तरीके से संपर्क करने का एक तरीका इस तथ्य को अनदेखा करना हो सकता है कि ये बूट-पी बटन हैं, और पी-वैल्यूज़ को गुणा किए गए डेटा सेटों के संयोजन पर साहित्य को देखें।

उस स्थिति में, ली, मेंग, रघुनाथन और रुबिन (1991) लागू होते हैं। प्रक्रिया प्रतिरूपण डेटासेट में से प्रत्येक पर आधारित होती है, जिसे इंप्यूटेशन के कारण सूचना हानि के माप का उपयोग करके भारित किया जाता है। वे आंकड़ों के संयुक्त वितरण से जुड़े मुद्दों में भाग लेते हैं, और वे कुछ सरल अनुमान लगाते हैं।

संबंधित रुचि मेंग (1994) है

अपडेट करें

बहु-प्रतिरूपित डेटासेट में पी-मान के संयोजन की एक प्रक्रिया क्रिस्टीन लिच, Ch के शोध प्रबंध में वर्णित है । यह विचार, जो वह डॉन रुबिन को बताती है, अनिवार्य रूप से वितरित किए जाने वाले पी-मूल्यों को बदलने के लिए अनिवार्य है, जिसे फिर जेड-सांख्यिकी के संयोजन के लिए मानक नियमों का उपयोग करके एमआई डेटासेट में जोड़ा जा सकता है।


अगर मैं ली एट अल को समझता हूं। सही ढंग से काम करें, यह उन आंकड़ों पर लागू होता है जो आपको प्रत्येक एमआई सेट से मिलते हैं। उदाहरण के लिए, यदि आपको प्रत्येक सेट पर पियर्सन ची² मिलता है, तो उनके नियमों को पूरे सेट में अनुमान के लिए संयोजित करने के लिए लागू किया जा सकता है। उदाहरण के लिए, एक वाल्ड परीक्षण भी आयोजित किया जा सकता है। लेकिन बूटस्ट्रैप के मामले में आपको एक आँकड़ा नहीं मिलता है, आप पूल (लेकिन केवल एक पी-मूल्य)। इसलिए मुझे यकीन नहीं है कि ली एट अल में कुछ है। जिसे बूटस्ट्रैप किए गए p पर लागू किया जा सकता है।
टॉमका

1
@tomka मैंने अपना उत्तर अपडेट कर दिया है।
tchakravarty
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.