कई आरोपण के बाद पूलिंग अंशांकन भूखंड


15

मैं कई प्रतिरूपण के बाद अंशांकन भूखंडों / आंकड़ों को पूल करने की सलाह चाहूंगा। भविष्य की घटना की भविष्यवाणी करने के लिए सांख्यिकीय मॉडल विकसित करने की सेटिंग में (जैसे अस्पताल रिकॉर्ड से डेटा का उपयोग करके पोस्ट डिस्चार्ज अस्तित्व या घटनाओं की भविष्यवाणी करने के लिए), कोई कल्पना कर सकता है कि बहुत सारी लापता जानकारी है। मल्टीपल इंप्यूटेशन ऐसी स्थिति से निपटने का एक तरीका है, लेकिन इंप्यूटेंट की अंतर्निहित अनिश्चितता के कारण अतिरिक्त परिवर्तनशीलता को ध्यान में रखते हुए प्रत्येक इंप्यूटेशन डेटासेट से टेस्ट के आँकड़ों को पूल करने की आवश्यकता है।

मैं समझता हूं कि कई अंशांकन आँकड़े (होस्मेर-लेमेशो, हरेल के एमैक्स, अनुमानित अंशांकन सूचकांक आदि) हैं, जिसके लिए पूलिंग के लिए 'नियमित' रूबिन के नियम लागू हो सकते हैं।

हालांकि, ये आँकड़े अक्सर अंशांकन के समग्र उपाय हैं जो मॉडल के विशिष्ट मिस-कैलिब्रेटेड क्षेत्रों को नहीं दिखाते हैं। इस कारण से, मैं एक अंशांकन भूखंड देखना चाहूंगा। अफसोस है कि मैं प्लॉट्स को 'पूल' या उनके पीछे के डेटा को कैसे प्रति व्यक्ति (प्रति व्यक्ति और प्रति व्यक्ति देखे गए परिणामों की अनुमानित संभावनाएं) के रूप में देखता हूं, और बायोमेडिकल साहित्य (मैं जिस क्षेत्र से परिचित हूं, उसमें बहुत कुछ नहीं मिल सकता) या यहाँ, CrossValidated पर। बेशक, प्रत्येक इंप्यूटेशन डेटासेट के कैलिब्रेशन प्लॉट को देखना एक जवाब हो सकता है, लेकिन जब बहुत सारे इंप्यूटेशन सेट बन जाते हैं, तो वे काफी परेशान हो सकते हैं।

इसलिए मैं पूछना चाहता हूं कि क्या ऐसी तकनीकें हैं जो एक अंशांकन प्लॉट में परिणामित होंगी, कई प्रतिरूपण (?) के बाद जमा हो जाएगी।


क्या बूटस्ट्रैप किए गए नमूनों को सीधे पूल करना और उस नमूने के अंशांकन का मूल्यांकन करना संभव है?
एडमों

@ अदमो तुम सीधे पूलिंग से क्या मतलब है? और आप किन बूटस्ट्रैप नमूनों का उल्लेख करते हैं?
आईडब्ल्यूएस

2
क्षमा करें, मुझे वापस जाने दें, (मैं एमआई को बूटस्ट्रैप के रूप में सोचता हूं)। मैं कह रहा हूं, अगर आपका n 1,000 है और आपके पास 5 MI डेटासेट हैं, तो 5000 में से एक भी कैलिब्रेशन प्लॉट क्यों न बनाएं और उन 5,000 में जो भी वांछित फैशन है, उसकी तुलना की गई है?
एडमो

@ अदमो दिलचस्प लगता है, इसके लिए उन कार्यों के समायोजन की आवश्यकता होती है जो एक विश्वास अंतराल प्रदान करते हैं। इस विचार को वापस करने के लिए कोई संदर्भ या सिद्धांत?
IWS

2
कोई संदर्भ नहीं, हमने हाल ही में एक पेपर प्रकाशित किया था जहां हमने बिना सबूत के कहा था कि हम बूटस्ट्रैप मानक त्रुटियों और कई आवेगों के लिए इस तरह से उन्हें एक साथ पूल करके निष्कर्ष निकालते हैं। मुझे लगता है कि आप यह बता सकते हैं कि विश्लेषण का उद्देश्य 0.05 स्तर पर परीक्षण कर रहा है कि अपेक्षा / अवलोकन अनुपात या अंतर एक सामान्य वितरण सीमा के भीतर है और यह मात्रात्मक अनुमान नमूना आकार के लिए अपरिवर्तनीय है, इसलिए 95% सीआई के आधार पर परीक्षण पूलिंग से प्रभावित नहीं है।
एडमो

जवाबों:


1

[...] अगर आपका n 1,000 है और आपके पास 5 MI डेटासेट हैं, तो 5000 में से एक भी कैलिब्रेशन प्लॉट क्यों न बनाएं और उन 5,000 में जो भी वांछित फैशन है, उसकी तुलना की गई है?

संदर्भ के बारे में:

कोई संदर्भ नहीं, हमने हाल ही में एक पेपर प्रकाशित किया था, जहां हमने बिना सबूत के कहा था कि हम बूटस्ट्रैप मानक त्रुटियों के लिए निष्कर्ष निकालते हैं और उन्हें इस तरह से एक साथ पूल करके कई प्रतिरूपण किए जाते हैं। मुझे लगता है कि आप यह बता सकते हैं कि विश्लेषण का उद्देश्य 0.05 स्तर पर परीक्षण कर रहा है कि उम्मीद / अवलोकन अनुपात या अंतर एक सामान्य वितरण सीमा के भीतर है और यह कि मात्रात्मक अनुमान नमूना आकार के लिए अपरिवर्तनीय है, इसलिए 95% सीआई पर आधारित परीक्षण पूलिंग से प्रभावित नहीं है।


1
मैंने इस टिप्पणी को @AdamO द्वारा एक समुदाय विकि उत्तर के रूप में कॉपी किया है क्योंकि यह टिप्पणी कमोबेश इस प्रश्न का उत्तर है। हमारे पास उत्तर और प्रश्नों के बीच एक नाटकीय अंतर है। समस्या का कम से कम हिस्सा यह है कि कुछ प्रश्नों का उत्तर टिप्पणियों में दिया गया है: यदि टिप्पणियों ने जो प्रश्न का उत्तर दिया, उसके बजाय उत्तर थे, तो हमारे पास कम अनुत्तरित प्रश्न होंगे।
mkt - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.