यादृच्छिक (MAR) से पूरी तरह से गायब (random)


13

मैंने इन दोनों को कई बार समझाया है। वे मेरे दिमाग को खाना बनाना जारी रखते हैं। रैंडम न होने पर मिसिंग होना मायने रखता है, और रैंडम पर पूरी तरह से मिस करना समझ में आता है ... यह रैंडम पर मिसिंग है जो उतना नहीं है।

क्या डेटा को जन्म देता है जो MAR होगा लेकिन MCAR नहीं?


क्या आपके प्रश्न का उत्तर इस अन्य प्रश्न से मिलता है, क्या नाम "मिसिंग एट रैंडम" का एक अच्छा कारण है? , और वे संसाधनों की सूची?
एंडी डब्ल्यू

3
@AndyW कुंद होने के लिए, नहीं। नाम क्यों त्रुटिपूर्ण है, और एक सदस्यता दीवार के पीछे दुबका हुआ है, इस पर एक दिलचस्प चर्चा।
21

जवाबों:


18

रैंडम (MAR) को मिस करने का मतलब है कि लापताता को उन चरों द्वारा समझाया जा सकता है जिन पर आपको पूरी जानकारी है। यह एक परीक्षण योग्य धारणा नहीं है, लेकिन ऐसे मामले हैं जहां यह उचित है या नहीं।

उदाहरण के लिए, राजनीतिक जनमत सर्वेक्षण करें। कई लोग जवाब देने से इनकार कर देते हैं। यदि आप मानते हैं कि जिन कारणों से लोग जवाब देने से इनकार करते हैं, वे पूरी तरह से जनसांख्यिकी पर आधारित होते हैं, और यदि आपके पास प्रत्येक व्यक्ति पर जनसांख्यिकी है, तो डेटा MAR है। यह ज्ञात है कि लोगों द्वारा उत्तर देने से इंकार करने के कुछ कारण जनसांख्यिकी पर आधारित हो सकते हैं (उदाहरण के लिए, कम और उच्च आय वाले लोगों के बीच के लोगों की तुलना में उत्तर देने की संभावना कम होती है), लेकिन वास्तव में ऐसा करने का कोई तरीका नहीं है पूरी व्याख्या है।

तो, सवाल यह है कि "क्या यह पर्याप्त है?"। अक्सर, कई प्रतिरूपण जैसे तरीके अन्य विधियों की तुलना में बेहतर काम करते हैं, जब तक कि डेटा बहुत ही गायब न हो, यादृच्छिक नहीं है।


5
जर्नल ऑफ़ स्टैटिस्टिकल सॉफ्टवेयर (ऑनलाइन) में कई अशुद्धियों के बारे में हाल ही में एक मुद्दा था, और मैं आर: और Amelia, के लिए बिग थ्री मल्टीपल इम्प्यूटेशन पैकेज देख रहा हूँ । समानता और अंतर आकर्षक हैं। ( 's काफी दिलचस्प है।)mimiceAmeliaover impute
वेन

1
: यहाँ जेएसएस मुद्दे के लिए लिंक है jstatsoft.org/v45
को पुनः स्थापित मोनिका - गुंग

12

मुझे यकीन नहीं है कि यह सही है, लेकिन जिस तरह से मैंने इसे समझने की कोशिश की है वह ऐसा है जैसे कि संभावनाओं का 2x2 मैट्रिक्स है जो काफी सममित नहीं है। कुछ इस तरह:

Pattern  /   Data Explains Pattern

            Yes         No

Yes         MAR        MNAR

No          --         MCAR

यही है, अगर किसी चर के लापता होने के लिए एक पैटर्न है और जो डेटा हमारे पास नहीं है, तो हम उसे समझा सकते हैं कि हमारे पास एमएनएआर है, लेकिन अगर हमारे पास जो डेटा है (यानी हमारे डेटा सेट में अन्य चर), तो हम यह बता सकते हैं कि हमारे पास मार्च है। यदि लापता होने के लिए कोई पैटर्न नहीं है, तो यह MCAR है।

मैं यहाँ से जा सकता हूँ। इसके अलावा, यह पत्ते "पैटर्न" की परिभाषा को खोलते हैं, और "डेटा बताते हैं"। मुझे लगता है कि "डेटा व्याख्या" का अर्थ है कि आपके डेटा सेट में अन्य चर इसे समझाते हैं, लेकिन मेरा मानना ​​है कि आपकी प्रक्रिया इसे भी समझा सकती है (उदाहरण के लिए एक अन्य धागे में एक अच्छा उदाहरण है यदि आपके पास तीन माप चर हैं जो एक ही चीज़ को मापते हैं और आपका प्रक्रिया है यदि पहले दो माप बहुत असहमत हैं तो आप तीसरा माप लेते हैं)।

क्या यह अंतर्ज्ञान, सीवी के लिए पर्याप्त सटीक है?


बहुत उपयोगी दृश्य। धन्यवाद!
skeller88

-1

मैं भी अंतर को समझने के लिए संघर्ष कर रहा था, इसलिए शायद कुछ उदाहरण मदद कर सकते हैं।

MCAR : पूरी तरह से यादृच्छिक पर गुम , यह बहुत अच्छा है। इसका मतलब है कि गैर-प्रतिक्रिया पूरी तरह से यादृच्छिक है। इसलिए आपका सर्वेक्षण पक्षपाती नहीं है।

मार्च : बेतरतीब , बदतर स्थिति में गुम । कल्पना कीजिए कि आप आईक्यू के लिए पूछ रहे हैं और आपके पास पुरुषों की तुलना में बहुत अधिक महिला प्रतिभागी हैं। आपके लिए भाग्यशाली, आईक्यू लिंग से संबंधित नहीं है, इसलिए आप पूर्वाग्रह को कम करने के लिए लिंग (वजन को लागू करना) के लिए नियंत्रित कर सकते हैं।

MNAR : बेतरतीब , ख़राब नहीं है। आय के स्तर के लिए सर्वेक्षण करने पर विचार करें। और फिर, आपके पास पुरुषों की तुलना में अधिक महिलाएं हैं। इस मामले में, यह एक समस्या है, क्योंकि आय का स्तर लिंग से संबंधित है। इसलिए आपके परिणाम पक्षपाती होंगे। आसानी से छुटकारा पाने के लिए नहीं।

आप देखते हैं, यह लक्ष्य चर (Y, जैसे आय), सहायक चर (X, जैसे उम्र) और प्रतिक्रिया व्यवहार (R, प्रतिक्रिया समूह) के बीच "त्रिकोण" संबंध है। यदि X केवल R से संबंधित है, तो अच्छा-ईश (MAR)। यदि एक्स और आर और एक्स और वाई के बीच संबंध है, तो इसका बुरा (MNAR)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.