रैंडम असाइनमेंट: परेशान क्यों?


9

रैंडम असाइनमेंट मूल्यवान है क्योंकि यह संभावित परिणामों से उपचार की स्वतंत्रता सुनिश्चित करता है। यही कारण है कि यह औसत उपचार प्रभाव के निष्पक्ष अनुमानों की ओर जाता है। लेकिन अन्य असाइनमेंट योजनाएं संभावित परिणामों से उपचार की स्वतंत्रता को व्यवस्थित रूप से सुनिश्चित कर सकती हैं। तो हमें यादृच्छिक असाइनमेंट की आवश्यकता क्यों है? एक और तरीका रखो, गैर-आयामी असाइनमेंट योजनाओं पर यादृच्छिक असाइनमेंट का क्या फायदा है जो निष्पक्ष निष्कासन का कारण बनता है?

Let उपचार असाइनमेंट का एक वेक्टर है जिसमें प्रत्येक तत्व 0 है (यूनिट को उपचार के लिए असाइन नहीं किया गया है) या 1 (यूनिट उपचार के लिए असाइन किया गया है)। एक JASA लेख में , एनग्रिस्ट, इमबेंस और रूबिन (1996, 446-47) का कहना है कि उपचार असाइनमेंट यादृच्छिक है अगर सभी \ mathbf {c} और \ mathbf {c'} के लिए, जैसे कि \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c "} , जहाँ \ iota a है 1 के बराबर सभी तत्वों के साथ कॉलम वेक्टर।ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

शब्दों में, यह दावा है कि असाइनमेंट Zi यादृच्छिक है यदि असाइनमेंट के किसी भी वेक्टर में उपचार के लिए m असाइनमेंट शामिल हैं, तो किसी भी अन्य वेक्टर के रूप में संभावना है कि उपचार के लिए m असाइनमेंट शामिल हैं ।

लेकिन, उपचार असाइनमेंट से संभावित परिणामों की स्वतंत्रता सुनिश्चित करने के लिए, यह सुनिश्चित करने के लिए पर्याप्त है कि अध्ययन में प्रत्येक इकाई को उपचार के लिए असाइनमेंट की समान संभावना है। और यह आसानी से हो सकता है भले ही अधिकांश उपचार असाइनमेंट वैक्टर में चुने जाने की शून्य संभावना हो। यही है, यह गैर-आयामी असाइनमेंट के तहत भी हो सकता है।

यहाँ एक उदाहरण है। हम चार इकाइयों के साथ एक प्रयोग चलाना चाहते हैं जिसमें दो का इलाज किया जाता है। छह संभव असाइनमेंट वैक्टर हैं:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

जहां प्रत्येक संख्या में पहला अंक इंगित करता है कि क्या पहली इकाई का इलाज किया गया था, दूसरा अंक इंगित करता है कि क्या दूसरी इकाई का इलाज किया गया था, और इसी तरह।

मान लीजिए कि हम एक प्रयोग चलाते हैं जिसमें हम असाइनमेंट वैक्टर 3 और 4 की संभावना को बाहर करते हैं, लेकिन जिसमें प्रत्येक अन्य वैक्टर में समान (25%) चुने जाने की संभावना होती है। यह योजना AIR अर्थ में यादृच्छिक असाइनमेंट नहीं है। लेकिन उम्मीद में, यह औसत उपचार प्रभाव के निष्पक्ष अनुमान की ओर जाता है। और वह कोई दुर्घटना नहीं है। कोई भी असाइनमेंट स्कीम जो विषयों को उपचार के लिए असाइनमेंट की समान संभावना देती है, एटीई के निष्पक्ष अनुमान की अनुमति देगा।

तो: हमें AIR अर्थ में यादृच्छिक असाइनमेंट की आवश्यकता क्यों है? मेरा तर्क यादृच्छिकरण निष्कर्ष में निहित है; यदि कोई मॉडल-आधारित निष्कर्ष के बजाय सोचता है, तो क्या आकाशवाणी परिभाषा अधिक रक्षात्मक है?


3
मैंने Angrist et al। नहीं पढ़ा है, इसलिए हो सकता है कि मुझे कुछ याद आ रहा हो, लेकिन मेरे पास आपके प्रश्न करने की क्षमता है। हम यह सुनिश्चित करने के लिए यादृच्छिक असाइनमेंट का उपयोग नहीं करते हैं कि उपचार संभावित परिणामों से स्वतंत्र है। क्या उपचार एक सच्चे प्रयोग में परिणामों से स्वतंत्र है या नहीं, इस बात पर निर्भर करता है कि उपचार और परिणाम का सीधा कारण कनेक्शन बी / टी है या नहीं। इसके बजाय, यादृच्छिक असाइनमेंट यह सुनिश्चित करता है कि उपचार गुप्त चर (या संभावित कन्फ़्यूडर) से स्वतंत्र है । यह संभावना है कि परिणाम उस उपचार के अलावा किसी अन्य चीज के कारण होता है जिसे हम बाहर करने की उम्मीद करते हैं।
गूँग - मोनिका

1
@gung, मुझे लगता है कि आप "संभावित परिणामों" और "परिणामों" को भ्रमित कर रहे हैं। यह सच है कि यादृच्छिक असाइनमेंट परिणामों से उपचार की स्वतंत्रता को सुनिश्चित नहीं करता है (अर्थात, मनाया परिणामों से)। लेकिन संभावित परिणाम देखे गए परिणामों के समान नहीं हैं, और यादृच्छिक असाइनमेंट संभावित परिणामों से उपचार की स्वतंत्रता सुनिश्चित करता है। मैं इस बिंदु पर विस्तार करने के लिए मूल पोस्ट को संपादित नहीं करूंगा; ऐसा करना मुझे मुख्य विषय से बहुत दूर ले जाएगा। लेकिन en.wikipedia.org/wiki/Rubin_causal_model इस बिंदु पर मददगार हो सकता है।
user697473

3
"[टी] ओ उपचार असाइनमेंट से संभावित परिणामों की स्वतंत्रता सुनिश्चित करता है, यह सुनिश्चित करने के लिए पर्याप्त है कि अध्ययन में प्रत्येक इकाई में उपचार के लिए असाइनमेंट की समान संभावना है।" यह गलत है। मान लीजिए कि आपने एक अध्ययन में पुरुषों और महिलाओं को नामांकित किया है। एक उचित सिक्का फ्लिप करें: यदि सिर, सभी महिलाओं को उपचार समूह (और नियंत्रण समूह के सभी पुरुषों) को असाइन करें; यदि पूंछ होती है, तो सभी पुरुष उपचार समूह में और नियंत्रण समूह में सभी महिलाएं होंगी। प्रत्येक विषय (स्पष्ट रूप से) में उपचार समूह को असाइनमेंट का 50% मौका है - लेकिन उपचार पूरी तरह से लिंग के साथ भ्रमित है। xx
whuber

1
@whuber, आपकी टिप्पणी सही नहीं है। क्यों देखें, मान लें कि = 1. पुरुष के संभावित परिणाम हैं Y (1) = 1 और Y (0) = 0. (यानि कि, = 1 यदि पुरुष का इलाज किया जाता है, तो 0 महिला के लिए)। संभावित परिणाम Y (1) = -1 और Y (0) = 2. (विशेष संभावित परिणाम अधिक मायने नहीं रखते, लेकिन छोटे पूर्णांक चीजों को सरल रखते हैं।) फिर E [Y (1) | Z] = E [Y (1)] = 0. समान समानताएँ E [Y (0)] के लिए रखती हैं। आम तौर पर, आपका असाइनमेंट तंत्र लिंग के साथ भ्रमित नहीं होता है, और यह एक निष्पक्ष एटीई अनुमान का उत्पादन करेगा। अगर मैं कुछ गलत समझ रहा हूं, तो कृपया मुझे बताएं। xYm
user697473

3
निश्चित रूप से, अनुमान "निष्पक्ष" उसी अर्थ में है कि एक रुकी हुई घड़ी समय का निष्पक्ष अनुमान देती है! वास्तव में, यह उससे भी बदतर है: यादृच्छिक चयन की इस पद्धति से परिणाम मिलते हैं जिन्हें उपचार के लिए जिम्मेदार नहीं ठहराया जा सकता है, क्योंकि वे सिर्फ लिंग के लिए जिम्मेदार ठहराया जा सकता है। यही मतलब है कि confounding है। प्रयोग में शामिल सभी उपयोगी जानकारी को नष्ट करते हुए निष्पक्ष परिणाम प्राप्त करने पर ध्यान केंद्रित बच्चे से बाहर लौकिक फेंक है ...
whuber

जवाबों:


8

यह गंग की टिप्पणी पर अनुसरण करता है। कुल मिलाकर औसत उपचार प्रभाव बिंदु नहीं है।

मान लें कि आपके पास नए मधुमेह के मामले हैं जहां विषय से वर्ष की आयु के बीच है , और से अधिक नए मधुमेह रोगी हैं । आप उपचार के लिए आधा असाइन करना चाहते हैं। क्यों नहीं एक सिक्का, और सिर पर, युवा रोगियों के सभी का इलाज, और पूंछ पर, पुराने रोगियों के सभी का इलाज? प्रत्येक के पास100051510003050%फ्रो ट्रीटमेंट का चयन करने का मौका मिलता है, इसलिए यह ट्रीटमेंट के औसत परिणाम को बायस नहीं करेगा, लेकिन यह बहुत सारी जानकारी को फेंक देगा। यह आश्चर्य की बात नहीं होगी अगर किशोर मधुमेह या छोटे रोगी या तो टाइप II या गर्भावधि मधुमेह वाले पुराने रोगियों की तुलना में बहुत बेहतर या बदतर प्रतिक्रिया दें। देखा गया उपचार प्रभाव निष्पक्ष हो सकता है, लेकिन उदाहरण के लिए, इसमें यादृच्छिक असाइनमेंट की तुलना में बहुत अधिक मानक विचलन होगा, और बड़े नमूने के बावजूद आप बहुत कुछ नहीं कह पाएंगे। यदि आप यादृच्छिक असाइनमेंट का उपयोग करते हैं, तो उच्च संभावना के साथ प्रत्येक आयु वर्ग में लगभग मामलों को उपचार मिलेगा, इसलिए आप प्रत्येक आयु वर्ग के भीतर उपचार की तुलना करने में सक्षम होंगे। 500

आप यादृच्छिक असाइनमेंट का उपयोग करने की तुलना में बेहतर करने में सक्षम हो सकते हैं। यदि आपको लगता है कि एक कारक आपको लगता है कि उपचार की प्रतिक्रिया को प्रभावित कर सकता है, तो आप यह सुनिश्चित करना चाहते हैं कि उस विशेषता वाले विषय यादृच्छिक असाइनमेंट के मुकाबले अधिक समान रूप से विभाजित हों। यादृच्छिक असाइनमेंट आपको एक साथ सभी कारकों के साथ यथोचित रूप से अच्छी तरह से करने देता है, ताकि आप बाद में कई संभावित पैटर्न का विश्लेषण कर सकें।


धन्यवाद, डगलस। यह जवाब मुझे समझ में आता है। रिकॉर्ड के लिए, मुझे आपके उदाहरण या @ व्हिबर के ऊपर दिए गए उदाहरण के रूप में कुछ भी ध्यान में नहीं था। मैं उन मामलों के बजाय सोच रहा था जिनमें हम केवल कुछ उपचार वैक्टरों पर विचार करने से दूर हो जाते हैं। (ऐसे मामले पर विचार करें जिसमें एक ग्राहक कहता है कि "आप इस व्यक्ति या उस व्यक्ति का इलाज कर सकते हैं, लेकिन दोनों का नहीं।") लेकिन मुझे लगता है कि आपके सामान्य बिंदु भी मेरे पास मौजूद माइल्डर मामलों के लिए हैं।
user697473

मुझे लगता है कि यदि आप केवल कुछ वैक्टर को खत्म करते हैं, तो आप उन सूचनाओं को नहीं बदल सकते हैं जिन्हें आप अधिक मात्रा में निकाल सकते हैं। इसे सही मात्रा में गन्दा किया जा सकता है - भोली सीमाएं हैं जो संभवतः बहुत निराशावादी हैं।
डगलस ज़ारे

@DouglasZare मेरे पास आपके चरम उदाहरण के बारे में एक प्रश्न है। मेरा मानना ​​है कि लक्ष्य यह जानना है कि क्या उपचार आबादी के लिए प्रभावी है जिसमें युवा और बूढ़े दोनों रोगी हैं। फिर, आपकी विधि दो नमूने उत्पन्न करेगी जिन्हें संभावित परिणाम वितरण से प्रतिनिधि नमूने के रूप में नहीं माना जा सकता है जहां सभी लोग उपचार लेते हैं और संभावित परिणाम वितरण जहां सभी लोग नियंत्रण लेते हैं। तो फिर आपका मनाया उपचार प्रभाव पक्षपाती हैFtFc
केविनकिम

1

अपने उदाहरण में आप 2 और 5 को भी छोड़ सकते हैं और अपने आप को प्रतिवाद नहीं कर सकते। एक आइटम स्तर पर अभी भी 1 या 0 होने का एक समान मौका है, जब 1 या 6 का चयन करने का सिर्फ 1: 1 अंतर है, लेकिन अब आपने 3 और 4 को हटाकर जो किया वह अधिक स्पष्ट हो जाता है।


धन्यवाद, जॉन। हाँ आप सही हैं। ऐसा लगता है कि हम किसी भी संयोजन में जितने उपचार असाइनमेंट वैक्टर को समाप्त कर सकते हैं, उतने समय तक हम शेष वैक्टरों का उपयोग इस तरह से करते हैं जिससे प्रत्येक इकाई को उपचार के लिए असाइनमेंट की समान संभावना मिलती है।
user697473

मुझे नहीं लगता कि आप वही कह रहे हैं जो मैं कह रहा हूं। मैंने जो तर्क प्रस्तुत किया है, वह आपके तर्क के लिए बेतुका मामला है जो इसके खिलाफ तर्क देता है।
जॉन

आपका उदाहरण चरम है, लेकिन मुझे इसके बारे में कुछ भी बेतुका नहीं लगता है। यह बिंदु का एक वैध प्रदर्शन है: गैर-आयामी असाइनमेंट योजनाएं (जैसे केवल वैक्टर 1 और 6 का उपयोग करके) औसत उपचार प्रभाव के निष्पक्ष अनुमान के लिए सीधे नेतृत्व कर सकती हैं। यह इस प्रकार है कि निष्पक्ष एटीई अनुमान प्राप्त करने के लिए हमें यादृच्छिक असाइनमेंट की आवश्यकता नहीं है। बेशक, वहाँ अभी तक कारण हो सकता है क्यों 2 के माध्यम से वैक्टर 2 को खत्म करने के लिए बुरा है। (ऊपर डगलस ज़ारे की टिप्पणी देखें ।) मैंने अभी तक इन कारणों के बारे में नहीं सोचा है।
user697473

तुम्हे करना चाहिए। इसलिए आप उन्हें खत्म नहीं कर सकते।
जॉन

1

यहाँ एक और गुप्त या भ्रमित चर है: समय (या वाद्य बहाव, नमूना भंडारण के प्रभाव, आदि)।
इसलिए रैंडमाइजेशन के खिलाफ तर्क हैं (जैसा कि डगलस कहते हैं: आप रैंडमाइजेशन से बेहतर कर सकते हैं)। उदाहरण के लिए, आप पहले ही जान सकते हैं कि आप चाहते हैं कि आपके मामले समय के साथ संतुलित हों। जिस तरह आप पहले से जान सकते हैं कि आप लिंग और उम्र को संतुलित रखना चाहते हैं।

दूसरे शब्दों में, यदि आप अपनी 6 योजनाओं में से एक को मैन्युअल रूप से चुनना चाहते हैं, तो मैं कहूंगा कि 1100 (या 0011) एक निश्चित रूप से खराब विकल्प है। ध्यान दें कि आपके द्वारा फेंके गए पहले कब्जे वाले वे हैं जो समय में सबसे अधिक संतुलित हैं ... और सबसे खराब दो को छोड़ दिया जाता है जब जॉन ने 2 और 5 को बाहर करने का प्रस्ताव दिया था (जिसके खिलाफ आपने विरोध नहीं किया था)।
दूसरे शब्दों में, आपका अंतर्ज्ञान जो योजनाएं "अच्छा" हैं दुर्भाग्य से खराब प्रयोगात्मक डिजाइन की ओर जाता है (IMHO यह काफी सामान्य है; शायद आदेश दिया चीजों को अच्छे लग रहे हैं - और यकीन है कि प्रयोग के दौरान तार्किक अनुक्रम का ट्रैक रखना आसान है)।

आप गैर-यादृच्छिक योजनाओं के साथ बेहतर करने में सक्षम हो सकते हैं, लेकिन आप बहुत बुरा करने में सक्षम हैं। IMHO, आपको भौतिक / रासायनिक / जैविक / चिकित्सा / ... आपके द्वारा उपयोग की जाने वाली विशेष गैर-यादृच्छिक योजना के लिए तर्क देने में सक्षम होना चाहिए, यदि आप एक गैर-यादृच्छिक योजना के लिए जाते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.