प्रोग्रेसेंस के कारण प्रॉपरिटी स्कोर मैचिंग वर्क क्यों करता है?


13

प्रिजर्वेशन स्कोर मिलान का उपयोग अवलोकन संबंधी अध्ययनों में कारण निष्कर्ष बनाने के लिए किया जाता है ( रोसेनबम / रुबिन पेपर देखें )। यह काम करने के पीछे सरल अंतर्ज्ञान क्यों है?

दूसरे शब्दों में, यदि हम यह सुनिश्चित करते हैं कि उपचार में भाग लेने की संभावना दो समूहों के लिए समान है, तो भ्रामक प्रभाव गायब हो जाते हैं, और हम परिणाम का उपयोग उपचार के बारे में निष्कर्ष निकालने के लिए कर सकते हैं?


8
मेरा शायद एक अलोकप्रिय राय है, लेकिन मुझे लगता है कि पीएसएम कह रहा है कि आप कारण बनाने के लिए अनुमति दे रहे हैं यह थोड़ा खींच रहा है। हां, यह मुट्ठी भर वैरिएबल पर "क्रूड" की तुलना में एक महीन मिलान विधि है, लेकिन दिन के अंत में, आप अभी भी केवल उन चरों पर ही मिलान कर रहे हैं जो आपके लिए अवलोकन योग्य हैं। आपके पास अभी भी अंतर्जात उपचार हो सकता है, लेकिन आप यह धारणा बनाते हैं कि मिलान के बाद, उपचार बहिर्जात है। लेकिन फिर, मैं रुबिन की पसंद की तुलना में कोई भी नहीं हूं :)
मार्किस डे कारबास

5
ऐसे लोग हैं जो रोसेनबाम और रुबिन से असहमत हैं। गैरी किंग ने बहुत प्रभावी ढंग से तर्क दिया है कि पीएसएम का उपयोग करके मिलान से प्राप्त परिणाम महालनोबिस दूरी के आधार पर मिलान से प्राप्त परिणामों से हीन हैं। अपने कागज यहाँ देखें ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 इसके अलावा, इस वेबिनार भी अधिक सम्मोहक सबूत प्रदान करता है ... methods-colloquium.com/...
माइक हंटर

4
सिद्धांत रूप में, आप रुबिन के कारण मॉडल को लागू करने के लिए कारण निष्कर्ष बना सकते हैं यदि सभी मान्यताओं को पूरा किया जाता है। लेकिन निश्चित रूप से शैतान हमेशा धारणा के विवरण में होता है, और मेरे लिए, बिना किसी भ्रमित कन्फ्यूडर की धारणा अक्सर एक कठिन होती है। वास्तव में, यह साबित करना असंभव है। लेकिन आप कम से कम संवेदनशीलता विश्लेषण यह निर्धारित करने के लिए कर सकते हैं कि आपके निष्कर्षों को बदलने के लिए क्या होगा, अगर आपके पास अप्रतिष्ठित कन्फ़्यूडर थे।
स्टैट्सस्टूडेंट

5
अच्छी बात @DJohnson। वहाँ भी यहूदिया पर्ल, इयान Shrier, और Arvid Sjolander की पसंद कर रहे हैं जो रुबिन के संभावित परिणाम फ्रेमवर्क के लिए महत्वपूर्ण हैं क्योंकि "एम-बायस" को शुरू करने की संभावना के कारण वे "कोलाइडर" कहते हैं। वे दिलचस्प पढ़े हुए हैं और रुबिन से किसी भी रीडिंग को पूरक होना चाहिए।
स्टैट्सस्टूडेंट

जवाबों:


12

मैं आपको गणित पर कम से कम जोर देने के साथ सहज ज्ञान देने की कोशिश करूंगा।

अवलोकन डेटा के साथ मुख्य समस्या और विश्लेषण करता है कि स्टेम इससे भ्रमित है। कन्फ़्यूज़न तब होता है जब एक चर न केवल निर्धारित उपचार को प्रभावित करता है, बल्कि परिणाम भी। जब एक यादृच्छिक प्रयोग किया जाता है, तो विषयों को उपचार के लिए यादृच्छिक किया जाता है ताकि, औसतन, प्रत्येक उपचार को सौंपे गए विषयों को कोवरिएट्स (आयु, जाति, लिंग, आदि) के संबंध में समान होना चाहिए। इस यादृच्छिकरण के परिणामस्वरूप, यह संभावना नहीं है (विशेष रूप से बड़े नमूनों में) कि परिणाम में अंतर किसी भी कोवरिएट्स के कारण होता है, लेकिन लागू उपचार के कारण, चूंकि औसतन, उपचार समूहों में कोवरिएट्स समान होते हैं।

दूसरी ओर, अवलोकन डेटा के साथ कोई यादृच्छिक तंत्र नहीं है जो विषयों को उपचार प्रदान करता है। उदाहरण के लिए एक मानक सर्जिकल प्रक्रिया की तुलना में एक नई दिल की सर्जरी के बाद रोगियों के जीवित रहने की दर की जांच करने के लिए एक अध्ययन करें। आमतौर पर कोई भी व्यक्ति नैतिक कारणों से रोगियों को प्रत्येक प्रक्रिया के लिए यादृच्छिक नहीं कर सकता है। परिणामस्वरूप रोगी और चिकित्सक उपचार में से एक में आत्म-चयन करते हैं, अक्सर उनके कोवरिएट्स से संबंधित कई कारणों के कारण। उदाहरण के लिए यदि आप बड़े हैं, तो नई प्रक्रिया कुछ जोखिम भरी हो सकती है, और परिणामस्वरूप डॉक्टर नए उपचार की सिफारिश युवा रोगियों को अधिक बार कर सकते हैं। यदि ऐसा होता है और आप जीवित रहने की दरों को देखते हैं, तो नया उपचार अधिक प्रभावी हो सकता है, लेकिन यह भ्रामक होगा क्योंकि छोटे रोगियों को इस उपचार के लिए सौंपा गया है और छोटे रोगी लंबे समय तक जीवित रहते हैं, बाकी सब बराबर। यह वह जगह है जहाँ प्रवृत्ति स्कोर काम में आते हैं।

प्रोज़ेन्शन स्कोर, कार्य-कारण की मूलभूत समस्या से निपटने में मदद करता है - कि आपके पास उपचार के लिए विषयों के गैर-यादृच्छिककरण के कारण भ्रम हो सकता है और यह अकेले "हस्तक्षेप" या उपचार के बजाय आपको दिखाई देने वाले "प्रभावों" का कारण हो सकता है। यदि आप किसी तरह से अपने विश्लेषण को संशोधित करने में सक्षम थे ताकि उपचार समूहों के बीच कोवरिएट्स (आयु, लिंग, लिंग, स्वास्थ्य की स्थिति) "संतुलित" रहे, तो आपके पास इस बात के पुख्ता सबूत होंगे कि परिणामों में अंतर हस्तक्षेप / उपचार के कारण है इसके बजाय इन कोवरिएट्स। प्रवृत्ति स्कोर, प्रत्येक विषय की संभावना को निर्धारित करते हैं कि उन्हें उपचार के लिए सौंपा गया था जो उन्हें मनाया कोवराइट्स का सेट दिया गया था। यदि आप इन संभावनाओं (मिलान स्कोर) पर मेल खाते हैं,

आप पूछ सकते हैं कि वास्तव में कोवरिएट्स पर मेल क्यों नहीं किया जाता है (उदाहरण के लिए सुनिश्चित करें कि आप उपचार में अच्छे स्वास्थ्य में 40 वर्ष के पुरुषों से मेल खाते हैं 1 उपचार में अच्छे स्वास्थ्य में 40 वर्षीय पुरुषों के साथ)? यह बड़े नमूनों और कुछ कोवरिएट्स के लिए ठीक काम करता है, लेकिन यह तब करना लगभग असंभव हो जाता है जब नमूना का आकार छोटा होता है और कोवरिएट्स की संख्या भी मध्यम आकार की होती है (देखें क्रॉस-वैलिडिटी के अभिशाप को देखें कि ऐसा क्यों है) ।

अब, यह सब कहा जा रहा है, भविष्यवाणी के स्कोर के एकिलस एड़ी बिना किसी भ्रमित कन्फ्यूडर की धारणा है। यह धारणा बताती है कि आप अपने समायोजन में किसी भी कोवरिएट्स को शामिल करने में विफल नहीं हुए हैं जो संभावित कन्फ्यूडर हैं। सहज रूप से, इसके पीछे का कारण यह है कि यदि आपने अपना प्रिवेंस स्कोर बनाते समय एक कन्फ़्यूडर को शामिल नहीं किया है, तो आप इसके लिए कैसे समायोजित कर सकते हैं? अतिरिक्त धारणाएं भी हैं जैसे कि स्थिर इकाई उपचार मूल्य धारणा, जिसमें कहा गया है कि एक विषय को सौंपा गया उपचार अन्य विषयों के संभावित परिणाम को प्रभावित नहीं करता है।


7

एक सख्त अर्थ में, प्रतिगमन मॉडलिंग की तुलना में प्रॉपर सेंस एडजस्टमेंट का कोई औचित्य नहीं है। प्रॉपर्टीज स्कोर के साथ एकमात्र वास्तविक अंतर यह है कि वे अधिक अवलोकन संभावित कन्फ्यूडर के लिए समायोजित करना आसान बनाते हैं, जिससे नमूना आकार प्रतिगमन मॉडल को शामिल करने की अनुमति दे सकता है। घनत्व स्कोर समायोजन (सबसे अच्छा मामलों में बहुमत में कोवरिएट समायोजन के माध्यम से किया जाता है, लॉज पीएस में एक तख़्ता का उपयोग करके) को डेटा कमी तकनीक के रूप में माना जा सकता है जहां कमी एक महत्वपूर्ण अक्ष के साथ है - भ्रमित। हालाँकि, यह परिणाम विषमता (संवेदनशीलता पूर्वाग्रह) को संभालता नहीं है, इसलिए आपको भविष्यवाणियों का उपयोग करते समय भी महत्वपूर्ण महत्वपूर्ण सहसंयोजकों के लिए समायोजित करना होगा (बाधाओं और जोखिम वाले अनुपातों के गैर-ढहने से संबंधित मुद्दों को भी देखें)।

प्रॉपर्टीज स्कोर मिलान कई अवलोकनों को बाहर कर सकता है और इस तरह बहुत अक्षम हो सकता है। मैं किसी भी विधि को देखता हूं जो प्रासंगिक टिप्पणियों को समस्याग्रस्त के रूप में शामिल करता है। मिलान के साथ वास्तविक समस्या यह है कि यह 1: 1 मिलान के लिए कुछ कथित आवश्यकता के कारण आसानी से मिलान किए गए टिप्पणियों को बाहर करता है, और अधिकांश मिलान एल्गोरिदम अवलोकन आदेश-निर्भर हैं।

ध्यान दें कि गैर-ओवरलैप क्षेत्रों के लिए जाँच करने और बाहर करने के लिए मानक प्रतिगमन समायोजन करते समय यह बहुत आसान है। प्रवृत्ति स्कोर उपयोगकर्ताओं को ऐसा करने के लिए सिखाया जाता है और प्रतिगमन मॉडलर्स का एकमात्र कारण यह नहीं है कि उन्हें सिखाया नहीं जाता है।

प्रवृत्ति स्कोर विश्लेषण जोखिम के साथ किसी भी बातचीत को छुपाता है, और पीएस और उपचार प्रभाव के बीच एक संभावित संबंध के अलावा भविष्यवाणी स्कोर मिलान छुपाता है।

संवेदनशीलता (अनसुना कन्फ्यूजर्स के लिए) विश्लेषण पीएस के लिए काम किया गया है, लेकिन मानक प्रतिगमन मॉडलिंग के साथ भी करना आसान है।

यदि आप पीएस का अनुमान लगाने के लिए लचीले प्रतिगमन विधियों का उपयोग करते हैं (उदाहरण के लिए, किसी भी निरंतर चर अधिनियम को रैखिक रूप से न मानें) तो आपको संतुलन की जाँच करने की भी आवश्यकता नहीं है - संतुलन होना चाहिए या पीएस प्रतिगमन मॉडल शुरुआत में सही ढंग से निर्दिष्ट नहीं किया गया था । आपको केवल गैर-ओवरलैप के लिए जांचना होगा। यह मानता है कि कोई महत्वपूर्ण बातचीत नहीं है जो प्रवृत्ति मॉडल से छोड़ी गई थी। मिलन एक ही धारणा बनाता है।


3

मैं ज्यादातर हानिकारक अर्थमिति की जांच करने की सलाह देता हूं - उनके पास सहज स्तर पर इसकी अच्छी व्याख्या है।

xiy0i,y1ixy0i,y1ixy0i,y1i उपचार से सहसंबद्ध।

xxxxx

xxxx

y0i,y1ixip(xi)p(x)xx

p(x)xxxy0i,y1iउपचार से असंबद्ध हैं। यह स्थिति सुनिश्चित करती है कि इलाज और अनुपचारित के बीच के परिणाम का उप-नमूना औसत अंतर इस उप-नमूना पर औसत उपचार प्रभाव का एक सुसंगत अनुमान है, अर्थात

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

स्थानीय औसत उपचार प्रभाव का एक सुसंगत अनुमान है।

आगे की पढाई:

क्या हमें वास्तव में व्यवहार में मैचिंग प्रॉपर्टीज स्कोर का उपयोग करना चाहिए?

संबंधित प्रश्न मिलान और प्रतिगमन की तुलना करता है


1

यह उसी कारण के लिए "काम करता है" कि प्रतिगमन "काम करता है" - आप सभी भ्रमित कारकों के लिए नियंत्रित कर रहे हैं।

आप शायद कई उलझाने वाले चर, या केवल एक चर के साथ एक प्रतिगमन मॉडल के साथ एक पूरी तरह से निर्दिष्ट प्रतिगमन मॉडल द्वारा इस तरह के विश्लेषणात्मक नियंत्रण को पूरा कर सकते हैं - प्रवृत्ति स्कोर (जो कि समान कन्फ्यूडर से मिलकर एक समान रूप से जटिल मॉडल हो सकता है या नहीं भी हो सकता है)। आप इस प्रतिगमन बनाम प्रवृत्ति स्कोर के साथ चिपक सकते हैं, या आप समान समूहों के भीतर प्रतिक्रिया की तुलना कर सकते हैं, जहां समानता स्कोर स्कोर द्वारा परिभाषित की जाती है। आत्मा में आप एक ही काम कर रहे हैं, लेकिन कुछ लोगों को लगता है कि उत्तरार्द्ध विधि हाथ में कारण कार्य को बेहतर ढंग से उजागर करती है।

प्रतिक्रिया के बाद अपडेट करें

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
और निकटतम-पड़ोसी मिलान के एक संस्करण के बारे में पढ़ें, जिसे "कैलिपर मिलान" (पी। 108) कहा जाता है, जहां उपचार का प्रसार स्कोर और निकटतम नियंत्रण मामला कुछ अधिकतम दूरी के भीतर होना चाहिए, जिसके परिणामस्वरूप बिना मैच के कुछ उपचार के मामले होते हैं। इस मामले में, विधि अभी भी प्रतिगमन के लिए एक nonparametric एनालॉग का उपयोग करके प्रवृत्ति स्कोर के लिए समायोजन करके काम करेगी, लेकिन यह भी स्पष्ट करती है कि अकेले डेटा से ज्ञात नहीं किया जा सकता है (मॉडल से बिना एक्सट्रपलेशन के) और पुनर्वितरण की अनुमति देता है। उपलब्ध डेटा के कारण कारण मात्रा।

1
यह उत्तर नापसंद किया जा सकता है क्योंकि यह प्रतिगमन, विधिवत हलकों में एक गंदे शब्द की तुलना करके प्रवृत्ति के तरीकों को सस्ता करता है। लेकिन प्रमुख उत्तर स्वीकार करते हैं कि "प्रॉप्सिटी स्कोर की एच्लीस हील बिना किसी भ्रमित कन्फ्यूडर की धारणा है।" यह एक बड़ी एच्लीस हील है। मान लीजिए कि मुलाकात पूरी हो गई है और मुझे ब्रह्मांड में सभी कन्फ्यूजर्स के साथ एक डेटा सेट मिला है। मुझे यह समझने में मदद करें कि प्रतिगमन कारण सत्य को उजागर करने के लिए काम नहीं करेगा, लेकिन प्रवृत्ति स्कोर मिलान इच्छाशक्ति।
बेन ओगोरक

1
प्रतिगमन अक्सर समस्याग्रस्त क्यों होता है इसका कारण यह है कि प्रतिगमन के परिणाम अतिरिक्त रूप से हैं। प्रिवेंसिटी स्कोर के साथ, कोवेरेट बैलेंस के दौरान, यह सुनिश्चित करता है कि उपचार समूहों के बीच पर्याप्त कन्फ्यूडर ओवरलैप है। यह जरूरी नहीं है कि प्रतिगमन में मामला गलत हो सकता है और गलत अनुमान लगा सकता है क्योंकि कोई मानक नैदानिक ​​जांच नहीं है जो आपको बताएगी कि आपका प्रतिगमन मॉडल अतिरिक्त है। इसलिए मैं आमतौर पर प्रॉपर्टीज स्कोर बैलेंसिंग चेक चलाता हूं, भले ही मैं सिर्फ एक रिग्रेशन मॉडल चला रहा हूं और खुद प्रिसेंस स्कोर का उपयोग करने की योजना नहीं करता।
स्टैट्सस्टूडेंट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.