एक सांख्यिकीय परिप्रेक्ष्य से, क्या एक अवलोकन अध्ययन के साथ प्रवृत्ति स्कोर का उपयोग कर एक अनुमान लगाया जा सकता है?


27

प्रश्न: सांख्यिकीविद् (या एक प्रैक्टिशनर) के दृष्टिकोण से, क्या एक प्रेक्षणात्मक अध्ययन ( प्रयोग नहीं ) के साथ प्रवृत्ति अंक का उपयोग कर एक अनुमान लगाया जा सकता है ?

कृपया, एक लौ युद्ध या एक कट्टर बहस शुरू नहीं करना चाहते हैं।

पृष्ठभूमि: हमारे स्टेट पीएचडी कार्यक्रम के भीतर, हमने केवल कार्य समूहों और कुछ विषय सत्रों के माध्यम से कारण निष्कर्ष पर छुआ है। हालांकि, अन्य विभागों (जैसे HDFS, समाजशास्त्र) में कुछ बहुत ही प्रमुख शोधकर्ता हैं जो सक्रिय रूप से उनका उपयोग कर रहे हैं।

मैंने पहले ही इस मुद्दे पर कुछ बहुत गर्म बहस देखी है। यहां एक को शुरू करना मेरा उद्देश्य नहीं है। उसने कहा, आपने किन संदर्भों का सामना किया है? आपके पास क्या दृष्टिकोण है? उदाहरण के लिए, एक तर्क जो मैंने प्रिवेंशन इनफैक्शन तकनीक के रूप में प्रॉपर्टीज स्कोर के खिलाफ सुना है, वह यह है कि लोप किए गए वैरिएबल पूर्वाग्रह के कारण कभी भी कार्य-कारण का अनुमान नहीं लगाया जा सकता है - यदि आप कुछ महत्वपूर्ण छोड़ देते हैं, तो आप कार्य-कारण श्रृंखला को तोड़ देते हैं। क्या यह एक अनमोल समस्या है?

डिस्क्लेमर: इस सवाल का एक सही उत्तर नहीं हो सकता है - पूरी तरह से कूल क्लिक करने के साथ, लेकिन मैं व्यक्तिगत रूप से प्रतिक्रियाओं में बहुत रुचि रखता हूं और कुछ अच्छे संदर्भों के साथ खुश रहूंगा जिनमें वास्तविक दुनिया के उदाहरण शामिल हैं।

जवाबों:


16

महामारी विज्ञान में पीएस के उपयोग को बढ़ावा देने के उद्देश्य से एक लेख की शुरुआत में, ओक्स और चर्च (1) ने महामारी विज्ञान (2) में प्रभाव के बारे में हर्नान और रॉबिन्स के दावों का हवाला दिया:

क्या आप इस बात की गारंटी दे सकते हैं कि आपके अवलोकन संबंधी अध्ययन के परिणाम बिना किसी उलझन के अप्रभावित हैं? एक महामारी विज्ञानी प्रदान करने वाला एकमात्र उत्तर 'नहीं' है।

यह सिर्फ यह कहने के लिए नहीं है कि हम यह सुनिश्चित नहीं कर सकते हैं कि अवलोकन संबंधी अध्ययन के परिणाम निष्पक्ष या बेकार हैं (क्योंकि, @propofol ने कहा, उनके परिणाम आरसीटी डिजाइन करने के लिए उपयोगी हो सकते हैं), लेकिन यह भी कि पीएस निश्चित रूप से इस के लिए एक पूर्ण समाधान प्रदान नहीं करते हैं समस्या, या कम से कम जरूरी नहीं कि अन्य मिलान या बहुभिन्नरूपी विधियों (उदाहरण के लिए देखें (10)) की तुलना में बेहतर परिणाम दें।

प्रवृत्ति स्कोर (पीएस), निर्माण के द्वारा, संभाव्य नहीं कारण संकेतक हैं। प्रवृत्ति स्कोर में प्रवेश करने वाले सहसंयोजकों की पसंद इसकी विश्वसनीयता सुनिश्चित करने के लिए एक प्रमुख तत्व है, और उनकी कमजोरी, जैसा कि कहा गया है, मुख्य रूप से अप्रतिबंधित कन्फ्यूडर्स (जो पूर्वव्यापी या केस-कंट्रोल अध्ययन में काफी संभावना है) के लिए नियंत्रित नहीं होने से खड़ा है । अन्य कारकों पर विचार करना होगा: (ए) मॉडल प्रक्षेपन प्रत्यक्ष प्रभाव अनुमानों को प्रभावित करेगा (वास्तव में ओएलएस मामले की तुलना में अधिक नहीं है, हालांकि), (बी) सहसंयोजकों के स्तर पर लापता डेटा हो सकता है, (सी) पीएससी करते हैं synergistic प्रभावों को दूर नहीं करते जो कारण व्याख्या (8,9) को प्रभावित करने के लिए जाने जाते हैं।

संदर्भों के लिए, मुझे रोजर न्यूज़न की स्लाइड्स मिलीं - वास्तविक अध्ययनों के दृष्टांतों के साथ, कौशैलिटी, कन्फ्यूडर, और प्रॉपर्टीज स्कोर - प्रोपेन्सिव स्कोर का उपयोग करने के पेशेवरों और विपक्षों के बारे में अपेक्षाकृत अच्छी तरह से संतुलित। चिकित्सा में सांख्यिकी में दो साल पहले अवलोकन संबंधी अध्ययन या पर्यावरणीय महामारी विज्ञान में प्रवृत्ति स्कोर के उपयोग पर चर्चा करने वाले कई अच्छे कागजात भी थे, और मैं अंत में (3-6) उनमें से एक जोड़े को संलग्न करता हूं। लेकिन मुझे पर्ल की समीक्षा पसंद है (7) क्योंकि यह कार्य-कारण के मुद्दों पर एक बड़ा परिप्रेक्ष्य प्रदान करता है (पीएस पर चर्चा की गई है। 117 और 130)। जाहिर है, आप अनुप्रयुक्त अनुसंधान को देखकर कई और चित्रण पाएंगे। मैं विलियम आर शदीश के दो हालिया लेख जोड़ना चाहूंगा जो एंड्रयू जेलमैन की वेबसाइट (11,12) पर आया था। प्रवृत्ति स्कोर के उपयोग पर चर्चा की जाती है, लेकिन दो पेपर अधिक मोटे तौर पर अवलोकन अध्ययनों में कारण निष्कर्ष पर ध्यान केंद्रित करते हैं (और यह कैसे यादृच्छिक सेटिंग्स की तुलना में है)।

संदर्भ

  1. ओक्स, जेएम और चर्च, टीआर (2007)। आमंत्रित कमेंट्री: महामारी विज्ञान में आगे बढ़ने की प्रवृत्ति के तरीकेअमेरिकन जर्नल ऑफ एपिडेमियोलॉजी , 165 (10), 1119-1121।
  2. हर्नान एमए और रॉबिन्स जेएम (2006)। कारण निष्कर्ष के लिए साधन: एक महामारी विज्ञानियों का सपना? महामारी विज्ञान , 17, 360-72।
  3. रुबिन, डी। (2007)। कारण बनाम प्रभाव के लिए अवलोकन अध्ययनों का विश्लेषण बनाम डिजाइन: यादृच्छिक परीक्षणों के डिजाइन के साथ समानताएंचिकित्सा में सांख्यिकी , 26, 20–36।
  4. शायर, आई (2008)। संपादक को पत्रचिकित्सा में सांख्यिकी , 27, 2740–2741।
  5. पर्ल, जे। (2009)। प्रवृत्ति स्कोर की विधि पर टिप्पणीचिकित्सा में सांख्यिकी , 28, 1415-1424।
  6. स्टुअर्ट, ईए (2008)। प्रवृत्ति स्कोर के उपयोग के लिए व्यावहारिक सिफारिशें विकसित करना: पीटर ऑस्टिन द्वारा '1996 और 2003 के बीच चिकित्सा साहित्य में मेल खाने वाले प्रवृत्ति स्कोर का एक महत्वपूर्ण मूल्यांकन' की चर्चाचिकित्सा में सांख्यिकी , 27, 2062–2065।
  7. पर्ल, जे। (2009)। आंकड़ों में कारण निष्कर्ष: एक सिंहावलोकनसांख्यिकी सर्वेक्षण , 3, 96-146।
  8. ओक्स, जेएम और जॉनसन, पीजे (2006)। सामाजिक महामारी विज्ञान के लिए मिलान की संभावना का स्कोर । में सामाजिक महामारी विज्ञान में तरीके , जेएम ओक्स और एस कॉफ़मैन (सं।), पीपी। 364-386। Jossez-बास।
  9. होफ्लर, एम (2005)। कारण अनुमान counterfactuals के आधार परबीएमसी चिकित्सा अनुसंधान पद्धति , 5, 28।
  10. विंकेलमेयर, डब्ल्यूसी और कुर्थ, टी। (2004)। प्रवृत्ति स्कोर: मदद या प्रचार? नेफ्रोलॉजी डायलिसिस प्रत्यारोपण , 19 (7), 1671-1673।
  11. Shadish, WR, Clark, MH, and Steiner, PM (2008)। क्या गैर-आयामी प्रयोग यील्ड सटीक उत्तर दे सकते हैं? यादृच्छिक और गैर-आयामी असाइनमेंट की तुलना में एक यादृच्छिक प्रयोगJASA , 103 (484), 1334-1356।
  12. कुक, टीडी, शदीश, डब्ल्यूआर, और वोंग, वीसी (2008)। कौन से प्रयोग और अवलोकन संबंधी अध्ययन के तहत तीन स्थितियां तुलनात्मक कारण का अनुमान लगाती हैं: अध्ययन-अध्ययन तुलना से नई खोजेंजर्नल ऑफ़ पॉलिसी एनालिसिस एंड मैनेजमेंट , 27 (4), 724–750।

11

आम तौर पर मिलान साहित्य में घनत्व स्कोर का उपयोग किया जाता है। उपचार प्राप्त करने की संभावना का अनुमान लगाने के लिए प्रोवेंसिटी स्कोर प्री-ट्रीटमेंट कोवरिएट्स का उपयोग करता है। अनिवार्य रूप से, एक प्रतिगमन (या तो बस नियमित रूप से ओएलएस या लॉगिट, प्रोबेट, आदि) का उपयोग उपचार के साथ प्रवृत्ति स्कोर की गणना करने के लिए किया जाता है क्योंकि आपके परिणाम और पूर्व-उपचार चर आपके सहसंयोजक हैं। एक बार प्रॉपर्टीज स्कोर का एक अच्छा अनुमान प्राप्त करने के बाद, समान प्रॉपर्टीज स्कोर वाले विषय, लेकिन प्राप्त किए गए विभिन्न उपचार एक दूसरे से मेल खाते हैं। उपचार प्रभाव इन दो समूहों के बीच के साधनों में अंतर है।

रोसेनबाम और रुबिन (1983) बताते हैं कि सिर्फ प्रॉपर्टी स्कोर का उपयोग करके उपचारित और नियंत्रण विषयों का मिलान, स्कोर के निर्माण के लिए उपयोग किए गए पूर्व-उपचार सहसंयोजकों से उपजी उपचार प्रभाव के अनुमान में सभी पूर्वाग्रह को हटाने के लिए पर्याप्त है। ध्यान दें कि इस प्रमाण के लिए एक अनुमान के बजाय वास्तविक प्रवृत्ति स्कोर के उपयोग की आवश्यकता होती है। इस दृष्टिकोण का लाभ यह है कि यह कई आयामों (प्रत्येक प्री-ट्रीटमेंट कोवरिएट के लिए) की एक समस्या को एक अविभाज्य मिलान मामले में बदल देता है --- एक महान सरलीकरण।

रोसेनबाम, पॉल आर। और डोनाल्ड बी। रुबिन। 1983. " कॉसल इफेक्ट्स फॉर ऑब्जर्वेशन स्टडीज़ इन द सेंट्रल रोल ऑफ़ द प्रोग्रेसिव स्कोर ।" Biometrika। 70 (1): 41--55।


8

केवल एक भावी यादृच्छिक परीक्षण कार्य-कारण निर्धारित कर सकता है। अवलोकन संबंधी अध्ययनों में, हमेशा एक अनसुना या अज्ञात कोवरिएट का अवसर होगा जो कार्य-कारण को असंभव बना देता है।

हालांकि, अवलोकन संबंधी परीक्षण एक्स और वाई के बीच एक मजबूत जुड़ाव का प्रमाण प्रदान कर सकते हैं, और इसलिए परिकल्पना पीढ़ी के लिए उपयोगी हैं। इन परिकल्पनाओं को एक यादृच्छिक परीक्षण के साथ पुष्टि करने की आवश्यकता होती है।


मैं आपसे पूरी तरह से सहमत हूं। एक पर्यवेक्षणीय अध्ययन कुछ संघों को उजागर करने के लिए अच्छा हो सकता है जो बदले में एक बहुत अधिक कठोर ढांचे का उपयोग करके परीक्षण कर सकते हैं (जैसा कि आप सुझाव देते हैं यादृच्छिक परीक्षण)।
सिम्पा

नीट अभिव्यक्ति। शब्द और एक्स और वाई के बीच 'मजबूत' जुड़ाव से आप अधिक सहमत नहीं हो सकते।
केविन कांग

7

इस सवाल में दो चीजें शामिल हैं जो वास्तव में अलग-अलग मानी जानी चाहिए। पहला यह है कि क्या कोई एक अवलोकन अध्ययन से कार्य-कारण का अनुमान लगा सकता है, और इस पर आप पर्ल, (2009) के विचारों के विपरीत हो सकते हैं, जो तर्क देते हैं कि हां जब तक आप इस प्रक्रिया को ठीक से मॉडल कर सकते हैं, बनाम दृश्य @propofol, कौन होगा प्रयोगात्मक विषयों में कई सहयोगियों को खोजें और जो गेरबर एट अल (2004) द्वारा व्यक्त किए गए कुछ विचारों (बल्कि अस्पष्ट लेकिन फिर भी अच्छे) निबंध को साझा कर सकते हैं। दूसरा, यह मानते हुए कि आप सोचते हैं कि कार्य-कारण का अवलोकन डेटा से किया जा सकता है, आपको आश्चर्य हो सकता है कि क्या ऐसा करने में प्रॉपर्टीज स्कोर के तरीके उपयोगी हैं। प्रॉपर्टीज स्कोर विधियों में विभिन्न कंडीशनिंग स्ट्रेटेजी के साथ-साथ उलटा प्रचलन घनत्व शामिल है। लुन्सफोर्ड और डेविडियन (2004) द्वारा एक अच्छी समीक्षा दी गई है।

एक छोटी सी शिकन हालांकि: प्रवृत्ति स्कोर मिलान और भार भी यादृच्छिक प्रयोगों के विश्लेषण में उपयोग किया जाता है जब, उदाहरण के लिए, "अप्रत्यक्ष प्रभाव" की गणना करने में रुचि है और यह भी कि संभावित गैर-यादृच्छिक आकर्षण या ड्रॉप आउट की समस्याएं हैं ( किस मामले में आपके पास एक अवलोकन अध्ययन जैसा दिखता है)।

संदर्भ

गेरबर ए, एट अल। 2004. "अवलोकन अनुसंधान से सीखने का भ्रम।" शापिरो I में एट अल, प्रॉब्लम एंड मेथड्स इन द स्टडी ऑफ पॉलिटिक्स , कैम्ब्रिज यूनिवर्सिटी प्रेस।

लुन्सफोर्ड जेके, डेविडियन एम। 2004. "कारण उपचार प्रभावों के आकलन में प्रवृत्ति स्कोर के माध्यम से स्तरीकरण और भार: एक तुलनात्मक अध्ययन।" चिकित्सा में आंकड़े 23 (19): 2937-2960।

पर्ल जे। 2009. कारण (द्वितीय संस्करण) , कैम्ब्रिज यूनिवर्सिटी प्रेस।


अच्छा है कि आप पर्ल से पूरी किताब का हवाला दें।
CHL

0

पारंपरिक ज्ञान बताता है कि केवल यादृच्छिक नियंत्रित परीक्षण ("वास्तविक" प्रयोग) कार्य-कारण की पहचान कर सकते हैं।

हालाँकि, यह उतना सरल नहीं है।

एक कारण यह है कि यादृच्छिकता पर्याप्त नहीं हो सकती है कि "छोटे" नमूनों में बड़ी संख्या का कानून "मजबूत पर्याप्त" नहीं है यह सुनिश्चित करने के लिए कि प्रत्येक और सभी अंतर संतुलित हैं। सवाल यह है: "बहुत छोटा" क्या है और "बड़ा पर्याप्त" कब शुरू होता है? सेंट-मोंट (2015) का तर्क है कि "बड़ा पर्याप्त" हजारों (n> 1000) में अच्छी तरह से शुरू हो सकता है!

आखिरकार, समूहों के बीच अंतर को संतुलित करने के लिए, अंतर को नियंत्रित करने के लिए बिंदु है। इसलिए, प्रयोगों में भी, समूहों के बीच मतभेदों को संतुलित करने के लिए बहुत सावधानी बरती जानी चाहिए। सेंट-मोंट (2015) की गणना के अनुसार यह अच्छी तरह से हो सकता है कि छोटे नमूनों में एक मिलान (मैन्युअल रूप से संतुलित) नमूनों के साथ बेहतर हो सकता है।

संभावना के रूप में। बेशक, संभावना कभी भी निर्णायक जवाब देने में सक्षम नहीं होती है - जब तक कि संभावना चरम (शून्य या एक) न हो। हालांकि, विज्ञान में, हमने खुद को अक्सर परिस्थितियों से सामना करते हुए पाया कि हम एक निर्णायक जवाब देने में असमर्थ हैं क्योंकि सामान मुश्किल है। इसलिए संभावना की जरूरत है। संभावना एक बयान में हमारी अनिश्चितता को व्यक्त करने के तरीके से ज्यादा कुछ नहीं है। जैसे, यह तर्क के समान है; ब्रिग्स (2016) को यहां देखें

तो, संभावना हमारी मदद करेगी लेकिन निर्णायक जवाब नहीं देगी, कोई निश्चितता नहीं। लेकिन यह बहुत काम का है - अनिश्चितता व्यक्त करने के लिए।

यह भी ध्यान दें कि कार्य-कारणता मुख्य रूप से एक सांख्यिकीय प्रश्न नहीं है। मान लें कि दो का अर्थ "काफी" है। क्या इसका मतलब यह नहीं है कि समूहित चर मापा चर में अंतर का कारण है? नहीं (जरूरी नहीं)। कोई फर्क नहीं पड़ता कि कौन सा विशेष रूप से सांख्यिकीय एक का उपयोग करता है - प्रवृत्ति स्कोर, पी-मान, बेयस फैक्टर और इतने पर - ऐसे तरीके (व्यावहारिक रूप से) बैकअप कारण दावों के लिए पर्याप्त नहीं हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.