वैरिएबल के लिए मिलान और सांख्यिकीय नियंत्रण जैसे तरीकों के बीच की कड़ी क्या है?


10

अक्सर शोध लेखों में आप पढ़ते हैं कि शोधकर्ताओं ने कुछ चर के लिए नियंत्रित किया है। यह मिलान, अवरोधन आदि विधियों द्वारा किया जा सकता है।

लेकिन मैंने हमेशा सोचा था कि चर को नियंत्रित करने के लिए कुछ वैधानिक रूप से किया जाता है, जो कई चर को मापता है जो प्रभाव का हो सकता है और उन पर कुछ सांख्यिकीय विश्लेषण कर सकता है, जो कि सच्चे और अर्ध दोनों प्रयोगों में किया जा सकता है। इसलिए, उदाहरण के लिए, आपके पास एक सर्वेक्षण या अन्य परीक्षण होगा जिसमें आप स्वतंत्र चर को मापते हैं और कुछ संभावित रूप से भ्रमित चर और कुछ विश्लेषण करते हैं।

  • क्या अर्ध-प्रयोगों में चर के लिए नियंत्रण करना संभव है?
  • वैरिएबल के लिए मिलान और सांख्यिकीय नियंत्रण जैसे तरीकों के बीच की कड़ी क्या है?

1
क्या आपने इस प्रश्न पर ध्यान दिया: कैसे-बिल्कुल-एक-नियंत्रण-के-अन्य-चर के लिए ?
गंग -

जवाबों:


6

एडमो के रूप में, मुझे लगता है कि इस प्रश्न का उत्तर देने की कुंजी कार्य-कारण अनुमान की धारणा है, और अवलोकन संबंधी सेटअपों का उपयोग करके एक कारण मॉडल की ओर "कैसे प्राप्त करें"।

एक आदर्श दुनिया में, हमारे पास एक उचित जनसंख्या कहा जाता है - अध्ययन की आबादी, सभी मामलों में समान रूप से एक चीज को छोड़कर, जिसमें हम रुचि रखते हैं। उन अंतर के आधार पर उन दो आबादी के बीच का अंतर एक वास्तविक कारण है।

जाहिर है, हमारे पास यह नहीं हो सकता।

हालांकि, इसके करीब आने की कोशिश करने के तरीके हैं:

  • रैंडमाइजेशन: यह सैद्धांतिक रूप से (यदि रैंडमाइजेशन सही ढंग से किया गया है) आपको उपचार के बाद के रैंडमाइजेशन को छोड़कर, दो आबादी देनी चाहिए।

  • स्तरीकरण: आप कोवरिएट्स के स्तर के भीतर एक आबादी को देख सकते हैं , जहां आप "तुलना की तरह" बना रहे हैं। यह छोटे स्तर के लिए शानदार तरीके से काम करता है, लेकिन जल्दी ही बोझिल हो जाता है।

  • मिलान: मिलान एक अध्ययन आबादी को इकट्ठा करने का एक प्रयास है जैसे कि ग्रुप ए समूह बी जैसा दिखता है, और इस तरह तुलना करने के लिए उत्तरदायी है।

  • सांख्यिकीय समायोजन: एक प्रतिगमन मॉडल में सहसंयोजकों को शामिल करना, कोवरिएट्स के स्तर के भीतर एक प्रभाव के आकलन की अनुमति देता है - फिर से, जैसे की तुलना करना, या कम से कम प्रयास करना।

सभी उस नकली आबादी के करीब जाने का प्रयास कर रहे हैं। इसे कैसे प्राप्त किया जा सकता है, इस पर निर्भर करता है कि आप क्या बाहर निकलना चाहते हैं, और आपका अध्ययन कैसा दिखता है।


अद्भुत व्याख्या। अधिक संक्षिप्त और बेहतर मूल प्रश्न को संबोधित करता है। मुझे इन विधियों को जोड़ने दें, केवल सांख्यिकीय समायोजन खाली स्तर होने की समस्या के लिए अभेद्य है। एक केस-कंट्रोल स्टडी में, यदि हम उम्र के हिसाब से जनसंख्या का स्तरीकरण करना चाहते हैं, तो मिलान, स्तरीकरण, और उम्र के आधार पर रेंडमाइजेशन के लिए 50 साल पुराने मामले की तुलना 51 साल पुराने नियंत्रण से करने के लिए मोटे या बायनिंग की आवश्यकता होती है।
एडम ओव

लॉजिस्टिक रिग्रेशन में, हालांकि, आप समूहों की संपूर्ण जानकारी के लिए निरंतर जानकारी का उपयोग कर सकते हैं, जैसे कि रैखिक या आधार रेखा के साथ समायोजित उम्र कि तुलना करने के लिए। यह प्रतिगमन मॉडलिंग को सबसे शक्तिशाली और उपयोगी सांख्यिकीय तरीकों में से एक बनाता है।
एडमो

@ अडामो सहमत - ऊपर दिए गए प्रश्न के उत्तर में, मैं उल्लेख करता हूं कि इसका उपयोग बिना किसी सूचना के क्षेत्रों में सुचारू करने के लिए किया जा सकता है, जब तक कि जानकारी का अभाव मौका और द्वेष के कारण हो। लेकिन हाँ - वहाँ एक कारण प्रतिगमन भयानक है।
फोमाइट

2

मुझे लगता है कि कारणपरक मॉडलिंग इस प्रश्न का उत्तर देने की कुंजी है। एक को डेटा को देखने से पहले ब्याज की सही समायोजित / स्तरीकृत / नियंत्रित प्रभाव की पहचान करने के लिए शुरुआत में सामना करना पड़ता है । अगर मुझे वयस्कों में ऊंचाई / फेफड़े की क्षमता के संबंध का अनुमान लगाना था, तो मैं धूम्रपान की स्थिति के लिए समायोजित करूंगा क्योंकि धूम्रपान स्टंट विकास और फेफड़ों की क्षमता को प्रभावित करता है। कन्फ़्यूडर वे चर हैं जो ब्याज के पूर्वसूचक से यथोचित रूप से संबंधित होते हैं और ब्याज के परिणाम से जुड़े होते हैं। यहूदिया पर्ल, 2 एड से कारण देखें। किसी को डेटा संग्रह प्रक्रिया से पहले भी सही उलझाने वाले चर के लिए अपने विश्लेषण को निर्दिष्ट और शक्ति प्रदान करनी चाहिए, यहां तक ​​कि पिछले खोजपूर्ण अध्ययनों से तर्कसंगत तर्क और पूर्व ज्ञान का उपयोग करना शुरू होता है।

हालांकि, इसका मतलब यह नहीं है कि कुछ शोधकर्ता समायोजन चर का चयन करने के लिए डेटा-संचालित विधियों पर भरोसा नहीं करते हैं। जब मैं पुष्ट विश्लेषण करता हूं तो मैं व्यवहार में ऐसा करने से सहमत नहीं हूं। कई समायोजित मॉडलों के लिए मॉडल चयन में कुछ सामान्य तकनीकें आगे / पिछड़े मॉडल चयन हैं जहां आप उन मॉडलों के वर्गों तक सीमित कर सकते हैं जिन्हें आप कम से कम प्रशंसनीय मानते हैं। इसके लिए ब्लैकबॉक्स एआईसी चयन मानदंड संभावना से संबंधित है और इसलिए, में कमी की डिग्रीR2इन समायोजन चर के लिए रैखिक मॉडल के लिए। महामारी विज्ञान में एक और प्रक्रिया आम है, जहां चर केवल मॉडल में जोड़े जाते हैं यदि वे मुख्य प्रभाव (जैसे कि अनुपात या खतरनाक अनुपात) के अनुमान को कम से कम 10% बदलते हैं। हालांकि यह एआईसी आधारित मॉडल चयन की तुलना में "अधिक" सही है, मुझे अभी भी लगता है कि इस दृष्टिकोण में प्रमुख चेतावनी हैं।

मेरी सिफारिश एक परिकल्पना के हिस्से के रूप में वांछित विश्लेषण निर्धारित है। धूम्रपान / कैंसर के जोखिम को समायोजित करने की आयु एक अलग पैरामीटर है, और क्रूड धूम्रपान / कैंसर के जोखिम की तुलना में एक नियंत्रित अध्ययन में अलग-अलग निष्कर्षों की ओर जाता है। विषय वस्तु ज्ञान का उपयोग करना प्रतिगमन विश्लेषण में समायोजन के लिए भविष्यवाणियों का चयन करने का सबसे अच्छा तरीका है, प्रयोगात्मक और क्वासिएक्सिमेंटल डिज़ाइन के "नियंत्रित" विश्लेषणों के विभिन्न अन्य प्रकारों में स्तरीकरण, मिलान, या भार चर के रूप में।


2

मिलान और प्रतिगमन के बीच के संबंध की कहानी संक्षेप में यहाँ एक ब्लॉग पोस्ट में प्रस्तुत की गई है । संक्षेप में

"डी [एक उपचार सूचक] पर नियंत्रण [एक्स (सहसंयोजक]] के लिए डमी (यानी, संतृप्त) मॉडल का एक पूरा सेट। डी के प्रभाव का परिणामी अनुमान एक्स पर मिलान करने के लिए समान है, और विचरण द्वारा कोवरियेट कोशिकाओं में भारित करना है। एक्स पर उपचार की स्थिति "

अधिकाँश हानिरहित इकोनोमेट्रिक्स की धारा ३.३ भी देखें या एक पूरी तरह से चर्चा के लिए काउंटरफ़ेक्चुअल और सेक्शन ५.३ की धारा ५. , जिसमें डी और एक्स डी वेटिंग के पक्ष और विपक्ष शामिल हैं, जो प्रतिगमन प्रदान करता है।

@EpiGrad आपके पहले प्रश्न पर एक अच्छी शुरुआत देता है। ऊपर दी गई पुस्तकें इसे लगभग विशेष रूप से मानते हैं। यदि आपके पास कंप्यूटर विज्ञान / गणित की पृष्ठभूमि नहीं है, तो आपको पर्ल हार्ड गोइंग मिल सकती है (हालांकि अंत में इसके लायक है!)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.