क्या परिवर्तन के अंकों पर एक स्वतंत्र चर के प्रभाव का परीक्षण करते समय आधारभूत माप को नियंत्रण चर के रूप में शामिल करना मान्य है?


38

मैं एक OLS प्रतिगमन चलाने का प्रयास कर रहा हूं:

  • DV: एक वर्ष में वजन में परिवर्तन (प्रारंभिक वजन - अंत वजन)

  • IV: आप व्यायाम करते हैं या नहीं।

हालांकि, यह उचित प्रतीत होता है कि भारी लोग पतले लोगों की तुलना में व्यायाम के प्रति यूनिट अधिक वजन कम करेंगे। इस प्रकार, मैं एक नियंत्रण चर शामिल करना चाहता था:

  • CV: शुरुआती शुरुआती वजन।

हालांकि, अब आश्रित चर की गणना के लिए और नियंत्रण चर के रूप में प्रारंभिक वजन का उपयोग किया जाता है।

यह ठीक है? क्या यह OLS की धारणा का उल्लंघन करता है?


4
क्या उपचार बेतरतीब ढंग से सौंपा गया था?
एंडी डब्ल्यू

1
ध्यान दें कि हाल ही में एक और समान के रूप में भी पूछा गया था, आँकड़े .stackexchange.com / q / 15104 / 1036 । उस प्रश्न का उत्तर इस प्रश्न पर लागू होता है (वास्तव में, मैं कहूंगा कि वे डुप्लिकेट प्रश्न हैं)।
एंडी डब्ल्यू

3
@ और, वास्तव में, दो प्रश्न काफी अलग हैं कि मैं इस एक को अलग जवाब दूंगा कि मैंने दूसरे को दिया। चार्ली ने पहले ही यहां एक अच्छा विश्लेषण दिया है।
whuber

3
ध्यान दें कि अंतर स्कोर का उपयोग आमतौर पर विश्वसनीयता में पर्याप्त कमी के साथ जुड़ा हुआ है, हालांकि यह कुछ हद तक बहस में है
Behacad

जवाबों:


25

अपने शाब्दिक प्रश्न का उत्तर देने के लिए, "क्या परिवर्तन के अंकों पर एक स्वतंत्र के प्रभाव का परीक्षण करते समय बेसलाइन माप को नियंत्रण चर के रूप में शामिल करना मान्य है?", उत्तर नहीं है । उत्तर नहीं है, क्योंकि निर्माण द्वारा बेसलाइन स्कोर को त्रुटि शब्द के साथ सहसंबद्ध किया जाता है जब परिवर्तन स्कोर को आश्रित चर के रूप में उपयोग किया जाता है, इसलिए परिवर्तन स्कोर पर आधार रेखा का अनुमानित प्रभाव निर्विवाद है।

का उपयोग करते हुए

  • Y1प्रारंभिक वजन के रूप में
  • Y2अंतिम वजन के रूप में
  • Δ Y = Y 2 - Y 1ΔYवजन में परिवर्तन के रूप में (यानी )ΔY=Y2Y1
  • T एक बेतरतीब ढंग से सौंपा उपचार के रूप में, और
  • X अन्य बहिर्जात कारकों के रूप में जो वजन को प्रभावित करते हैं (जैसे अन्य नियंत्रण चर जो परिणाम से संबंधित हैं, लेकिन यादृच्छिक असाइनमेंट के कारण उपचार से असंबद्ध होना चाहिए)

एक तो और पर को पुनः प्राप्त करने वाला एक मॉडल है ; टी एक्सΔYTX

ΔY=β1T+β2X+e

जो परिभाषा के बराबर है;

Y2Y1=β1T+β2X+e

अब, यदि आप आधार रेखा को रूप में शामिल करते हैं, तो किसी को एक समस्या चाहिए, जिसमें आपके पास समीकरण के दोनों तरफ शब्द है। इससे पता चलता है कि है, क्योंकि यह त्रुटि अवधि के साथ स्वाभाविक रूप से सहसंबद्ध है।β 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

अब, विभिन्न उत्तरों में भ्रम की स्थिति इस तथ्य से उपजी है कि विभिन्न मॉडल उपचार प्रभाव के लिए समान परिणाम प्राप्त करेंगे , मेरे उपरोक्त सूत्रीकरण में । इसलिए, यदि कोई "स्तर" (बेसलाइन सहित प्रत्येक मॉडल के साथ रूप में) का उपयोग करके मॉडल के लिए आश्रित चर के रूप में परिवर्तन स्कोर का उपयोग करते हुए मॉडल के लिए उपचार प्रभाव की तुलना करने वाले थे, तो उपचार प्रभाव की व्याख्या अन्य लोग करेंगे। वही। दो मॉडलों में जो का अनुसरण करते हैं, वही होगा, और इसलिए उनके आधार पर (ब्रूस वीवर में कुछ एसपीएसएस कोड होते हैं जो समतुल्यता प्रदर्शित करते हैं)।वाई 1 β 1 टीβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

तो कुछ का तर्क होगा (जैसा कि फेलिक्स के इस सूत्र में है, और जैसा कि ब्रूस वीवर ने SPSS वर्ल्ड ग्रुप पर कुछ चर्चाओं में किया है)) कि चूंकि मॉडल एक ही अनुमानित उपचार प्रभाव में परिणाम करते हैं, इसलिए यह कोई फर्क नहीं पड़ता कि आप किसको चुनते हैं। मैं असहमत हूं, क्योंकि परिवर्तन स्कोर मॉडल में बेसलाइन कोवरिएट की व्याख्या नहीं की जा सकती है, आपको आधारभूत को कोवरिएट के रूप में कभी भी शामिल नहीं करना चाहिए (भले ही अनुमानित उपचार प्रभाव समान हो या न हो)। तो इससे एक और सवाल सामने आता है, कि परिवर्तन के अंकों को आश्रित चर के रूप में उपयोग करने का क्या मतलब है? जैसा कि फेलिक्स ने पहले ही नोट किया है, बेसलाइन को कोवरिएट के रूप में छोड़कर निर्भर चर के रूप में परिवर्तन स्कोर का उपयोग करने वाला मॉडल स्तरों का उपयोग करने वाले मॉडल से अलग है। स्पष्ट करने के लिए, बाद के मॉडल अलग-अलग उपचार प्रभाव देंगे (विशेष रूप से इस मामले में कि उपचार आधारभूत के साथ सहसंबद्ध है);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

यह पूर्व के साहित्य में "भगवान के विरोधाभास" के रूप में नोट किया गया है। तो कौन सा मॉडल सही है? खैर, यादृच्छिक प्रयोगों के मामले में, मैं कहूंगा कि स्तर मॉडल बेहतर है (हालांकि यदि आपने एक अच्छा काम यादृच्छिक किया, तो औसत उपचार प्रभाव मॉडल के बीच बहुत करीब होना चाहिए)। अन्य के कारण नोट किए गए हैं कि स्तर का मॉडल बेहतर क्यों है, चार्ली का जवाब इस बात का एक अच्छा बिंदु है कि आप स्तर मॉडल में आधार रेखा के साथ बातचीत प्रभाव का अनुमान लगा सकते हैं (लेकिन आप बदलाव मॉडल में नहीं कर सकते हैं)। इसी तरह के एक सवाल के जवाब में Whuber दर्शाता है कि कैसे परिवर्तन स्कोर विभिन्न उपचारों के बीच सहसंबंधों को प्रेरित करता है।

जिन स्थितियों में उपचार को यादृच्छिक रूप से असाइन नहीं किया गया है, उन बदलावों का उपयोग करने वाले मॉडल पर निर्भर चर के रूप में अधिक ध्यान दिया जाना चाहिए। परिवर्तन स्कोर मॉडल का मुख्य लाभ यह है कि किसी भी समय परिणाम के आक्रामक भविष्यवाणियों को नियंत्रित किया जाता है। तो उपरोक्त सूत्रीकरण में कहें, पूरे समय स्थिर है (उदाहरण के लिए एक निश्चित वजन पर होने के लिए एक आनुवंशिक गड़बड़ी का कहना है), और उस के साथ सहसंबद्ध है कि क्या कोई व्यक्ति व्यायाम करने के लिए चुनता है (और अनिर्दिष्ट है)। उस उदाहरण में, परिवर्तन स्कोर मॉडल बेहतर है। ऐसे उदाहरणों में भी, जिसमें उपचार में चयन को आधारभूत मूल्य के साथ सहसंबद्ध किया जाता है, परिवर्तन स्कोर मॉडल बेहतर हो सकता है। पॉल एलीसन ने अपने पेपर में,एक्स एक्सXXXरिग्रेशन एनालिसिस में डिपेंडेंट वेरिएबल्स के रूप में चेंजेस बदलें , ये वही उदाहरण देते हैं (और मोटे तौर पर इस विषय पर मेरे दृष्टिकोण को प्रभावित करते हैं, इसलिए मैं इसे पढ़ने का सुझाव देता हूं)।

यह कहना नहीं है कि गैर-यादृच्छिक सेटिंग्स में परिवर्तन स्कोर हमेशा बेहतर होते हैं। इस मामले में कि आप बेसलाइन के बाद के वजन पर वास्तविक कारण प्रभाव पड़ने की उम्मीद करते हैं, आपको स्तरों के मॉडल का उपयोग करना चाहिए। इस मामले में कि आप बेसलाइन को एक कारण प्रभाव की उम्मीद करते हैं, और उपचार में चयन को आधार रेखा के साथ सहसंबद्ध किया जाता है, उपचार प्रभाव को बेसलाइन प्रभाव के साथ भ्रमित किया जाता है।

मैंने चार्ली द्वारा नोट पर ध्यान नहीं दिया है कि वजन का लघुगणक निर्भर चर के रूप में इस्तेमाल किया जा सकता है। हालांकि मुझे संदेह नहीं है कि यह एक संभावना हो सकती है, यह प्रारंभिक प्रश्न के लिए कुछ हद तक गैर अनुक्रमिक है। एक अन्य प्रश्न पर चर्चा की गई है जब चर के लघुगणक का उपयोग करना उचित है (और जो अभी भी इस मामले में लागू होते हैं)। इस विषय पर शायद पहले से साहित्य है जो आपको मार्गदर्शन करने में मदद करेगा कि क्या लॉग वजन का उपयोग करना उचित है या नहीं।


उद्धरण

एलीसन, पॉल डी। 1990. प्रतिगमन विश्लेषण में निर्भर चर के रूप में स्कोर बदलेंसमाजशास्त्रीय पद्धति 20: 93-114। सार्वजनिक पीडीएफ संस्करण


3
समीकरण में यदि, मानक अभ्यास के रूप में, हम मानते हैं कि सभी यादृच्छिक चर नहीं हैं, तो को साथ संबद्ध नहीं किया गया है । इस प्रकार मुझे लगता है कि केवल एक समस्या है यदि आप को यादृच्छिक के रूप में देखते हैं , तो उस स्थिति में (फिर से सिर्फ मेरी राय) आपको संयुक्त रूप से मॉडल करना चाहिए लेकिन बिना रूप में। लापता डेटा के बिना इस संबंध में मुझे सूचित किया गया है कि यह दृष्टिकोण एक निश्चित बराबर है (मैं इसके लिए कुछ संदर्भ खोजने की कोशिश करूंगा)। वाई 1+ Y 1 Y 1 ( Y 1 , वाई 2 ) वाई 1 Y 1Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1
dandar

1
@ दादर, उस बयान से मुझे कोई मतलब नहीं है। ध्यान दें कि परिणाम का पूर्व-उपचार मूल्य है , यह एक प्रयोग में हेरफेर किया जा रहा चर नहीं है। क्या आप कह रहे हैं कि अगर मेरे पास का आधारभूत मूल्य है , तो मैं एक प्रयोग करता हूं, और फिर मापता , मुझे प्रयोगात्मक हस्तक्षेप के कार्य के रूप में और दोनों को मॉडल करना चाहिए ? Y 1 Y 2 Y 1 Y 2Y1Y1Y2Y1Y2
एंडी डब्ल्यू

1
मैं जिस मॉडल के बारे में बात कर रहा हूं, वह वास्तव में उपचार का एक कार्य है, लेकिन केवल इस दृष्टिकोण से कि यादृच्छिकरण के बावजूद उपचार और नियंत्रण समूह के बीच उनके आधारभूत साधनों के संबंध में हमेशा मामूली अंतर होगा। इस प्रकार इस अंतर को और साथ ही उपचार के प्रभाव को पकड़ लेगा। इसके लिए संदर्भ है, "ज़ेगर और लियांग, 2000 द्वारा" प्री-पोस्ट डिज़ाइन के लिए निरंतर और असतत प्रतिक्रियाओं का अनुदैर्ध्य डेटा विश्लेषण "। β 1Y1β1
१५

1
इस पत्र की एक स्पष्ट चर्चा में पाया जा सकता है ("क्या बेसलाइन एक कोवरिएट या क्लिनिकल परीक्षणों में आधारभूत से परिवर्तन के विश्लेषण में निर्भर चर होना चाहिए?" लियू, मोग, मल्लिक और मेहरोत्रा ​​2009 द्वारा)। वे इस मॉडल को बिना शर्त मॉडल के रूप में संदर्भित करते हैं (यानी यह आधारभूत प्रतिक्रिया पर शर्त नहीं है)। लियू (2009) पेपर में वे ज़ेगर (2000) पेपर के मुख्य परिणामों पर चर्चा करते हैं। ये पहली बार हैं कि बिना किसी गुम हुए डेटा के बिना बिंदु मॉडल से के बिंदु अनुमान समान हैं, जैसे कि ANCOVA के सशर्त दृष्टिकोण के बाद बेसलाइन का उपयोग कर रहे हैंB1
dandar

1
एक प्रतिक्रिया के रूप में माप, और एक निश्चित आधारभूत मूल्य पर कंडीशनिंग, और दूसरी बात यह है कि बिंदु का अनुमान ANCOVA मॉडल से हमेशा बिना शर्त एक से अधिक या बराबर होता है। यह पता चला है कि यह भिन्नता अंतर आमतौर पर छोटे होगा क्योंकि रेंडमाइजेशन से यह सुनिश्चित होता है कि समूह के बीच बेसलाइन माध्य प्रतिक्रियाएँ छोटी हैं। लेखकों का मानना ​​है कि बिना शर्त मॉडल को आधारभूत रूप में मॉडलिंग के लिए एक यादृच्छिक चर के रूप में उपयुक्त है, लेकिन ANCOVA को उचित रूप में देखने पर।
दंदर

21

एंडी का जवाब अर्थशास्त्रियों की बातों से लगता है। यह नैदानिक ​​परीक्षणों में अभ्यास को स्वीकार करने के लिए लगभग हमेशा प्रतिक्रिया चर के आधारभूत संस्करण के लिए समायोजित किया जाता है, ताकि शक्ति में वृद्धि हो सके। चूँकि हम बेसलाइन चरों पर शर्त रखते हैं, इसलिए उनके लिए कोई 'एरर टर्म' नहीं है, जिससे ओवरऑल एरर टर्म में गड़बड़ हो। एकमात्र समस्या यह होगी कि यदि बेसलाइन कोवरिएट में माप त्रुटियों को दूसरे एक्स के साथ भ्रमित किया जाता है, तो अन्य एक्स के प्रभाव को विकृत कर सकता है। समग्र पसंदीदा तरीका आधारभूत के लिए समायोजित करना है और परिवर्तन की गणना नहीं करते हुए, प्रतिक्रिया चर को मॉडल करना है। इसका एक कारण यह है कि परिवर्तन वाई सही के परिवर्तन को प्राप्त करने पर बहुत अधिक निर्भर है, और यह परिवर्तन सामान्य रूप से प्रतिगमन मॉडल पर लागू नहीं होता है। उदाहरण के लिए, यदि Y क्रमबद्ध है, तो दो क्रमिक चर के बीच का अंतर नहीं रह जाता है।


1
मैं इस उत्तर को पूरी तरह से नहीं समझता। "बेसलाइन के लिए समायोजन" से आपका क्या मतलब है? अंतर लें, या इसके लिए नियंत्रण करें?
हेनरिक

3
'एडजस्ट फॉर बेसलाइन' से मेरा मतलब है बेसलाइन को कोवरिएट के रूप में शामिल करना। परिवर्तन स्कोर का उपयोग करना भी आम है, लेकिन आप बिना कोविएट के भी आधार रेखा के समायोजन के बिना उनका उपयोग नहीं कर सकते (इसलिए परिवर्तन स्कोर के साथ क्यों परेशान होते हैं?)।
फ्रैंक हर्रेल

6
वास्तव में आप यहां कुछ भी नहीं कहते हैं (या फेलिक्स की टिप्पणियों के जवाब में) जो मैं कहता हूं उससे सीधे टकराव होता है। परिवर्तन स्कोर का उपयोग करना 'आधार रेखा के लिए समायोजित नहीं करता है', यह किसी भी समय के लिए नियंत्रित होता है अपरिवर्तित ommitted चर (या यदि उपचार में चयन आधारभूत के साथ अत्यधिक सहसंबद्ध है)। यदि आधारभूत गैर-नगण्य है (अर्थात इसका परिणाम पर सीधा कारण प्रभाव पड़ता है या इसका उपचार के साथ पारस्परिक क्रिया है) परिवर्तन स्कोर समस्या का समाधान नहीं करते हैं।
एंडी डब्ल्यू

2
@ फ्रेंक हरेल इस चर्चा में शामिल होने और इसे स्पष्ट करने के लिए धन्यवाद। (+1)
हेनरिक

8

हम @ ocram के तर्क को थोड़ा बदल कर _

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

इसलिए, यदि यह सही मॉडल है , तो यह कहना कि अंतर वजन पर निर्भर करता है, जिसका अर्थ है कि अंतिम मूल्य एक गुणांक के साथ प्रारंभिक मूल्य पर निर्भर करता है जो कुछ भी हो सकता है। और पर अंतर के एक प्रतिगमन को या एक ही चर पर अंत भार आपको सब कुछ पर समान गुणांक देना चाहिए लेकिन । लेकिन, यदि यह मॉडल बिल्कुल सही नहीं है, तो ये प्रतिगमन अन्य गुणांक पर भी अलग-अलग परिणाम देंगे।xw0w0

ध्यान दें कि यह सेट अप का अर्थ है कि शुरुआती वजन वज़न में अंतर की भविष्यवाणी करता है , न कि उपचार के प्रभाव का । इसके लिए एक सहभागिता शब्द की आवश्यकता होगी, शायद

E[w1w0X,w0]=β0+(xw0)β+w0γ.

एक और तरीका यह होगा कि आप गणना यहाँ, वजन की वृद्धि दर है। यह आपका परिणाम हो सकता है। पर आपके गुणांक आपको बताएंगे कि ये भविष्यवक्ता वजन में अनुपात परिवर्तन से कैसे संबंधित हैं। यह "यह कहकर" शुरुआती वजन को नियंत्रित करता है, उदाहरण के लिए, एक व्यायाम शासन जो 10% तक वजन कम करता है (0.1% का गुणांक 100% से गुणा करता है) किसी के लिए वजन 130 पाउंड 13 पाउंड वजन कम करता है, जबकि कार्यक्रम कम कर देता है 200 पाउंड प्रतिभागी का वजन 20 पाउंड। इस मामले में, आपको दाहिने हाथ की ओर प्रारंभिक वजन (या इसके लॉग) को शामिल करने की आवश्यकता नहीं हो सकती है।

log(w1)log(w0)r;
rx

यदि आप मानते हैं कि कार्यक्रम का प्रभाव शुरुआती वजन पर निर्भर करता है, तो एक संपर्क शब्द अभी भी आवश्यक हो सकता है। यदि आप इंटरैक्शन टर्म में का उपयोग करते हैं , तो प्रोग्राम वजन की वृद्धि दर में परिवर्तन के साथ जुड़ा होगा । प्रत्येक पाउंड भारी है कि एक व्यक्ति कार्यक्रम की शुरुआत में था विकास दर में परिवर्तन में एक वृद्धि की ओर जाता है (यह दोनों उपचार और वजन शुरू करने के संबंध में अपेक्षित मूल्य का क्रॉस-आंशिक व्युत्पन्न है)।w0w0β1β1

यदि आप इंटरेक्शन टर्म में का उपयोग करते हैं, तो प्रोग्राम का प्रभाव बढ़ जाता है , प्रत्येक अतिरिक्त पाउंड के लिए प्रोग्राम की शुरुआत में प्रतिभागी को भारी पाउंड ।log(w0)β1/w0

जैसा कि आप देख सकते हैं, बातचीत की शर्तों पर क्रॉस-भाग की व्याख्या करने के लिए थोड़ा मुश्किल हो सकता है, लेकिन वे एक प्रभाव को पकड़ सकते हैं जिसमें आप रुचि रखते हैं।


हाय चार्ली, मैं अनुपात परिवर्तन का उपयोग करने का लाभ देखता हूं, हालांकि आप लॉग वेरिएबल में अंतर को केवल w1 से अधिक w1 में विभाजित करने के विपरीत क्यों पाते हैं।
क्रिसस्टैटा

मुझे आनुपातिक परिवर्तन का विचार पसंद है। हालांकि यह सवाल अभी भी बना हुआ है कि क्या अपेक्षित बातचीत सचमुच आनुपातिक है या नहीं। यदि नहीं, तो आपको अभी भी एक कोवरिएट के रूप में प्रारंभिक वजन शामिल करना होगा। या क्या आपको यकीन होगा कि 100 या 200 पाउंड के व्यक्ति के लिए अपने वजन का 10% ढीला करना एक ही मुश्किल है?
हेनरिक

@ क्रिस, आप भी ऐसा कर सकते हैं। मैं एक अर्थशास्त्री हूं और हम अपने लॉग (और अलग-अलग) भी प्यार करते हैं। यदि आपके पास प्रत्येक व्यक्ति (एक पैनल डेटा सेट बनाने) के लिए एक समय श्रृंखला (यानी, कई अवलोकन) है, तो मैं तर्क दे सकता हूं कि मेरा तरीका बेहतर है, लेकिन यहां प्रासंगिक नहीं है। हेनरिक, आप सही कह रहे हैं; मैंने अपने उत्तर के बारे में थोड़ा जोड़ा।
चार्ली

8

संपादित करें: एंडी डब्लू के तर्क ने मुझे मॉडल सी को छोड़ने के लिए मना लिया। मैंने एक और संभावना जोड़ी: रैंडम गुणांक मॉडल (उर्फ मल्टीलेवल मॉडल या मिश्रित प्रभाव मॉडल के साथ परिवर्तन का विश्लेषण करना।

अंतर स्कोर के उपयोग के बारे में बहुत सारी वैज्ञानिक बहस हुई है। मेरे पसंदीदा ग्रंथ हैं रोजसा (1982, [1]) और फिट्ज़मौरिस, लैयर्ड, और वेयर (2004, [2])

सामान्य तौर पर, आपके पास अपने डेटा का विश्लेषण करने की तीन संभावनाएँ होती हैं:

  • ए) केवल अंतर-अंतर अंतर स्कोर (परिवर्तन स्कोर) लें
  • बी) पोस्ट माप को DV के रूप में समझें और इसे आधार रेखा के लिए नियंत्रित करें
  • सी) अंतर स्कोर को डीवी के रूप में लें और इसे बेसलाइन के लिए नियंत्रित करें (यह आपके द्वारा सुझाया गया मॉडल है)। एंडी डब्ल्यू के तर्कों के कारण, मैंने इस विकल्प को छोड़ दिया
  • डी) एक बहुस्तरीय / मिश्रित-प्रभाव-मॉडल दृष्टिकोण का उपयोग करना, जहां प्रतिगमन लाइन को प्रत्येक भागीदार के लिए मॉडल किया जाता है और प्रतिभागी को स्तर -2 इकाइयों के रूप में माना जाता है।

मॉडल ए और बी बहुत भिन्न परिणाम उत्पन्न कर सकते हैं यदि आधार रेखा को परिवर्तन स्कोर (जैसे, भारी लोगों को अधिक वजन घटाने) के साथ सहसंबद्ध किया जाता है, और / या उपचार असाइनमेंट को आधार रेखा के साथ सहसंबद्ध किया जाता है।

यदि आप इन मुद्दों के बारे में अधिक जानना चाहते हैं, तो उद्धृत पत्र देखें, या यहां और यहां

हाल ही में एक सिमुलेशन अध्ययन [3] भी हुआ है, जो उन परिस्थितियों की तुलना करता है जिनके तहत ए या बी बेहतर हैं।

बिना किसी लापता मान के साथ पूरी तरह से संतुलित डिजाइन के लिए, मॉडल डी मॉडल ए के बराबर होना चाहिए। हालांकि, यह आपको व्यक्ति परिवर्तनशीलता के बीच अधिक जानकारी देता है, यह आसानी से अधिक माप बिंदुओं तक विस्तारित होता है, और इसमें असंतुलित डेटा की उपस्थिति में अच्छे गुण होते हैं। और / या लापता मान।

एक निचली पंक्ति के रूप में: आपके मामले में, मैं बेसलाइन (मॉडल बी) के लिए नियंत्रित पोस्ट-उपायों का विश्लेषण करूंगा।

[१] रोगोसा, डी।, ब्रांट, डी।, और ज़िमोव्स्की, एम। (१ ९ ,२)। परिवर्तन की माप के लिए एक वृद्धि वक्र दृष्टिकोण। मनोवैज्ञानिक बुलेटिन, 92, 726-748।

[२] फिट्ज़मौरिस, जीएम, लैयर्ड, एनएम, और वेयर, जेएच (२००४)। अनुप्रयुक्त अनुदैर्ध्य विश्लेषण। होबोकेन, एनजे: विली।

[३] पेट्सचेर, वाई।, और श्टशेनइडर, सी।, २०११। एक अंतर का अध्ययन सिंपल डिफरेंस के प्रदर्शन पर और कॉवेरियन ‐ रैंडमाइज्ड एक्सपेरिमेंटल डिजाइन में समायोजित स्कोर। जर्नल ऑफ एजुकेशनल मेजरमेंट, 48, 31-43।


मैंने इस उत्तर को अस्वीकार कर दिया है, और आप मेरी प्रतिक्रिया देख सकते हैं कि मुझे विश्वास है कि आधारभूत के साथ परिवर्तन के स्कोर को कोवरिएट नहीं किया जाना चाहिए। इसे तैयार करने के लिए, भले ही आपके फॉर्मूलेशन में मॉडल बी और सी समान उपचार प्रभाव पैदा करते हैं, लेकिन इसका मतलब यह नहीं है कि मॉडल सी बेहतर है। वास्तव में, मॉडल सी में बेसलाइन प्रभाव निर्बाध है, इसलिए मेरा तर्क है कि इसका उपयोग नहीं किया जाना चाहिए।
एंडी डब्ल्यू

@AndyW: आपके तर्क ने मुझे आश्वस्त किया; यद्यपि उपचार प्रभाव का सबसे प्रासंगिक अनुमान दोनों मॉडलों में समान है, मॉडल बी को मॉडल सी पर प्राथमिकता दी जानी चाहिए। मैंने अपने उत्तर को तदनुसार समायोजित किया। लेकिन आप क्या कहते हैं Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.?, जो B और C की समानता दर्शाता है।
फेलिक्स एस

मुझे नहीं लगता कि मैंने कुछ भी कहा जो कि लैर्ड लेख के साथ टकराव था। मूल रूप से मेरा सारा शेख़ी यह था कि (लैयर्ड के अंकन में) _ अकल्पनीय है, इसलिए इसे क्यों रिपोर्ट करें (समानता प्रश्न में नहीं थी)। लैयर्ड अन्य टिप्पणियां करते हैं कि कैसे आधारभूत कोवरिएट प्रभाव की व्याख्या की जा सकती है यदि व्यक्तिगत उपचार समूहों में परिवर्तन नहीं होता है (हालांकि अभी भी यह महत्वपूर्ण है)। उन स्थितियों से मेरी बात का सामना करने के लिए स्वतंत्र महसूस करें, जिनमें उपयोगी है (यह निश्चित रूप से उन सामान्य तरीकों से उपयोगी नहीं है जिन्हें हम प्रतिगमन गुणांक की व्याख्या करते हैं)। b¯b¯
एंडी डब्ल्यू

मॉडल डी के लिए एक बिंदु मैं सोच रहा हूं कि केवल मॉडल डी पर विचार क्यों नहीं किया जा रहा है। यह सबसे अधिक सुसंगत है (बेसलाइन मान एक यादृच्छिक चर है और इसे आश्रित चर के लिए मजबूर नहीं किया जाना चाहिए), यह सरल है, बहुत लचीला है (बातचीत कर सकते हैं) जोड़ा जाता है) और आबादी के मानक विचलन को भी बचाता है।
जिओरडनो

3

इस सवाल पर जोश एग्रीस्ट को देखें: http://www.mostlyharmlesseconometrics.com/2009/10/adding-lagged-dependent-vars-to-differenced-models/ । वह काफी हद तक अपने मॉडल में पिछड़े DV सहित के खिलाफ आता है। उनकी प्रतिक्रिया में ऐसा कुछ भी नहीं है जो ऊपर की प्रतिक्रियाओं में नहीं है, लेकिन आपके प्रश्न का एक और संक्षिप्त उत्तर मदद कर सकता है।


3

ग्लाइमौर एट अल। (2005) एक परिवर्तन स्कोर का विश्लेषण करते समय आधारभूत समायोजन का उपयोग कर संबोधित किया। यदि स्वास्थ्य की स्थिति में परिवर्तन से पहले आधारभूत मूल्यांकन किया गया या आश्रित चर में बड़ी माप त्रुटि है, तो वे पाते हैं कि पूर्वाग्रह तब उत्पन्न हो सकता है जब निर्भर चर के रूप में प्रतिगमन मॉडल का उपयोग करते हुए प्रतिगमन मॉडल में आधारभूत सहसंयोजक शामिल हो। फ्रैंक हैरेल का जवाब "एकमात्र समस्या यह होगी कि बेसलाइन कोवरिएट में माप त्रुटियां दूसरे एक्स के साथ भ्रमित होती हैं, जिससे दूसरे एक्स का प्रभाव विकृत हो जाता है।" एक ही पूर्वाग्रह को दर्शाया जा सकता है जैसे ग्लाइमोर पते।

ग्लाइमोर (2005) "जब बेसलाइन समायोजन परिवर्तन के विश्लेषण में उपयोगी है। शिक्षा और संज्ञानात्मक परिवर्तन के साथ एक उदाहरण। अमेरिकन जर्नल ऑफ एपिडेमियोलॉजी 162: 267-278।


1

ओकराम सही नहीं है। वजन में अंतर करता नहीं खाते में प्रारंभिक वजन ले। विशेष रूप से, अंतःशिरा का वजन एक प्रकार का होता है, जिसमें से अंतिम वजन घटाया जाता है।

इसलिए, मैं तर्क दूंगा कि यदि आप शुरुआती वजन के लिए नियंत्रण करते हैं तो यह किसी भी धारणा का उल्लंघन नहीं करता है।

(यदि आप BMI और प्रारंभिक BMI का अंतर लेते हैं तो यही तर्क लागू होता है।)



एंडी डब्लू के आलोचक के बाद अपडेट करें कि मैं सही और ओकारम गलत क्यों हूं (कम से कम मेरी बात से) इस पर अधिक औपचारिक हूं।

प्रत्येक व्यक्ति के वजन का कुछ पूर्ण स्तर होता है (उदाहरण के लिए, 200 पाउंड के विपरीत लगभग 100 पाउंड)। बता दें कि यह वजन है। फिर, प्रारंभिक वजन को रूप में और अंत वजन को रूप में औपचारिक रूप दिया जा सकता हैaw
iw=awew=aw+Δw

DV ओपी उपयोग करना चाहता है इस प्रकारΔw=iwew=awaw+Δw=Δw

दूसरे शब्दों में, वजन का पूर्ण स्तर ( रूप में औपचारिक रूप से ) DV का प्रतिनिधित्व करने वाले समीकरण से बाहर निकल जाता है और इसलिए, इसे दूषित नहीं करता है (जो एंडी डब्ल्यू के दावे से असहमत है)।aw

यदि आप इसे ध्यान में रखना चाहते हैं, तो आपको इसे अपने मॉडल में अलग से शामिल करना होगा (एक साधारण पैरामीटर और / या एक इंटरेक्शन टर्म के रूप में)।

Obviosuly यह वही तर्क पर लागू होता है और इसे आसानी से आनुपातिक रूप से समायोजित किया जा सकता है, जहाँ कोई यह कहेगा:डब्ल्यू = एक डब्ल्यू * पी आर पी Δ wΔBMJew=awpropΔw


जब मैंने कहा कि अंतर प्रारंभिक वजन को ध्यान में रखता है, तो यही मेरा वास्तव में मतलब था। अब, विशेष रूप से, आप क्या लिखेंगे? अंतिम वजन - प्रारंभिक वजन = ...?
ओकराम सेप 18'11

जैसा कि मैंने लिखा है, आपका तर्क मुझे झूठा लगता है। मैं तर्क था कि वास्तव में अंत वजन को ध्यान में अधिक प्रारंभिक वजन लेता है के रूप में यह एक ही "पैमाने" पर है, जबकि diffeence "पुनः पैमाना" है (अंत वजन, इसलिए कुछ के रूप में पूर्ण मूल्य anoher से घटाया जाता है absoulte मूल्य।
हेनरिक

(-1) यह सही नहीं है। सामान्य तौर पर, आपको समीकरण के दाएं हाथ और बाएं हाथ के दोनों ओर समान चर शामिल नहीं करना चाहिए (क्योंकि इसके परिणामस्वरूप स्वतंत्र चर त्रुटि शब्द के साथ सहसंबद्ध हो जाता है)। इसलिए यदि आप आश्रित चर के लिए अंतर का उपयोग करते हैं, तो आपको आधार रेखा को कोवरिएट के रूप में शामिल नहीं करना चाहिए।
एंडी डब्ल्यू

@ एंडी डब्लू: मुझे पता है कि आपका तर्क सही है। लेकिन मेरा तर्क यह है कि आप पूर्ण मान को आंशिक रूप से हटाते हैं (बेसलाइन के साथ टी एंड वैल्यू घटाकर) जिससे इस संबंध को समाप्त किया जाता है। इसलिए, इसे एक कोवरिएट के रूप में जोड़ने से उस प्रकार की सहज त्रुटि सहसंबंध का अंतर्ग्रहण नहीं होता है।
हेनरिक

@ हेनरिक, इस प्रश्न पर मेरी प्रतिक्रिया देखें, और मुझे अभी भी विश्वास है कि यह भावना क्यों गलत है।
एंडी डब्ल्यू

0

उसका अवलोकन करो

end weightinitial weightY=β0+βTx

के बराबर है

end weight=initial weight+β0+βTx

शब्दों में, वजन में परिवर्तन (अंत वजन के बजाय खुद) का उपयोग करते हुए DV पहले से ही प्रारंभिक वजन के लिए जिम्मेदार है।


1
लेकिन मुझे लगता है कि प्रारंभिक वजन और वजन घटाने के बीच प्रशिक्षण दिया जा सकता है। मान लीजिए कि 1,90 मीटर ऊंचाई और 70 किलोग्राम बॉडी मास के वयस्क और 1,60 मीटर ऊंचाई के वयस्क और 90 किलोग्राम बॉडी मास एक ही प्रशिक्षण अभ्यास में भाग लेते हैं। मुझे यकीन है कि बाद में अधिक वजन कम होगा। एक दूसरे विचार पर: शायद बॉडी मास इंडेक्स सिर्फ वजन से बेहतर सीवी है।
xmjx

1
@xmjx: यदि आपको लगता है कि प्रारंभिक वजन अंतिम वजन को प्रभावित करेगा - और आप शायद सही हैं - तो इसे मॉडल में एक ऑफसेट के रूप में पेश करना एक अच्छा विचार है क्योंकि यह यहाँ किया गया है ...
ocram

3
सामान्य रूप से सही नहीं है। यदि आधारभूत भार का ढलान 1.0 नहीं है, तो परिवर्तन का विश्लेषण अंतिम भार के विश्लेषण के बराबर नहीं होगा जब तक कि प्रारंभिक वजन दोनों मॉडलों में न हो और आप साधारण प्रतिगमन का उपयोग कर रहे हों। यदि आधारभूत भार दो स्थानों पर है, तो मॉडल वास्तव में व्याख्या करना अधिक कठिन है, इसलिए इस दृष्टिकोण के साथ बने रहने के कारण स्पष्ट नहीं हैं।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.