प्रत्येक विषय के लिए कई डेटा बिंदुओं का सही ढंग से इलाज कैसे करें


10

मैं वर्तमान में someoe के साथ इस बात पर बहस कर रहा हूं कि प्रत्येक विषय के लिए कई मापों के साथ डेटा का सही तरीके से इलाज कैसे किया जाए। इस मामले में प्रत्येक विषय के भीतर अलग-अलग परिस्थितियों के लिए थोड़े समय के लिए डेटा एकत्र किया गया था। सभी माप एक ही चर को इकट्ठा करते हैं, बस कई।

अब एक विकल्प यह है कि डेटा को केवल स्थितियों के आधार पर समूहित करें और इस बात की परवाह न करें कि एक विषय से कई डेटा पॉइंट आते हैं। हालाँकि प्रत्येक विषय के डेटा बिंदु संभवतः पूरी तरह से स्वतंत्र नहीं हैं।

अन्य विकल्प यह है कि पहले प्रत्येक विषय से प्रत्येक स्थिति के लिए सभी मापों का मतलब निकालें और फिर साधनों की तुलना करें। हालांकि, यह संभवतः महत्व को प्रभावित करेगा, क्योंकि अंतिम विश्लेषण में इस पर ध्यान नहीं दिया गया है, कि साधन में त्रुटि कम है।

आप ऐसे डेटा का सही विश्लेषण कैसे कर सकते हैं? क्या यह किसी तरह से SPSS में ध्यान रखा गया है? सिद्धांत रूप में यह एक त्रुटि की गणना करने के दौरान और अंतिम विश्लेषण में इस पर विचार करने की तुलना में त्रुटि मार्जिन की गणना करने के लिए संभव होना चाहिए, लेकिन मुझे नहीं लगता कि SPSS किसी तरह मेरी पीठ के पीछे यह गणना कर रहा है।


1
क्या यह बार-बार मापने वाला डिज़ाइन है जैसे कि प्रत्येक विषय सभी स्थितियों में चलता है, या कई स्थितियों में? या, क्या यह सिर्फ एक स्वतंत्र समूह, या उपाय, डिजाइन है जहां प्रत्येक विषय एक स्थिति में है?
जॉन

इस डिजाइन में प्रत्येक विषय सभी परिस्थितियों में चलता है। हालांकि कुछ डेटा पॉइंट हैं, जिन्हें अस्वीकार करना होगा, क्योंकि विषय हाथ में काम करने में विफल रहे। यह संभावना नहीं है कि एक विषय एक ही स्थिति के लिए सभी उप-प्रकारों में विफल हो जाएगा (प्रति शर्त लगभग 40 पुनरावृत्ति हैं), इसलिए सबसे अधिक संभावना है कि प्रत्येक विषय में सभी स्थितियों के लिए डेटा बिंदु होंगे।
LiKao

जवाबों:


9

यह स्वतंत्रता का उल्लंघन होगा "डेटा को शर्तों के आधार पर समूहित करें और इस बात की परवाह न करें कि एक विषय से कई डेटा बिंदु आते हैं"। तो यह एक जाना नहीं है। एक दृष्टिकोण "प्रत्येक विषय से प्रत्येक स्थिति के लिए सभी माप का मतलब लेने के लिए और फिर साधनों की तुलना करना" है। आप इसे इस तरह से कर सकते हैं, आप स्वतंत्रता का उल्लंघन नहीं करेंगे, लेकिन आप एकत्रीकरण में विषय स्तर के साधनों में कुछ जानकारी खो रहे हैं।

इसके चेहरे पर, यह विषयों के बीच स्थितियों और कई समय अवधि के बीच मिश्रित डिजाइन की तरह लगता है। हालाँकि, यह सवाल उठता है कि आपने कई समय बिंदुओं पर डेटा क्यों एकत्र किया? क्या समय के प्रभाव, या समय के साथ एक चर की प्रगति स्थितियों के बीच भिन्न होने की उम्मीद है? यदि उत्तर उन प्रश्नों में से किसी एक के लिए हां है, तो डेटा की संरचना को देखते हुए, मैं उम्मीद करूंगा कि आप जिस चीज में रुचि रखते हैं वह एक मिश्रित एनोवा है। मिश्रित ANOVA विषय विचरण को SSTotal "आपकी पीठ के पीछे" के रूप में विभाजित करेगा जैसा कि यह था। लेकिन क्या यह विभाजन विषयों की परीक्षा के बीच आपकी मदद करता है या नहीं यह कई अन्य कारकों पर निर्भर करता है।

वैसे भी, SPSS / PASW 18 में विश्लेषण -> सामान्य रैखिक मॉडल -> बार-बार किए गए उपाय। आपके पास प्रत्येक विषय के लिए एक पंक्ति होगी और प्रत्येक समय बिंदु के लिए एक कॉलम और साथ ही साथ उनकी स्थिति पहचानकर्ता भी होगी। स्थिति पहचानकर्ता "बीच" अनुभाग में जाएगा और दोहराया उपायों का ध्यान रखा जाएगा जब आप दोहराया माप कारक को परिभाषित करते हैं।


ठीक है, यह वही है जो मैंने सोचा है। प्रति शर्त के कई डेटा बिंदु दो कारणों से एकत्र किए जाते हैं। एक यह है कि इस तरह से डेटा अधिक विश्वसनीय होना चाहिए। दूसरा कारण यह है, कि कुछ डेटा बिंदुओं को छोड़ना होगा (विषयों ने हर समय सही ढंग से निर्देश का पालन नहीं किया है)। विषय पूरी तरह से विषयों के भीतर हैं, इसलिए हमारे पास इस मामले में मिश्रित इच्छा नहीं है। दुर्भाग्य से एक दोहराया उपाय प्रश्न से बाहर है, क्योंकि हमारे पास प्रत्येक विषय में प्रति शर्त लगभग 40 दोहराव हैं। हालांकि पुनरावृत्ति की उच्च संख्या का मतलब है, हम मीन का उपयोग करते समय बहुत सारी जानकारी को ढीला कर देते हैं।
लीकाओ

तब मैं जॉन के जवाब की सिफारिश करता हूं। एक मिश्रित मॉडल बेहतर होने की संभावना है। यह प्रत्येक विषय और सम्मान घोंसले के शिकार दोनों के बीच माध्य और परिवर्तनशीलता को मॉडल कर सकता है। इस तरह के विश्लेषण के साथ एक मुद्दा यह है कि स्वतंत्रता की 'सही' डिग्री अस्पष्ट हैं और इस प्रकार सांख्यिकीय महत्व के लिए सीमाएं भी स्पष्ट नहीं हैं। जॉन के प्रदान किए गए कोड के विपरीत, मैं आपकी स्थिति प्रभाव के लिए एक यादृच्छिक ढलान (विभिन्न विषयों के अलग-अलग प्रभाव प्रदर्शित करने) की सिफारिश करूंगा। मैंने कुछ सिमुलेशन देखे हैं जो ऐसा करने में विफल होने का सुझाव देते हैं जो आपके टाइप I त्रुटि दर को बढ़ा सकते हैं।
रुसलपिएर्स 22

4

बार-बार किए जाने वाले उपाय डिजाइन पारंपरिक तरीके से इसे संभालना है, जैसा कि ड्रकेनेक्सस उल्लेख है। उस तरह के विश्लेषण को करते समय आपको एक अंक / स्थिति / विषय को एकत्रित करना होगा। यह गोलाकार और अन्य मुद्दों की मान्यताओं के उल्लंघन के प्रति संवेदनशील है। हालांकि, अधिक आधुनिक तकनीक बहु-स्तरीय मॉडलिंग या रैखिक मिश्रित प्रभावों का उपयोग करना है। इस तकनीक का उपयोग करके आप डेटा एकत्र नहीं करते हैं । इस के कई उपचार उपलब्ध हैं लेकिन मुझे वर्तमान में सर्वश्रेष्ठ बुनियादी ट्यूटोरियल की जानकारी नहीं है। बेयेन (2008) अध्याय 7 अच्छा है। पिनहेइरो और बेट्स (2000) बहुत अच्छे हैं लेकिन चीजों की आवाज़ से परिचय में उनकी सलाह का पालन करते हैं और शुरुआती लोगों के लिए अनुशंसित बिट्स को पढ़ते हैं।

यदि आप केवल एक एनोवा शैली परिणाम प्राप्त करना चाहते हैं, तो मान लें कि आपके सभी डेटा लंबे प्रारूप (एक पंक्ति / डेटा बिंदु) में हैं और आपके पास विषय, प्रतिक्रिया (y) और एक स्थिति चर (x) को इंगित करने वाले कॉलम हैं, तो आप प्रयास कर सकते हैं आर में इस तरह से कुछ देखना (सुनिश्चित करें कि lme4 पैकेज स्थापित है)।

library(lme4)
dat <- read.table('myGreatData.txt', header = TRUE)
m <- lmer( y ~ x + (1|subject), data = dat)
summary(m)
anova(m)

आप निश्चित रूप से कई और स्थितियों में परिवर्तनशील स्तंभ हो सकते हैं, शायद बातचीत कर रहे हैं। तो आप lmer कमांड को कुछ इस तरह से बदल सकते हैं ...

m <- lmer( y ~ x1 * x2 + (1|subject), data = dat)

(बीटीडब्ल्यू, मेरा मानना ​​है कि बिजली बढ़ाने के लिए बार-बार के उपायों में एकत्र नहीं करना एक औपचारिक गिरावट है। किसी को भी नाम याद है?)


मुझे लगता है कि विषयों की संख्या के बजाय प्रतिक्रियाओं की संख्या से कुल योग और डीएफ का उपयोग करने की विफलता स्वतंत्रता का उल्लंघन है। वैकल्पिक रूप से, (मुझे लगता है) यह विषयों के एक निश्चित सेट के लिए व्यक्तिगत आइटम प्रतिक्रियाओं के स्तर पर एक अनुमान बनाने के बारे में सोचा जा सकता है।
रुसलपिएरेस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.