छोटे


14

मुझे एक अध्ययन के लिए विश्लेषण करने के लिए चार अलग-अलग समय बिंदुओं पर लोहे के स्तर पर उपचार के प्रभाव को देखने के लिए डेटा दिया गया था (उपचार से पहले, दिन उपचार समाप्त हो गया, उपचार के 4 सप्ताह बाद और उपचार के 2-4 महीने बाद)। कोई नियंत्रण समूह नहीं है। वे यह देखना चाह रहे हैं कि क्या उपचार से पहले उपचार (बेसलाइन) स्तर पर 3 पोस्ट-उपचार समय बिंदुओं में से प्रत्येक में लोहे के स्तर में उल्लेखनीय वृद्धि हुई है। ग्यारह रोगियों का आधारभूत स्तर था, लेकिन केवल 8 रोगियों के पास सभी 4 समय बिंदुओं के लिए पूरा डेटा था ( प्रत्येक समय बिंदु के लिए n = 11, 10, 9 और 8)। न केवल लोहे के स्तर को मापा गया था, बल्कि हर बार बिंदु पर आधारभूत की तुलना में दो अन्य प्रयोगशाला उपाय किए गए थे।

मेरे पास कुछ सवाल हैं कि मैं इसका विश्लेषण कैसे करूं। मैंने पहले सोचा था कि एक आरएम एनोवा इस डेटा का विश्लेषण करने के लिए उपयुक्त होगा, लेकिन मैं छोटे नमूने के आकार, डेटा की हानि और डेटा के गैर-सामान्य वितरण के बारे में चिंतित था। फिर मैंने विलकॉक्सन हस्ताक्षरित रैंक परीक्षणों का उपयोग करते हुए बेसलाइन के बाद के प्रत्येक उपचार की तुलना बेसलाइन से करने पर विचार किया, लेकिन फिर मैं कई तुलनाओं के मुद्दे पर चलता हूं। हालाँकि, मैंने कुछ साहित्य पढ़े हैं, जिनमें कई तुलनाओं को चलाने की आवश्यकता है। तो कुल मिलाकर, मैं छोटे नमूने के आकार, अधूरे डेटा और कई तुलनाओं (और यह आवश्यक है या नहीं) के साथ काम कर रहा हूं।

मुझे उम्मीद है कि यह सब समझ में आता है। मैं CrossValidated के लिए नया हूं और अनुभवी सांख्यिकीविदों से सीखने के लिए एक सहयोगी के रूप में यहां निर्देशित किया गया था, इसलिए मैं किसी भी सलाह की सराहना करता हूं! धन्यवाद!


टिप्पणी से कच्चा डेटा जोड़ने का संपादन:

चार कुल समय बिंदु हैं और परिणाम चर निरंतर है। उदाहरण के लिए, प्रत्येक बार बिंदु पर परिणाम इस के समान दिखते हैं:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
यदि आप प्रतिलिपि प्रस्तुत करने योग्य उदाहरण (या कच्चे डेटा) जोड़ते हैं तो यह सहायक होगा।
लादिस्लाव नाओ

परिणाम चर निरंतर है। उदाहरण के लिए, प्रत्येक समय बिंदु पर परिणाम इस तरह दिखाई देते हैं: आधारभूत स्तर n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]। पहली पोस्ट n = 10 [167, 200, 45, 132,।, 245, 199, 177, 134, 298, 111]। 2nd Post n = 9 [75, 43, 23, 98, 87,।, 300,।, 118, 202, 156]। 3rd पोस्ट स्तर n = 8 [23, 34, 98, 112,।, 200,।, 156, 54, 18,]]। कुल चार समय बिंदु हैं।
msturm17

जवाबों:


5

मैंने आपकी समस्या पर फिर से विचार किया है और फ्रीडमैन का परीक्षण पाया है जो दोहराया उपायों के साथ एक तरह से एनोवा का गैर-पैरामीट्रिक संस्करण है

मुझे आशा है कि आपके पास कुछ बुनियादी कौशल होंगे R

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

टेस्ट फ्राइडमैन का टेस्ट ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

और फिर पता करें कि गैर-पैरामीट्रिक पश्चात परीक्षण द्वारा किन समूहों में अंतर मौजूद है । यहां आपकी हर संभव तुलना है।

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

जैसा कि आप देख सकते हैं कि केवल आधार रेखा (पहली बार बिंदु) सांख्यिकीय रूप से दूसरों से अलग है।

उम्मीद है इससे आपको मदद मिलेगी।


1
लदिस्लाव, इस प्रश्न का एक उत्कृष्ट उत्तर है। यह अत्यंत गहन और पूर्ण है। एकमात्र मुद्दा जो मैं देख रहा हूं, वह यह है कि क्रुस्कल-वालिस एनोवा को भी टिप्पणियों की स्वतंत्रता की धारणा है, जैसे कि स्वतंत्र चर के प्रत्येक स्तर पर अलग-अलग विषय हैं, जो इस मामले में, हमारे पास नहीं है जैसा कि हम उसी 11 का अनुसरण कर रहे हैं। 4 समय बिंदुओं पर रोगी। क्या आपके पास इस पर कोई राय है या इस मुद्दे को संबोधित करने के लिए कोई अन्य तरीके हैं? बहुत बहुत धन्यवाद!
मैट रेइचेनबाक

मैंने ऊपर अपनी टिप्पणी हटा दी। मैंने आखिरकार बेहतर परीक्षण पाया। का आनंद लें !
लादिस्लाव नाओ

यह मेरा मूल प्रश्न नहीं है, @ msturm17, आपके उत्तर को स्वीकार करना होगा, मैंने आपको हालांकि इनाम दिया था!
मैट रेइचेनबाक

मेरे सवाल का पूरी तरह से जवाब देने के लिए समय निकालने के लिए, धन्यवाद, लदिस्लाव!
msturm17

2

यदि आप समय के साथ अलग-अलग परिवर्तनों के वितरण को नहीं जानते हैं, तो आप इसे रोगी के बीच अंतर के वितरण के साथ अनुमानित नहीं कर सकते हैं। उदाहरण के लिए, यदि आपके पास उपचार के पहले संबंधित लोहे के स्तर (510,520, ..., 600) के साथ 10 रोगी हैं और उपचार के बाद (520,530, ..., 610), तो क्रुस्काल-वालिस एनोवा (या किसी अन्य समान एल्गोरिथ्म) का दावा होगा लोहे के स्तर में कोई महत्वपूर्ण परिवर्तन नहीं हुआ है।

आईएमएचओ, नियंत्रण समूह के बिना, सबसे अच्छा आप यह कर सकते हैं कि कितने रोगियों ने अपने लोहे के स्तर में वृद्धि की और कितने इसे घटाया, और इसके महत्व का परीक्षण किया।

उस ने कहा, अगर KW ANOVA आपको बताता है कि एक महत्वपूर्ण लोहा स्तर है, तो यह (कोई झूठी सकारात्मक) नहीं है।


1
कोई गलत सकारात्मक के लिए याय! Haha, आपके उत्तर के लिए धन्यवाद। आप यह कैसे सुझाते हैं कि "रोगियों के लौह स्तर में वृद्धि हुई है और कितने में कमी आई है?" धन्यवाद!
मैट रीचेनबाक

2
mnp=2(m+n)k=0m(m+nk)

धन्यवाद! यह मेरे सवाल को देखने का एक और दिलचस्प तरीका था और यह देखेगा कि यह मेरे डेटा पर कैसे लागू होता है।
msturm17
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.