मुझे एक अध्ययन के लिए विश्लेषण करने के लिए चार अलग-अलग समय बिंदुओं पर लोहे के स्तर पर उपचार के प्रभाव को देखने के लिए डेटा दिया गया था (उपचार से पहले, दिन उपचार समाप्त हो गया, उपचार के 4 सप्ताह बाद और उपचार के 2-4 महीने बाद)। कोई नियंत्रण समूह नहीं है। वे यह देखना चाह रहे हैं कि क्या उपचार से पहले उपचार (बेसलाइन) स्तर पर 3 पोस्ट-उपचार समय बिंदुओं में से प्रत्येक में लोहे के स्तर में उल्लेखनीय वृद्धि हुई है। ग्यारह रोगियों का आधारभूत स्तर था, लेकिन केवल 8 रोगियों के पास सभी 4 समय बिंदुओं के लिए पूरा डेटा था ( प्रत्येक समय बिंदु के लिए = 11, 10, 9 और 8)। न केवल लोहे के स्तर को मापा गया था, बल्कि हर बार बिंदु पर आधारभूत की तुलना में दो अन्य प्रयोगशाला उपाय किए गए थे।
मेरे पास कुछ सवाल हैं कि मैं इसका विश्लेषण कैसे करूं। मैंने पहले सोचा था कि एक आरएम एनोवा इस डेटा का विश्लेषण करने के लिए उपयुक्त होगा, लेकिन मैं छोटे नमूने के आकार, डेटा की हानि और डेटा के गैर-सामान्य वितरण के बारे में चिंतित था। फिर मैंने विलकॉक्सन हस्ताक्षरित रैंक परीक्षणों का उपयोग करते हुए बेसलाइन के बाद के प्रत्येक उपचार की तुलना बेसलाइन से करने पर विचार किया, लेकिन फिर मैं कई तुलनाओं के मुद्दे पर चलता हूं। हालाँकि, मैंने कुछ साहित्य पढ़े हैं, जिनमें कई तुलनाओं को चलाने की आवश्यकता है। तो कुल मिलाकर, मैं छोटे नमूने के आकार, अधूरे डेटा और कई तुलनाओं (और यह आवश्यक है या नहीं) के साथ काम कर रहा हूं।
मुझे उम्मीद है कि यह सब समझ में आता है। मैं CrossValidated के लिए नया हूं और अनुभवी सांख्यिकीविदों से सीखने के लिए एक सहयोगी के रूप में यहां निर्देशित किया गया था, इसलिए मैं किसी भी सलाह की सराहना करता हूं! धन्यवाद!
टिप्पणी से कच्चा डेटा जोड़ने का संपादन:
चार कुल समय बिंदु हैं और परिणाम चर निरंतर है। उदाहरण के लिए, प्रत्येक बार बिंदु पर परिणाम इस के समान दिखते हैं:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]