मेरे पास एक डेटासेट है जिसमें ~ 2,500 व्यक्तियों से ~ 7,500 रक्त परीक्षण होते हैं। मैं यह पता लगाने की कोशिश कर रहा हूं कि क्या दो परीक्षणों के बीच समय के साथ रक्त परीक्षण में परिवर्तनशीलता बढ़ जाती है या घट जाती है। उदाहरण के लिए - मैं बेसलाइन परीक्षण के लिए आपका रक्त खींचता हूं, फिर तुरंत एक दूसरा नमूना खींचता हूं। छह महीने बाद, मैं एक और नमूना तैयार करता हूं। बेसलाइन और छह महीने के परीक्षण के बीच अंतर की तुलना में बेसलाइन और तत्काल रिपीट परीक्षणों के बीच अंतर की अपेक्षा की जा सकती है।
नीचे दिए गए बिंदु पर प्रत्येक बिंदु दो परीक्षणों के बीच के अंतर को दर्शाता है। एक्स दो परीक्षणों के बीच दिनों की संख्या है; Y दोनों परीक्षणों के बीच अंतर का आकार है। जैसा कि आप देख सकते हैं, परीक्षण एक्स के साथ समान रूप से वितरित नहीं किए गए हैं - अध्ययन वास्तव में इस प्रश्न को संबोधित करने के लिए डिज़ाइन नहीं किया गया था। क्योंकि इस बिंदु पर अंक बहुत भारी हो गए हैं, मैंने 28-दिन की खिड़कियों के आधार पर 95% (नीला) और 99% (लाल) मात्रात्मक रेखाएं शामिल की हैं। ये स्पष्ट रूप से अधिक चरम बिंदुओं के आसपास खींचे जाते हैं, लेकिन आपको यह विचार मिलता है।
alt text http://a.imageshack.us/img175/6595/diffsbydays.png
यह मुझे लगता है कि परिवर्तनशीलता काफी स्थिर है। यदि कुछ भी है, तो परीक्षण के कम समय के भीतर दोहराया जाने पर यह अधिक होता है - यह बहुत ही उचित है। मैं इसे व्यवस्थित तरीके से कैसे संबोधित कर सकता हूं, प्रत्येक समय बिंदु पर अलग-अलग n (और कुछ परीक्षणों के बिना कुछ अवधि) के लिए लेखांकन? आपके विचारों की बहुत सराहना की जाती है।
केवल संदर्भ के लिए, यह परीक्षण और पुन: परीक्षण के बीच दिनों की संख्या का वितरण है:
alt text http://a.imageshack.us/img697/6572/testsateachtimepoint.png