मुझे कृषि परीक्षणों पर एक डेटासेट मिला है। मेरा प्रतिक्रिया चर एक प्रतिक्रिया अनुपात है: लॉग (उपचार / नियंत्रण)। मुझे इस बात में दिलचस्पी है कि अंतर में क्या अंतर है, इसलिए मैं आरई मेटा-रिग्रेशन (अनवीटेड चला रहा हूं, क्योंकि यह स्पष्ट है कि प्रभाव का आकार अनुमानों के विचलन के साथ असंबंधित है)।
प्रत्येक अध्ययन में अनाज की उपज, बायोमास की उपज, या दोनों की रिपोर्ट की जाती है। मैं अध्ययन से अनाज की उपज को अधिरोपित नहीं कर सकता, जो बायोमास की उपज की अकेले रिपोर्ट करता है, क्योंकि अध्ययन किए गए सभी पौधे अनाज के लिए उपयोगी नहीं थे (गन्ना शामिल है, उदाहरण के लिए)। लेकिन अनाज पैदा करने वाले प्रत्येक पौधे में बायोमास भी था।
लापता सहकर्मियों के लिए, मैं पुनरावृत्ति प्रतिगमन प्रतिरूपण (एंड्रयू जेलमैन की पाठ्यपुस्तक अध्याय के बाद) का उपयोग कर रहा हूं। यह उचित परिणाम देता है, और पूरी प्रक्रिया आम तौर पर सहज है। मूल रूप से मैं लापता मूल्यों की भविष्यवाणी करता हूं, और उन मूल्यवान मूल्यों की भविष्यवाणी करने के लिए उन अनुमानित मूल्यों का उपयोग करता हूं, और प्रत्येक चर के माध्यम से लूप करता हूं जब तक कि प्रत्येक चर लगभग वितरण (वितरण में) नहीं हो जाता।
क्या कोई कारण है कि मैं लापता परिणाम डेटा को लागू करने के लिए एक ही प्रक्रिया का उपयोग नहीं कर सकता हूं? मैं संभवतः बायोमास प्रतिक्रिया अनुपात दिए गए अनाज प्रतिक्रिया अनुपात, फसल प्रकार, और मेरे पास अन्य covariates के लिए एक अपेक्षाकृत जानकारीपूर्ण प्रतिरूपण मॉडल बना सकता हूं। मैं तब गुणांक और VCV का औसत निकालूंगा, और मानक अभ्यास के अनुसार MI करेक्शन जोड़ूंगा।
लेकिन जब ये परिणाम खुद ही थोपे जाते हैं तो ये गुणांक क्या मापते हैं? क्या गुणांक की व्याख्या covariates के लिए मानक एमआई से अलग है? इसके बारे में सोचकर, मैं खुद को समझा नहीं सकता कि यह काम नहीं करता है, लेकिन मुझे यकीन नहीं है। सामग्री पढ़ने के लिए विचार और सुझाव का स्वागत है।