एक सहकर्मी कुछ बुरा Heteroscedasticity (नीचे आंकड़ा) के साथ उसके शोध प्रबंध के लिए कुछ जैविक डेटा का विश्लेषण कर रहा है। वह एक मिश्रित मॉडल के साथ इसका विश्लेषण कर रही है लेकिन अभी भी अवशेषों से परेशान है।
प्रतिक्रिया-चर को लॉग-ट्रांसफ़ॉर्म करना चीजों को साफ़ करता है और इस प्रश्न के फीडबैक के आधार पर यह एक उपयुक्त दृष्टिकोण प्रतीत होता है। मूल रूप से, हालांकि, हमने सोचा था कि मिश्रित मॉडल के साथ रूपांतरित चर का उपयोग करने में समस्याएं थीं। यह पता चला है कि हम मिश्रित मॉडल के लिए लिटिल और मिलिकेन (2006) एसएएस में एक बयान की गलत व्याख्या कर रहे थे जो इंगित कर रहा था कि गिनती डेटा को बदलना अनुचित है और फिर सामान्य रैखिक मिश्रित मॉडल (पूर्ण उद्धरण नीचे है) के साथ इसका विश्लेषण करें। ।
एक दृष्टिकोण जो अवशेषों में भी सुधार करता था, वह एक पॉज़ोन वितरण के साथ सामान्यीकृत रैखिक मॉडल का उपयोग करना था। मैंने पढ़ा है कि Poisson वितरण का उपयोग निरंतर डेटा (उदाहरण के लिए, इस पोस्ट में चर्चा की गई ) मॉडलिंग के लिए किया जा सकता है , और आँकड़े पैकेज इसकी अनुमति देते हैं, लेकिन मुझे समझ नहीं आता कि मॉडल फिट होने पर क्या हो रहा है।
अंतर्निहित गणना कैसे की जा रही है, यह समझने के उद्देश्य से, मेरे प्रश्न हैं: जब आप निरंतर डेटा के लिए एक पॉइज़न वितरण फिट करते हैं, तो 1) क्या यह डेटा निकटतम पूर्णांक 2 पर गोल हो जाता है ) क्या यह जानकारी के नुकसान में परिणाम करता है? 3) जब, यदि कभी, क्या निरंतर डेटा के लिए पॉइसन मॉडल का उपयोग करना उचित है?
Littel & Milliken 2006, pg 529 "बदलना [गणना] डेटा प्रतिरूप हो सकता है। उदाहरण के लिए, एक परिवर्तन यादृच्छिक मॉडल प्रभाव या मॉडल की रैखिकता के वितरण को बिगाड़ सकता है। अधिक महत्वपूर्ण बात, डेटा को बदलने से संभावना खुल सकती है। नकारात्मक पूर्वानुमानित गणनाओं के परिणामस्वरूप, मिश्रित डेटा का उपयोग करके मिश्रित मॉडल से निष्कर्ष निकालना अत्यधिक संदिग्ध है। "