मुझसे जुड़े दो सवाल। मेरे पास एक डेटा फ्रेम है जिसमें एक कॉलम में मरीजों की संख्या होती है (रेंज 10 - 17 मरीज) और 0s और 1s दिखाते हैं कि क्या कोई घटना हुई थी। मैं रोगियों की संख्या पर घटना की संभावना को पुनः प्राप्त करने के लिए एक द्विपद मॉडल का उपयोग कर रहा हूं। हालांकि, मैं इस तथ्य के लिए समायोजित करना चाहूंगा कि जब अधिक रोगी होते हैं, तो अनिवार्य रूप से अधिक घटनाएं होंगी क्योंकि उस दिन वार्ड में रोगी के समय की कुल मात्रा अधिक होती है।
तो मैं इस तरह एक ऑफसेट द्विपद मॉडल का उपयोग कर रहा हूँ (आर कोड):
glm(Incident~Numbers, offset=Numbers, family=binomial, data=threatdata)
मेरे प्रश्न हैं:
क्या ठीक वैसा ही वैरिएबल है जिसकी भविष्यवाणी की जा रही है और ऑफसेट में है? मैं घटना की संभावना में टॉनिक वृद्धि को आंशिक रूप से देखना चाहता हूं और देखें कि क्या कुछ बचा है, अनिवार्य रूप से। यह मेरे लिए समझ में आता है, लेकिन मैं गलत होने के मामले में थोड़ा सतर्क हूं।
क्या ऑफसेट सही ढंग से निर्दिष्ट है? मुझे पता है कि पोइसन मॉडल में यह पढ़ा होगा
offset=log(Numbers)
मुझे नहीं पता कि यहां कोई समकक्ष है और मुझे Google के साथ कोई द्विपद ऑफसेट नहीं मिल रहा है (प्रमुख समस्या यह है कि मुझे नकारात्मक द्विपद प्राप्त होता रहता है, जो निश्चित रूप से अच्छा नहीं है)।