क्या शून्य गणना को पॉइसन / लॉगलाइनियर मॉडल के संभावना अनुपात परीक्षण के लिए समायोजित करने की आवश्यकता है?


9

यदि आकस्मिक तालिका में 0 हैं और हम glmसंभावित अनुपात परीक्षण के लिए नेस्टेड पॉइज़न / लॉगलाइनियर मॉडल (आर के फ़ंक्शन का उपयोग करके ) फिट कर रहे हैं , तो क्या हमें ग्लम मॉडल फिटिंग करने से पहले डेटा को समायोजित करने की आवश्यकता है (उदाहरण के लिए सभी को 1/2 जोड़ें) मायने रखता है)? स्पष्ट रूप से कुछ मापदंडों को कुछ समायोजन के बिना अनुमानित नहीं किया जा सकता है, लेकिन समायोजन / समायोजन की कमी LR परीक्षण को कैसे प्रभावित करती है?


निश्चित रूप से glmअगर यह शून्य को नहीं संभाल सकता है तो दिनचर्या बंध जाएगी। या तुमने कोशिश की?
shabbychef

1
हाँ यह दुर्घटना नहीं करता है, लेकिन सूत्र पर निर्भर करता है (जैसे संतृप्त मॉडल में), कुछ मापदंडों में प्रभावी रूप से अनंत मानक त्रुटियां हो सकती हैं। मेरा सवाल यह है कि क्या संभावना अनुपात परीक्षण करते समय यह एक समस्या है। आप अभी भी एक संभावना की गणना कर सकते हैं, भले ही कुछ मापदंडों का अनुमान न हो, उन मापदंडों की संभावना के लिए योगदान नहीं होगा। मानक अभ्यास क्या है और क्यों?
बीआर 1

जवाबों:


7

प्रतिगमन मॉडलिंग की शक्तियों में से एक आम तौर पर आप बिना किसी डेटा के क्षेत्रों पर आसानी से कर सकते हैं - हालांकि जैसा कि आपने देखा है, मापदंडों का अनुमान लगाने में कभी-कभी समस्याएं होती हैं। मैं आपको सुझाव दूंगा कि अगर आपको अनंत मानक त्रुटियों जैसी चीजें मिल रही हैं तो अपने मॉडलिंग दृष्टिकोण पर पुनर्विचार करें।

एक विशेष ध्यान देने वाली बात: किसी विशेष तबके में "कोई मायने नहीं रखता है" के बीच एक अंतर होता है, और उस तबके में मायने रखना असंभव होता है। उदाहरण के लिए, कल्पना कीजिए कि आप 2000 और 2009 के बीच अमेरिकी नौसेना के लिए मनोवैज्ञानिक विकारों के अध्ययन पर काम कर रहे हैं, और दोनों के लिए द्विआधारी प्रतिगमन शर्तें हैं "एक औरत है" और "एक पनडुब्बी पर काम करता है"। एक प्रतिगमन मॉडल उन प्रभावों का अनुमान लगाने में सक्षम हो सकता है जहां दोनों चर = 1 शून्य संख्या होने के बावजूद दोनों = 1. हालांकि यह निष्कर्ष मान्य नहीं होगा - ऐसी स्थिति असंभव है। इस समस्या को "गैर-सकारात्मकता" कहा जाता है और कभी-कभी उच्च स्तरीकृत मॉडल में समस्या होती है।


@ Skyguy94 पर्याप्त रूप से मैं ऐसा नहीं करता - मुझे पता था कि, मैं अभी पूर्वव्यापी डेटा सेट> <का उपयोग नोट करना भूल गया था। <। को प्रतिबिंबित करने के लिए संपादित।
फोमाइट

पुन: "एक प्रतिगमन मॉडल उन प्रभावों का अनुमान लगाने में सक्षम हो सकता है जहां दोनों चर = 1, या दोनों के बीच बातचीत " - मुझे नहीं लगता कि यह सच है। यदि आपके पास दो द्विआधारी भविष्यवक्ता हैं जो कभी भी एक साथ '1' नहीं होते हैं, तो इंटरैक्शन स्थिर होता है (यह हमेशा '0' होता है), इसलिए इसके प्रभाव की पहचान नहीं की जाती है।
मैक्रो

@ मैक्रो आप सही कह रहे हैं, मैं थोड़ा संपादन कर रहा हूं। मैं उन शब्दों के लिए सोच रहा था जहां वे बाइनरी संकेतक नहीं हैं।
Fomite

1
(+1) इसलिए, मामले की गैर-संभाव्यता के साथ मुद्दे जहां दोनों = 1 एक तरफ, मॉडल आधारित अनुमान सिर्फ दो सीमांत प्रभावों का योग होगा, जिसे हम जानते हैं कि यह अपने आप में बहुत भ्रामक हो सकता है :)
मैक्रो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.