निरंतर डेटा के साथ जीएलएम शून्य पर ढेर हो गया

11

मैं यह अनुमान लगाने के लिए एक मॉडल चलाने की कोशिश कर रहा हूं कि टीबी, एड्स आदि जैसी भयावह बीमारियां अस्पताल में भर्ती होने पर खर्च को कैसे प्रभावित करती हैं। मेरे पास आश्रित चर के रूप में "प्रति अस्पताल में होने वाला खर्च" है और स्वतंत्र चर के रूप में विभिन्न व्यक्तिगत मार्कर हैं, जिनमें से लगभग सभी डमी हैं जैसे लिंग, घरेलू स्थिति का मुखिया, गरीबी की स्थिति और निश्चित रूप से बीमारी के लिए एक डमी (प्लस आयु) और आयु वर्ग) और बातचीत की शर्तों का एक गुच्छा।

जैसा कि उम्मीद की जा रही है, एक महत्वपूर्ण राशि है - और मेरा बहुत मतलब है - शून्य पर ढेर किए गए डेटा (यानी, 12 महीने के संदर्भ अवधि में अस्पताल में भर्ती होने पर कोई खर्च नहीं)। इन जैसे डेटा से निपटने का सबसे अच्छा तरीका क्या होगा?

अब तक मैंने ln(1+cost)सभी टिप्पणियों को शामिल करने और फिर एक रैखिक मॉडल चलाने के लिए लागत को रूपांतरित करने का निर्णय लिया । क्या मैं सही रास्ते पर हूं?

— user42372
स्रोत

1

क्या आपकी प्रतिक्रिया वास्तव में एक गिनती है? आप जिस शब्द की तलाश कर रहे हैं वह शून्य-मुद्रास्फीति है ।

— गूँग -

2

किसी के पास शून्य-स्पंदन निरंतर वितरण हो सकता है; उदाहरण के लिए शून्य-फुलाया गामा मॉडल हैं।

— Glen_b -Reinstate मोनिका

1

@Glen_b, यही मेरे मन में था। मैंने कभी एक नहीं किया, हालांकि। फ्रैंक हैरेल का ओएलआर का सुझाव समस्या के साथ-साथ काम करने का एक चतुर तरीका है।

— गुंग - को पुनः स्थापित मोनिका

8

जैसा कि साइट पर कहीं और चर्चा की गई है, क्रमिक प्रतिगमन (जैसे, आनुपातिक बाधाओं, आनुपातिक खतरों, प्रोबेट) एक लचीला और मजबूत दृष्टिकोण है। के वितरण में छूट को अनुमति दी जाती है , जिसमें चरम clumping भी शामिल है। एक लिए के वितरण के बारे में कुछ भी नहीं माना जाता है । शून्य फुलाए हुए मॉडल अर्ध-पैरामीट्रिक मॉडल की तुलना में कहीं अधिक धारणा बनाते हैं। एक पूरे मामले के अध्ययन के लिए मेरे कोर्स हैंडआउट्स चैप्टर 15 को http://biostat.mc.vanderbilt.edu/CourseBit330 पर देखें । $Y$ $Y$ $X$

निरंतर के लिए क्रमसूचक मॉडलों में से एक बड़ा फायदा कि आप को पता है को बदलने के लिए कैसे की आवश्यकता नहीं है विश्लेषण से पहले। $Y$ $Y$

— फ्रैंक हैरेल
स्रोत

8

0 पर चढ़ने को "शून्य मुद्रास्फीति" कहा जाता है। अब तक सबसे आम मामलों में गिनती के मॉडल हैं, जो शून्य-फुलाए हुए पॉइसन और शून्य-फुलाए गए नकारात्मक द्विपद प्रतिगमन के लिए अग्रणी हैं। हालांकि, वास्तविक सकारात्मक मूल्यों (जैसे शून्य-फुलाए गए गामा मॉडल) के साथ शून्य मुद्रास्फीति को मॉडल करने के तरीके हैं।

इन तरीकों की समीक्षा के लिए शून्य पर clumping के साथ गैर नकारात्मक डेटा मॉडलिंग, Min और Agresti, 2002 देखें ।

— पीटर फ्लॉम
स्रोत

1

शून्य फुलाया हुआ पॉइसन मॉडल का उपयोग करने का सुझाव एक दिलचस्प शुरुआत है। यह संयुक्त रूप से किसी भी बीमारी से संबंधित लागतों के होने की संभावना के साथ-साथ उन लागतों को समझने की प्रक्रिया के बारे में मॉडलिंग करता है जिनसे आपको कोई बीमारी होनी चाहिए। इसकी सीमा होती है कि यह कुछ सख्त संरचना को लागू करता है, जिसके परिणाम का आकार क्या होता है, किसी भी लागत को अर्जित करने की शर्त पर सशर्त (जैसे एक विशिष्ट मतलब-भिन्नता संबंध और एक सकारात्मक पूर्णांक परिणाम ... जिनमें से कुछ के लिए आराम दिया जा सकता है। मॉडलिंग के उद्देश्य)।

यदि आप स्वतंत्र रूप से प्रवेश प्रक्रियाओं पर बीमारी से संबंधित प्रवेश और बीमारी से संबंधित लागत सशर्त के इलाज के साथ ठीक हैं , तो आप इसे पहले से विस्तारित कर सकते हैं y / n की द्विआधारी प्रक्रिया को मॉडलिंग करते हुए क्या आपने बीमारी से संबंधित किसी भी लागत का अधिग्रहण किया था? यह एक सरल लॉजिस्टिक रिग्रेशन मॉडल है और आपको जोखिम कारकों और व्यापकता का मूल्यांकन करने की अनुमति देता है। यह देखते हुए कि, आप किसी भी लागत के उपार्जित व्यक्तियों के सबसेट के विश्लेषण को प्रतिबंधित कर सकते हैं और मॉडलिंग टेचीनी के मेजबान का उपयोग करके वास्तविक लागत प्रक्रिया का मॉडल तैयार कर सकते हैं। पॉइसन अच्छा है, क्वैसी-पॉइसन बेहतर होगा (डेटा में कोवरिएशन के छोटे unmeasured स्रोतों के लिए लेखांकन और मॉडल मान्यताओं से प्रस्थान)। लेकिन लगातार लागत प्रक्रिया मॉडलिंग के साथ आकाश की सीमा है।

यदि आपको प्रक्रिया में मापदंडों के सहसंबंध को मॉडल करने की आवश्यकता है, तो आप बूटस्ट्रैप एसई अनुमानों का उपयोग कर सकते हैं। मुझे कोई कारण नहीं दिखता कि यह अमान्य क्यों होगा, लेकिन यदि यह गलत हो सकता है तो दूसरों के इनपुट को सुनने के लिए उत्सुक होंगे। सामान्य तौर पर, मुझे लगता है कि वे दो अलग-अलग प्रश्न हैं और उन्हें इस तरह माना जाना चाहिए कि उनके पास वैध प्रवेश है।

— Adamo
स्रोत