निरंतर डेटा के साथ जीएलएम शून्य पर ढेर हो गया


11

मैं यह अनुमान लगाने के लिए एक मॉडल चलाने की कोशिश कर रहा हूं कि टीबी, एड्स आदि जैसी भयावह बीमारियां अस्पताल में भर्ती होने पर खर्च को कैसे प्रभावित करती हैं। मेरे पास आश्रित चर के रूप में "प्रति अस्पताल में होने वाला खर्च" है और स्वतंत्र चर के रूप में विभिन्न व्यक्तिगत मार्कर हैं, जिनमें से लगभग सभी डमी हैं जैसे लिंग, घरेलू स्थिति का मुखिया, गरीबी की स्थिति और निश्चित रूप से बीमारी के लिए एक डमी (प्लस आयु) और आयु वर्ग) और बातचीत की शर्तों का एक गुच्छा।

जैसा कि उम्मीद की जा रही है, एक महत्वपूर्ण राशि है - और मेरा बहुत मतलब है - शून्य पर ढेर किए गए डेटा (यानी, 12 महीने के संदर्भ अवधि में अस्पताल में भर्ती होने पर कोई खर्च नहीं)। इन जैसे डेटा से निपटने का सबसे अच्छा तरीका क्या होगा?

अब तक मैंने ln(1+cost)सभी टिप्पणियों को शामिल करने और फिर एक रैखिक मॉडल चलाने के लिए लागत को रूपांतरित करने का निर्णय लिया । क्या मैं सही रास्ते पर हूं?


1
क्या आपकी प्रतिक्रिया वास्तव में एक गिनती है? आप जिस शब्द की तलाश कर रहे हैं वह शून्य-मुद्रास्फीति है
गूँग -

2
किसी के पास शून्य-स्पंदन निरंतर वितरण हो सकता है; उदाहरण के लिए शून्य-फुलाया गामा मॉडल हैं।
Glen_b -Reinstate मोनिका

1
@Glen_b, यही मेरे मन में था। मैंने कभी एक नहीं किया, हालांकि। फ्रैंक हैरेल का ओएलआर का सुझाव समस्या के साथ-साथ काम करने का एक चतुर तरीका है।
गुंग - को पुनः स्थापित मोनिका

जवाबों:


8

जैसा कि साइट पर कहीं और चर्चा की गई है, क्रमिक प्रतिगमन (जैसे, आनुपातिक बाधाओं, आनुपातिक खतरों, प्रोबेट) एक लचीला और मजबूत दृष्टिकोण है। के वितरण में छूट को अनुमति दी जाती है , जिसमें चरम clumping भी शामिल है। एक लिए के वितरण के बारे में कुछ भी नहीं माना जाता है । शून्य फुलाए हुए मॉडल अर्ध-पैरामीट्रिक मॉडल की तुलना में कहीं अधिक धारणा बनाते हैं। एक पूरे मामले के अध्ययन के लिए मेरे कोर्स हैंडआउट्स चैप्टर 15 को http://biostat.mc.vanderbilt.edu/CourseBit330 पर देखेंYYX

निरंतर के लिए क्रमसूचक मॉडलों में से एक बड़ा फायदा कि आप को पता है को बदलने के लिए कैसे की आवश्यकता नहीं है विश्लेषण से पहले।YY


8

0 पर चढ़ने को "शून्य मुद्रास्फीति" कहा जाता है। अब तक सबसे आम मामलों में गिनती के मॉडल हैं, जो शून्य-फुलाए हुए पॉइसन और शून्य-फुलाए गए नकारात्मक द्विपद प्रतिगमन के लिए अग्रणी हैं। हालांकि, वास्तविक सकारात्मक मूल्यों (जैसे शून्य-फुलाए गए गामा मॉडल) के साथ शून्य मुद्रास्फीति को मॉडल करने के तरीके हैं।

इन तरीकों की समीक्षा के लिए शून्य पर clumping के साथ गैर नकारात्मक डेटा मॉडलिंग, Min और Agresti, 2002 देखें ।


1

शून्य फुलाया हुआ पॉइसन मॉडल का उपयोग करने का सुझाव एक दिलचस्प शुरुआत है। यह संयुक्त रूप से किसी भी बीमारी से संबंधित लागतों के होने की संभावना के साथ-साथ उन लागतों को समझने की प्रक्रिया के बारे में मॉडलिंग करता है जिनसे आपको कोई बीमारी होनी चाहिए। इसकी सीमा होती है कि यह कुछ सख्त संरचना को लागू करता है, जिसके परिणाम का आकार क्या होता है, किसी भी लागत को अर्जित करने की शर्त पर सशर्त (जैसे एक विशिष्ट मतलब-भिन्नता संबंध और एक सकारात्मक पूर्णांक परिणाम ... जिनमें से कुछ के लिए आराम दिया जा सकता है। मॉडलिंग के उद्देश्य)।

यदि आप स्वतंत्र रूप से प्रवेश प्रक्रियाओं पर बीमारी से संबंधित प्रवेश और बीमारी से संबंधित लागत सशर्त के इलाज के साथ ठीक हैं , तो आप इसे पहले से विस्तारित कर सकते हैं y / n की द्विआधारी प्रक्रिया को मॉडलिंग करते हुए क्या आपने बीमारी से संबंधित किसी भी लागत का अधिग्रहण किया था? यह एक सरल लॉजिस्टिक रिग्रेशन मॉडल है और आपको जोखिम कारकों और व्यापकता का मूल्यांकन करने की अनुमति देता है। यह देखते हुए कि, आप किसी भी लागत के उपार्जित व्यक्तियों के सबसेट के विश्लेषण को प्रतिबंधित कर सकते हैं और मॉडलिंग टेचीनी के मेजबान का उपयोग करके वास्तविक लागत प्रक्रिया का मॉडल तैयार कर सकते हैं। पॉइसन अच्छा है, क्वैसी-पॉइसन बेहतर होगा (डेटा में कोवरिएशन के छोटे unmeasured स्रोतों के लिए लेखांकन और मॉडल मान्यताओं से प्रस्थान)। लेकिन लगातार लागत प्रक्रिया मॉडलिंग के साथ आकाश की सीमा है।

यदि आपको प्रक्रिया में मापदंडों के सहसंबंध को मॉडल करने की आवश्यकता है, तो आप बूटस्ट्रैप एसई अनुमानों का उपयोग कर सकते हैं। मुझे कोई कारण नहीं दिखता कि यह अमान्य क्यों होगा, लेकिन यदि यह गलत हो सकता है तो दूसरों के इनपुट को सुनने के लिए उत्सुक होंगे। सामान्य तौर पर, मुझे लगता है कि वे दो अलग-अलग प्रश्न हैं और उन्हें इस तरह माना जाना चाहिए कि उनके पास वैध प्रवेश है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.