गैर-नकारात्मक शून्य-फुलाया निरंतर डेटा कैसे मॉडल करें?


16

मैं वर्तमान family = gaussianमें जैव विविधता के एक संकेतक के लिए एक रेखीय मॉडल ( ) लागू करने की कोशिश कर रहा हूं जो शून्य से कम मान नहीं ले सकता है, शून्य-फुला हुआ है और निरंतर है। मान 0 से लेकर 0.25 तक होता है। परिणामस्वरूप, मॉडल के अवशिष्टों में एक स्पष्ट पैटर्न है जिसे मैंने छुटकारा पाने में कामयाब नहीं किया है: यहाँ छवि विवरण दर्ज करें

क्या किसी को इस पर कोई विचार है कि इसे कैसे हल किया जाए?


1
CV में आपका स्वागत है! ध्यान दें कि आपका उपयोगकर्ता नाम, पहचान पत्र, और आपके उपयोगकर्ता पृष्ठ का एक लिंक आपके द्वारा बनाई गई प्रत्येक पोस्ट में स्वचालित रूप से जुड़ जाता है, इसलिए इन पोस्ट पर हस्ताक्षर करने की कोई आवश्यकता नहीं है। वास्तव में, हम आपको पसंद नहीं करते।
सिल्वरफिश

3
यदि यह शून्य-फुलाया जाता है तो यह निरंतर नहीं हो सकता है, क्योंकि निरंतर चर cdf में कोई भी कूद नहीं सकते हैं (और स्पष्ट रूप से 0 पर एक है)। यह 0 से एक तरफ लगातार हो सकता है।
Glen_b -Reinstate मोनिका

जवाबों:


32

शून्य-स्पंदित (अर्ध-) निरंतर वितरण के मामले में कई समाधान हैं:

  • टोबिट रिग्रेशन : मान लेता है कि डेटा एक अंतर्निहित अंतर्निहित सामान्य वितरण से आता है, लेकिन यह कि नकारात्मक मानों को सेंसर किया जाता है और शून्य पर स्टैक किया जाता है (उदाहरण के लिए सेंगर पैकेज )
  • बाधा या "दो-चरण" मॉडल: यह मानने के लिए कि क्या मान 0 या> 0 हैं, यह भविष्यवाणी करने के लिए एक द्विपद मॉडल का उपयोग करें, फिर देखे गए गैर-शून्य मानों को मॉडल करने के लिए एक रेखीय मॉडल (या गामा, या छोटा सामान्य, या लॉग-सामान्य) का उपयोग करें
  • 1<पी<2एक्स>0

या, यदि आपकी डेटा संरचना पर्याप्त रूप से सरल है, तो आप यह सुनिश्चित करने के लिए कि आपके इंट्रेंस को डेटा के वितरण में गड़बड़ी नहीं हो रही है, आप सिर्फ रैखिक मॉडल का उपयोग कर सकते हैं और क्रमपरिवर्तन परीक्षण या कुछ अन्य मजबूत दृष्टिकोण का उपयोग कर सकते हैं।

इनमें से अधिकांश मामलों के लिए R पैकेज / समाधान उपलब्ध हैं।

एसई के बारे में शून्य-फुलाया (अर्ध) निरंतर डेटा (जैसे यहां , यहां और यहां ) पर अन्य प्रश्न हैं , लेकिन वे एक स्पष्ट सामान्य उत्तर की पेशकश नहीं करते हैं ...

जीरो पर क्लंपिंग के साथ मिनिंग एंड एगेस्टी, 2002, मॉडलिंग नॉनजेगेटिव डेटा भी देखें : एक सर्वेक्षण एक अवलोकन के लिए।


@Ben Bolker क्या आप "पूर्वानुमानित या वास्तविक गैर-शून्य मानों को मॉडल करने के लिए एक रैखिक मॉडल (या गामा, या छोटा-सा सामान्य, या लॉग-सामान्य) का उपयोग करेंगे?
rolando2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.