प्रतिशत डेटा के लिए वितरण


11

मेरे पास अपने डेटा के साथ मॉडल बनाने के लिए उपयोग करने के लिए सही वितरण के बारे में एक प्रश्न है। मैंने 50 भूखंडों के साथ एक वन इन्वेंट्री का आयोजन किया, प्रत्येक भूखंड का माप 20 मीटर × 50 मीटर है। प्रत्येक भूखंड के लिए, मैंने अनुमान लगाया कि पेड़ की छँटाई का प्रतिशत जमीन को हिलाता है। चंदवा कवर के लिए प्रत्येक प्लॉट का प्रतिशत में एक मूल्य होता है। प्रतिशत 0 से 0.95 तक है। मैं उपग्रह इमेजरी और पर्यावरणीय आंकड़ों के आधार पर स्वतंत्र एक्स चर के मैट्रिक्स के साथ प्रतिशत वृक्ष चंदवा कवर ( वाई चर) का एक मॉडल बना रहा हूं ।

मुझे यकीन नहीं है कि मुझे एक द्विपद वितरण का उपयोग करना चाहिए, क्योंकि एक द्विपद यादृच्छिक चर n स्वतंत्र परीक्षणों (यानी, बर्नौली यादृच्छिक चर) का योग है । प्रतिशत मान परीक्षण के योग नहीं हैं; वे वास्तविक प्रतिशत हैं। क्या मुझे गामा का उपयोग करना चाहिए, भले ही इसकी ऊपरी सीमा न हो? क्या मुझे पूर्णांक को पूर्णांक में बदलना चाहिए और पॉइसन को मायने रखता है? क्या मुझे सिर्फ गौसियन के साथ रहना चाहिए? मुझे साहित्य में या पाठ्यपुस्तकों में ऐसे कई उदाहरण नहीं मिले हैं जो इस तरह से प्रतिशत बढ़ाने की कोशिश करते हैं। किसी भी संकेत या अंतर्दृष्टि की सराहना की जाती है।


आपके जवाबों के लिये धन्यवाद। वास्तव में, बीटा वितरण बिल्कुल वही है जिसकी मुझे आवश्यकता है और इस लेख में पूरी तरह से चर्चा की गई है:

निम्न आलेख बीटा-वितरित प्रतिक्रिया चर को बदलने के लिए एक अच्छे तरीके पर चर्चा करता है जब इसमें 0% और / या 1 प्रतिशत प्रतिशत की सीमा शामिल होती है:


2
क्या आपने एक आंशिक लॉग या शून्य-फुलाया बीटा का उपयोग करने के बारे में सोचा है ?
दिमित्री वी। मास्टरोव

2
आपके जवाबों के लिये धन्यवाद। वास्तव में, बीटा वितरण वास्तव में वही है जिसकी मुझे आवश्यकता है और इस लेख में पूरी तरह से चर्चा की गई है: एस्सेलसन, बीएन, मैडसेन, एल।, हैगर, जेसी, और टेम्सगेन, एच। (2011)। बीटा प्रतिगमन और कोप्युला मॉडल के साथ रिपेरियन समझदार वनस्पति कवर का अनुमान। वन विज्ञान, 57 (3), 212-221। ये लेखक R में Cribari-Neto और Zeileis द्वारा betareg पैकेज का उपयोग करते हैं। निम्न आलेख बीटा-वितरित प्रतिक्रिया चर को बदलने के लिए एक अच्छे तरीके पर चर्चा करता है, जब यह सच 0 और / या 1 प्रतिशत की सीमा में शामिल होता है: स्मिथसन, एम।, और जे। वेरकुइलेन, 2006। एक बेहतर नींबू वर्ग

जवाबों:


7

आप सही कह रहे हैं कि द्विपदीय वितरण असतत अनुपात के लिए है जो बर्नौली परीक्षणों की एक सीमित संख्या से 'सफलताओं' की संख्या से उत्पन्न होता है, और यह आपके डेटा के लिए वितरण को अनुपयुक्त बनाता है। आपको उस गामा के योग और अन्य गामा के योग से विभाजित गामा वितरण का उपयोग करना चाहिए। यही है, आपको निरंतर अनुपात को मॉडल करने के लिए बीटा वितरण का उपयोग करना चाहिए ।

मेरे पास अपने जवाब में बीटा प्रतिगमन का एक उदाहरण है: आर में प्रतिगमन का उपयोग करके निरंतर अनुपात डेटा पर कारक का प्रभाव हटाएं

अपडेट:
@ DimitriyV.Masterov अच्छा मुद्दा यह है कि आप अपने डेटा है उल्लेख को जन्म देती है की, लेकिन बीटा वितरण केवल पर समर्थित है । यह इस सवाल का संकेत देता है कि ऐसे मूल्यों के साथ क्या किया जाना चाहिए। इस उत्कृष्ट सीवी थ्रेड से कुछ विचारों को चमकाया जा सकता है: 0 की लॉग लेने से बचने के लिए x को कितनी छोटी मात्रा में जोड़ा जाना चाहिए?0(0, 1)


3
क्या बीटा वितरण शून्य को संभाल सकता है?
दिमित्री वी। मास्टरोव

1

प्रतिशत मान नमूनों की संख्या से स्वतंत्र दरों का प्रतिनिधित्व करते हैं। आप व्याख्यात्मक चर के रूप में इन प्रतिशत का उपयोग निर्भर चर और उपग्रह इमेजरी के रूप में करना चाहेंगे। हालांकि मुझे लगता है कि इन्वेंट्री के सभी 50 भूखंडों में समान संख्या में नमूने नहीं थे। एक उपयुक्त मॉडल जो इन प्रतिशत को अन्य चर से संबंधित करता है, इसे माप में इस अनिश्चितता को ध्यान में रखना चाहिए, उच्च नमूनों वाले भूखंडों पर अधिक भार देना।

इसके अलावा, आपके डेटा के मामले में त्रुटि वितरण स्पष्ट रूप से द्विपद है। त्रुटि विचरण सीमाओं में सबसे छोटा है, यह एक द्विपद वितरण द्वारा कब्जा कर लिया गया है।

यह सब मुझे द्विपद त्रुटि मॉडल के साथ एक जीएलएम का उपयोग करने के कट्टरपंथी उदाहरण के रूप में लगता है।

"सांख्यिकी: आर का उपयोग करके एक परिचय", अध्याय 14 क्रॉले द्वारा इस विषय पर चर्चा की गई है और आर के साथ इसका विश्लेषण कैसे किया जाए।


4
द्विपद बंटन Bernoulli परीक्षणों की एक ज्ञात संख्या से सफलताओं की संख्या का वितरण है। आपकी टिप्पणी है कि "बर्नौली परीक्षणों का वर्णन एक द्विपद वितरण द्वारा किया गया है, इसका मतलब यह नहीं है कि एक द्विपद वितरण द्वारा वर्णित सब कुछ बर्नौली संरचना के अनुरूप होना चाहिए" सही नहीं है। निरंतर अनुपात के लिए द्विपद वितरण उचित नहीं है। इसके अलावा, मैंने गामा वितरण का सुझाव नहीं दिया, लेकिन बीटा वितरण।
गूँग - मोनिका

1
हाँ, आप बिलकुल सही हैं।
बोनोबो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.