यह StackExchange पर मेरी पहली पोस्ट है, लेकिन मैं इसे काफी समय से संसाधन के रूप में उपयोग कर रहा हूं, मैं उचित प्रारूप का उपयोग करने और उचित संपादन करने के लिए अपनी पूरी कोशिश करूंगा। साथ ही, यह एक बहु-भाग प्रश्न है। मुझे यकीन नहीं था कि मुझे प्रश्न को कई अलग-अलग पदों या सिर्फ एक में विभाजित करना चाहिए। चूँकि प्रश्न एक ही पाठ में एक सेक्शन से होते हैं इसलिए मुझे लगा कि एक प्रश्न के रूप में पोस्ट करना अधिक प्रासंगिक होगा।
मैं एक मास्टर की थीसिस के लिए एक विशाल स्तनपायी प्रजातियों के निवास स्थान के उपयोग पर शोध कर रहा हूं। इस प्रकल्प का लक्ष्य वन प्रबंधकों (जो कि संभवतः सांख्यिकीविद् नहीं हैं) को इस प्रजाति के संबंध में उनके द्वारा प्रबंधित भूमि पर आवास की गुणवत्ता का आकलन करने के लिए एक व्यावहारिक ढांचे के साथ प्रदान करना है। यह जानवर अपेक्षाकृत मायावी है, एक निवास स्थान विशेषज्ञ, और आमतौर पर दूरदराज के क्षेत्रों में स्थित है। प्रजातियों के वितरण के संबंध में अपेक्षाकृत कम अध्ययन किए गए हैं, विशेष रूप से मौसमी रूप से। कई जानवरों को एक वर्ष की अवधि के लिए जीपीएस कॉलर के साथ लगाया गया था। प्रत्येक जानवर के जीपीएस कॉलर डेटा से एक सौ स्थानों (50 गर्मियों और 50 सर्दियों) को यादृच्छिक रूप से चुना गया था। इसके अलावा, "उपलब्ध" या "छद्म-अनुपस्थिति" स्थानों के रूप में सेवा करने के लिए प्रत्येक जानवर के घर की सीमा के भीतर 50 अंक बेतरतीब ढंग से उत्पन्न हुए थे।
प्रत्येक स्थान के लिए, कई निवास स्थान चर (पेड़ के व्यास, क्षैतिज आवरण, मोटे लकड़ी के मलबे, आदि) के नमूने लिए गए थे और कई को जीआईएस (ऊंचाई, सड़क की दूरी, असभ्यता, आदि) के माध्यम से दूर से नमूना लिया गया था। वैरिएबल 1 श्रेणीगत चर को छोड़कर ज्यादातर निरंतर होते हैं जिसमें 7 स्तर होते हैं।
मेरा लक्ष्य संसाधन इकाइयों के उपयोग की सापेक्ष संभावना को मॉडल करने के लिए संसाधन चयन कार्यों (आरएसएफ) के निर्माण के लिए प्रतिगमन मॉडलिंग का उपयोग करना है। मैं जानवरों की आबादी (डिजाइन प्रकार I) के साथ-साथ प्रत्येक व्यक्तिगत जानवर (डिजाइन प्रकार III) के लिए एक मौसमी (सर्दी और गर्मी) आरएसएफ का निर्माण करना चाहूंगा।
मैं सांख्यिकीय विश्लेषण करने के लिए R का उपयोग कर रहा हूं।
प्राथमिक पाठ मैं उपयोग कर रहा है है ...
- "होसमर, डीडब्ल्यू, लेमेशो, एस।, और स्टुरिडिवेंट, आरएक्स 2013। एप्लाइड लॉजिस्टिक रिग्रेशन। विली, चिसेस्टर"।
होसमेर एट अल में अधिकांश उदाहरण। STATA का उपयोग करें, मैं आर के साथ संदर्भ के लिए निम्नलिखित 2 ग्रंथों का उपयोग कर रहा हूं ।
- "क्रॉली, एमजे 2005। सांख्यिकी: आरजे विली, चिसेस्टर, वेस्ट ससेक्स, इंग्लैंड का उपयोग कर एक परिचय।"
- "प्लांट, आरई 2012. पारिस्थितिकी और कृषि में स्थानिक डेटा विश्लेषण आर। सीआरसी प्रेस, लंदन, जीबीआर का उपयोग करना।"
मैं वर्तमान में होसमेर एट अल के अध्याय 4 के चरणों का पालन कर रहा हूं । "कोवरेट्स के उद्देश्यपूर्ण चयन" और प्रक्रिया के बारे में कुछ प्रश्न हैं। मैंने अपने प्रश्नों में सहायता के लिए नीचे दिए गए पाठ में पहले कुछ चरणों को रेखांकित किया है।
- चरण 1: प्रत्येक स्वतंत्र चर का एक अविभाज्य विश्लेषण (मैंने एक अविभाज्य लॉजिस्टिक प्रतिगमन का उपयोग किया)। कोई भी वैरिएबल जिसका अविभाज्य परीक्षण 0.25 से कम का पी-वैल्यू है, को पहले मल्टीवार्जेबल मॉडल में शामिल किया जाना चाहिए।
- चरण 2: चरण 1 में शामिल किए जाने के लिए पहचाने जाने वाले सभी कोवरिअट्स वाले एक बहुउपयोगी मॉडल को फिट करें और अपने वाल्ड स्टेटिस्टिक के पी-मूल्य का उपयोग करके प्रत्येक कोवरिएट के महत्व का आकलन करें। महत्व के पारंपरिक स्तरों पर योगदान नहीं करने वाले चर को समाप्त किया जाना चाहिए और एक नया मॉडल फिट होना चाहिए। आंशिक संभावना अनुपात परीक्षण का उपयोग करते हुए पुराने, बड़े मॉडल की तुलना में नए, छोटे मॉडल की तुलना की जानी चाहिए।
- चरण 3: छोटे मॉडल में अनुमानित गुणांक के मूल्यों की तुलना बड़े मॉडल से उनके संबंधित मूल्यों से करें। कोई भी चर जिसका गुणांक परिमाण में स्पष्ट रूप से बदल गया है, उसे वापस मॉडल में जोड़ा जाना चाहिए क्योंकि यह मॉडल में बने रहने वाले चर के प्रभाव का एक आवश्यक समायोजन प्रदान करने के अर्थ में महत्वपूर्ण है। चरण 2 और 3 के माध्यम से चक्र जब तक यह प्रकट नहीं होता है कि सभी महत्वपूर्ण चर मॉडल में शामिल हैं और जिन्हें बाहर रखा गया है वे चिकित्सकीय और / या सांख्यिकीय रूप से महत्वहीन हैं। होसमेर एट अल। गुणांक के परिमाण में परिवर्तन के उपाय के रूप में " डेल्टा-बीटा-हैट-प्रतिशत " का उपयोग करें। वे डेल्टा-बीटा-हैट-प्रतिशत > 20% के रूप में एक महत्वपूर्ण बदलाव का सुझाव देते हैं । होसमेर एट अल। डेल्टा-बीटा-हैट-प्रतिशत के रूप में परिभाषित करें। कहाँθ1छोटे मॉडल से गुणांक है औरβ1बड़ा मॉडल से गुणांक है।
- चरण 4: चरण 1 के अंत में प्राप्त मॉडल में चरण 1 में चयनित प्रत्येक चर को जोड़ें, जो एक समय में एक है, और इसके महत्व की जाँच करें या तो वाल्ड स्टैटिस्टिक पी-वैल्यू या आंशिक संभावना अनुपात परीक्षण द्वारा यह स्पष्ट है कि क्या है 2 से अधिक स्तरों के साथ चर। यह चरण उन चरों की पहचान करने के लिए महत्वपूर्ण है, जो स्वयं से, परिणाम से संबंधित नहीं हैं, लेकिन अन्य चर की उपस्थिति में महत्वपूर्ण योगदान देते हैं। हम प्रारंभिक मुख्य प्रभाव मॉडल के रूप में चरण 4 के अंत में मॉडल का उल्लेख करते हैं ।
- चरण 5-7: मैंने इस बिंदु पर प्रगति नहीं की है इसलिए मैं इन चरणों को अभी के लिए छोड़ दूंगा, या उन्हें एक अलग प्रश्न के लिए बचाऊंगा।
मेरे सवाल:
- चरण 2 में, पारंपरिक स्तर के महत्व के रूप में क्या उपयुक्त होगा, <0.05 का पी-मान <25 जैसा कुछ बड़ा है?
- चरण 2 में, मैं यह सुनिश्चित करना चाहता हूं कि आंशिक संभावना परीक्षण के लिए मैं जिस आर कोड का उपयोग कर रहा हूं वह सही है और मैं यह सुनिश्चित करना चाहता हूं कि मैं परिणामों की सही व्याख्या कर रहा हूं। यहां मैं वही कर रहा हूं ...
anova(smallmodel,largemodel,test='Chisq')
यदि पी-मूल्य महत्वपूर्ण है (<0.05) मैं चर को मॉडल में वापस जोड़ता हूं, अगर यह महत्वहीन है तो मैं विलोपन के साथ आगे बढ़ता हूं? - चरण 3 में, मेरे पास डेल्टा-बीटा-हैट-प्रतिशत के बारे में एक प्रश्न है और जब मॉडल में एक अपवर्जित चर जोड़ने के लिए उपयुक्त है। उदाहरण के लिए, मैं मॉडल से एक चर को बाहर निकालने और यह परिवर्तन > 20% की एक अलग चर के लिए। हालांकि, में> 20% परिवर्तन के साथ चर Δ बीटा % जैसे कि यह कदम 2 की अगले कुछ चक्रों में मॉडल से बाहर रखा जाएगा और 3. मैं कैसे करता है, तो दोनों चर एक दृढ़ संकल्प कर सकते हैं तुच्छ और दिखता प्रतीत हो रहा है शामिल किया जाना चाहिए या मॉडल से बाहर रखा जाना चाहिए? क्योंकि मैं पहले कम से कम महत्वपूर्ण चर को हटाकर एक समय में 1 चर को छोड़कर आगे बढ़ रहा हूं, मैं एक चर को क्रम से बाहर करने में संकोच कर रहा हूं।
अंत में, मुझे यकीन है कि कोड मैं गणना करने के लिए उपयोग कर रहा हूँ बनाना चाहते सही है। मैं निम्नलिखित कोड का उपयोग कर रहा हूं। अगर कोई ऐसा पैकेज है जो मेरे लिए ऐसा करेगा या ऐसा करने का एक और सरल तरीका है जो मैं सुझावों के लिए खुला हूं।
100*((smallmodel$coef[2]-largemodel$coef[2])/largemodel$coef[2])