आप प्रतिगमन मॉडल में चर का चयन कैसे करते हैं?


12

चर चयन के लिए पारंपरिक दृष्टिकोण उन चर को खोजना है जो एक नई प्रतिक्रिया की भविष्यवाणी करने में सबसे अधिक योगदान देते हैं। हाल ही में मुझे इसके विकल्प का पता चला। मॉडलिंग चर में जो एक उपचार के प्रभाव को निर्धारित करते हैं - उदाहरण के लिए एक दवा के नैदानिक ​​परीक्षण में - चर को गुणात्मक बातचीत कहा जाता हैउपचार के साथ, यदि अन्य चीजों को छोड़ दिया जाए, तो उस परिवर्तनशील परिवर्तन से परिवर्तन हो सकता है जिसमें उपचार सबसे प्रभावी है। ये चर हमेशा प्रभाव के मजबूत भविष्यवक्ता नहीं होते हैं, लेकिन एक चिकित्सक के लिए महत्वपूर्ण हो सकते हैं जब वे व्यक्तिगत रोगियों के लिए उपचार का निर्णय लेते हैं। उसकी पीएचडी थीसिस में लेसी गंटर ने इन गुणात्मक रूप से अंतःक्रियात्मक चरों को चुनने के लिए एक विधि विकसित की, जो कि एल्गोरिदम द्वारा भविष्यवाणी के आधार चयन को याद किया जा सकता है। हाल ही में मैंने उनके साथ लॉजिस्टिक रिग्रेशन और कॉक्स आनुपातिक खतरे रिग्रेशन मॉडल सहित अन्य मॉडलों के लिए इन तरीकों को विस्तार देने पर काम किया है।

मेरे दो सवाल हैं:

  1. आप इन नए तरीकों के मूल्य के बारे में क्या सोचते हैं?
  2. पारंपरिक तरीकों के मामले में आप किस दृष्टिकोण को पसंद करते हैं? AIC, BIC, Mallows Cp, F के रूप में मानदंड, स्टेप वाइज, आगे और पीछे के चर में प्रवेश करने या छोड़ने के लिए परीक्षण ...

इस पर पहला पेपर गुंटर, एल, झू, जे और मर्फी, एसए (2009) में सामने आया। गुणात्मक बातचीत के लिए परिवर्तनीय चयनसांख्यिकीय पद्धति doi: 10, 1016 / j.stamet.2009.05.003।

अगला पेपर गुंटर, एल।, ज़ू, जे और मर्फी, एसए (2011) में दिखाई दिया। परिवार की त्रुटि दर को नियंत्रित करते हुए वैयक्तिकृत चिकित्सा में गुणात्मक अंतःक्रियाओं का परिवर्तनशील चयनजर्नल ऑफ बायोफार्मास्युटिकल स्टैटिस्टिक्स 21, 1063-1078।

अगले एक चर चयन गंटर, एल।, चेरिक, एमआर और सन, जे (2011) पर एक विशेष मुद्दे में दिखाई दिया। उपचार चयन के संबंध में प्रतिगमन में चर चयन के लिए एक सरल विधिपाकिस्तान जर्नल ऑफ़ स्टैटिस्टिक्स एंड ऑपरेशंस रिसर्च 7: 363-380।

आप पत्र पत्रिका वेबसाइटों पर पा सकते हैं। आपको लेख खरीदना पड़ सकता है। मेरे पास इन लेखों के लिए पीडीएफ फाइलें हो सकती हैं। लेसी और मैंने अभी इस विषय पर एक मोनोग्राफ पूरा किया है जिसे इस साल के अंत में स्प्रिंगरब्री के रूप में प्रकाशित किया जाएगा।


11
शायद मैं अनुसरण नहीं कर रहा हूं - यदि प्रभाव संशोधन पर संदेह करने का एक प्राथमिक कारण है, तो ये नए तरीके कैसे भिन्न होते हैं, उदाहरण के लिए, मॉडल चयन के लिए "उम्मीदवार" चर की सूची में बातचीत की शर्तें भी शामिल हैं?
मैक्रों

6
(१) एक या अधिक रेखाएँ इस प्रश्न में खो गई लगती हैं। मुझे लगता है कि यह "स्टेपवाइज, फॉरवर्ड और बैकवर्ड ..." हो सकता है। (2) मॉडल पहचान और परिवर्तनशील चयन की यहाँ व्यापक चर्चा की गई है। जैसे, + मॉडल + चर + चयन पर खोज करना इस बिंदु पर १४५ सूत्र प्रस्तुत करता है। उस खोज को कम करने से संभवतः दूसरे प्रश्न का उत्तर मिल जाएगा। (३) पहले प्रश्न के उत्तर की सुविधा के लिए, क्या आप इस शोध का लिंक या स्पष्ट संदर्भ दे सकते हैं?
whuber

2
यह एक चर को शामिल करने का मामला है जो उपचार के साथ बातचीत करता है। लेकिन यह एक साधारण बातचीत ही नहीं बल्कि एक गुणात्मक बातचीत भी है। बातचीत करने के लिए दो पंक्तियों को समानांतर नहीं होना चाहिए। गुणात्मक रूप से बातचीत करने के लिए उन्हें अंतराल में पार करना होगा जिसमें चर परिभाषित किया गया है। तो यह विचार एक ऐसे चर को खोजने का है जो गुणात्मक रूप से परस्पर क्रिया करता है। यह चरों और अंतःक्रियात्मक शब्दों को चुनने से अलग है जो फिट या भविष्यवाणी में सुधार करते हैं।
माइकल आर। चेरिक

3
जवाब देने का अवसर लेने के लिए धन्यवाद, माइकल। शायद लाने के लिए एक महत्वपूर्ण बिंदु यह है कि यह साइट एक चर्चा स्थल नहीं है, बल्कि एक प्रश्नोत्तर साइट है। इसके साथ ही संचार के कुछ अलग तरीके सामने आते हैं। एफएक्यू इसे कुछ विस्तार से कवर करता है। कभी-कभी थ्रेडिंग थोड़ी खो सकती है, लेकिन यह वास्तव में आश्चर्यजनक रूप से दुर्लभ है, मुझे लगता है कि एक बार चीजों की सामान्य योजना के साथ थोड़ा अधिक अनुभव प्राप्त होता है। चीयर्स।
कार्डिनल

6
माइकल, हाँ, एसई प्रणाली कुछ करने के लिए इस्तेमाल किया जा रहा है और सही नहीं है। लेकिन यह समझ में आता है और यह सुसंगत है। एक चीज जिसका हम लक्ष्य बना रहे हैं, वह है सुधार : सूची सर्वर और बुलेटिन बोर्ड के विपरीत, प्रश्न (और उत्तर) संशोधित किए जा सकते हैं; यह अपेक्षित है। अंत में, हम एक धागा, एक अच्छी तरह से, पूर्ण प्रश्न के साथ शुरू करना चाहते हैं जो टिप्पणी धागा के संदर्भ के बिना अपने दम पर खड़ा है; फिर इसे एक या अधिक लिखित, अच्छी तरह से जिम्मेदार विहित जवाबों के साथ जारी रखना चाहिए। इस आदर्श को ध्यान में रखते हुए, @ कार्डिनल के सुझाव आपके लिए अधिक महत्वपूर्ण हो सकते हैं।
whuber

जवाबों:


2
  1. गेलमैन और हिल, प्रतिगमन और बहुस्तरीय / पदानुक्रमित मॉडल पृष्ठ 69 का उपयोग कर डेटा विश्लेषण देखें, उनके पास मॉडल चयन पर एक अनुभाग है। वह एक प्रश्न आधारित दृष्टिकोण का उपयोग कर रही है जो पूरी तरह से ठीक है लेकिन अपने पेपर में उसे यह बताने की आवश्यकता है कि उसने मॉडल में क्या किया है, उसे क्यों शामिल किया। जैसे आपने कहा कि "ये चर हमेशा प्रभाव के मजबूत भविष्यवक्ता नहीं होते हैं, लेकिन एक चिकित्सक के लिए महत्वपूर्ण हो सकते हैं जब व्यक्तिगत रोगियों के लिए उपचार का निर्णय लेते हैं।" इसलिए जब तक वह यह अनुमान लगाती है कि इन भविष्यवक्ताओं को क्यों शामिल किया जाना चाहिए तो यह ठीक है। मेरे लिए व्यक्तिगत रूप से मैं इन तरीकों को पसंद करता हूं। तो यहाँ 2 के लिए मेरा जवाब आता है।
  2. स्टेप वाइज, आगे, और पीछे से मुझे लगता है कि ब्लैक बॉक्स हैं। जब आप तीनों के माध्यम से एक मॉडल चलाते हैं तो आप समान भविष्यवक्ताओं के पास नहीं पहुंचेंगे। इसलिए जिनके संदर्भ में मुझे उपयोग करने के लिए एक स्पष्ट जवाब नहीं होगा। मॉडल की तुलना करने के लिए AIC या BIC का उपयोग करना ठीक है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.