हॉवेलर्स स्टेप वाइज रिग्रेशन का उपयोग करने के कारण होता है


20

मैं प्रतिगमन मॉडल में स्टेप वाइज / आगे / पिछड़े चयन की समस्याओं से अच्छी तरह परिचित हूं। शोधकर्ताओं के कई मामले हैं जो तरीकों का खंडन करते हैं और बेहतर विकल्पों की ओर इशारा करते हैं। मैं उत्सुक था कि क्या कोई कहानी है जो एक सांख्यिकीय विश्लेषण मौजूद है:

  • स्टेप वाइज रिग्रेशन का उपयोग किया है;
  • अंतिम मॉडल के आधार पर कुछ महत्वपूर्ण निष्कर्ष दिए
  • निष्कर्ष गलत था, जिसके परिणामस्वरूप व्यक्ति, उनके अनुसंधान या उनके संगठन के लिए नकारात्मक परिणाम सामने आए

इस पर मेरा विचार है कि यदि चरणबद्ध तरीके खराब हैं, तो उनका उपयोग करने के लिए "वास्तविक दुनिया" में परिणाम होना चाहिए।


2
यदि आपको ऐसी कोई कहानी नहीं मिलती है, तो ऐसा हो सकता है क्योंकि स्टेप वाइज रिग्रेशन का इस्तेमाल ज्यादातर बेसिक रिसर्च (या तो मुझे लगता है) में होता है। बुनियादी शोधकर्ता आम तौर पर गलत होने के लिए मुसीबत में नहीं पड़ते, इसलिए जब तक वे डेटा या कुछ और नकली नहीं करते।
कोडियालॉजिस्ट

3
यह उद्योग में और क्लास रूम में बहुत उपयोग किया जाता है। शोध में लेखक शायद इस बात का खुलासा नहीं करेंगे कि उन्होंने इसका इस्तेमाल किया है। उद्योग में मुख्य दो कारण हैं कि क) जो लोग इसे कर रहे हैं वे अनुसंधान में प्रशिक्षित नहीं थे, जैसे कि स्नातक की डिग्री या बी) दशकों पहले स्नातक की उपाधि प्राप्त की है।
अक्कल

@ अक्षल के साथ शुरू करना नहीं सीखना लेकिन भेड़ की त्वचा प्राप्त करना वैसे भी समस्या है, समय बीताना नहीं। एग्जम्प्लिस ग्रैटिस , मी। मैंने 1971 में एक आँकड़े पाठ्यक्रम लिया, और पहली बार 2006 में एक प्रकाशन वर्ग में आँकड़ों का इस्तेमाल किया।
कार्ल

जवाबों:


1

एक से अधिक प्रश्न पूछे जा रहे हैं। सबसे संकीर्ण एक उदाहरण के लिए पूछ रहा है जब स्टेपवाइज रिग्रेशन ने नुकसान पहुंचाया है क्योंकि यह सुगंधित स्टेप वाइज था। यह निश्चित रूप से सच है, लेकिन केवल तब असमान रूप से स्थापित किया जा सकता है, जब स्टेप वाइज रिग्रेशन के लिए उपयोग किए जाने वाले डेटा को भी प्रकाशित किया जाता है, और कोई इसे प्रकाशित करता है और एक प्रकाशित प्राथमिक लेखकों की वापसी के साथ एक सहकर्मी की समीक्षा में सुधार करता है। किसी भी अन्य संदर्भ में आरोप लगाने के लिए कानूनी कार्रवाई का जोखिम होता है, और, यदि हम एक अलग डेटा सेट का उपयोग करते हैं, तो हमें संदेह हो सकता है कि एक गलती की गई थी, लेकिन "आंकड़े कभी भी कुछ साबित नहीं कर रहे हैं" और हम यह स्थापित नहीं कर पाएंगे कि एक गलती थी बनाया गया; "किसी भी संदेह से परे"।

एक तथ्य के रूप में, किसी को रिग्रेस समीकरण के स्टेपवाइज एलिमिनेशन या स्टेपवाइज बिल्डअप के आधार पर अक्सर अलग-अलग परिणाम मिलते हैं, जो हमें सुझाव देते हैं कि इसके उपयोग की सिफारिश करने के लिए न तो दृष्टिकोण पर्याप्त रूप से सही है। स्पष्ट रूप से, कुछ और चल रहा है, और यह हमें एक व्यापक सवाल पर लाता है, जो ऊपर भी पूछा गया है, लेकिन बुलेट के रूप में, "चरणवार प्रतिगमन के साथ समस्याएं क्या हैं, किसी भी तरह? यह जवाब देने के लिए और अधिक उपयोगी सवाल है? अतिरिक्त लाभ यह है कि मेरे पास इसका जवाब देने के लिए मेरे खिलाफ कानून का मुकदमा दायर नहीं होगा।

चरणबद्ध एमएलआर के लिए इसे सही करना, 1 का मतलब है) शारीरिक रूप से सही इकाइयों (नीचे देखें), और 2 का उपयोग करना) सर्वोत्तम सहसंबंधों और त्रुटि वितरण प्रकार (समरूपता और भौतिकता के लिए) के लिए उपयुक्त चर परिवर्तन, और 3) चर संयोजनों के सभी क्रमपरिवर्तन का उपयोग करना, नहीं चरण-वार, उनमें से सभी , और 4) यदि कोई संपूर्ण रिग्रेशन डायग्नॉस्टिक्स करता है, तो कोई उच्च वीआईएफ (कोलीनियरिटी) चर संयोजनों को याद करने से बचता है जो अन्यथा भ्रामक होगा, तो इनाम बेहतर प्रतिगमन है।

जैसा कि ऊपर # 1 के लिए वादा किया गया था, हम अगली बार एक भौतिक प्रणाली के लिए सही इकाइयों का पता लगाते हैं। चूंकि प्रतिगमन से अच्छे परिणाम चर के सही उपचार पर आकस्मिक हैं, इसलिए हमें भौतिक इकाइयों के सामान्य आयामों से सावधान रहना होगा और अपने समीकरणों को उचित रूप से संतुलित करना होगा। इसके अलावा, जैविक अनुप्रयोगों के लिए, एक जागरूकता और लेखा-जोखा की गतिशीलता के लिए लेखांकन की आवश्यकता है।

जीव विज्ञान के लिए इकाइयों के संतुलन को कैसे बढ़ाया जाए, इसके लिए एक जीवविज्ञान प्रणाली की शारीरिक जांच के इस उदाहरण को पढ़ें । उस पेपर में, चरण 4) के माध्यम से 4) ऊपर का पालन किया गया था और एक सर्वोत्तम सूत्र पाया गया था जिसका व्यापक प्रतिगमन विश्लेषण का उपयोग किया गया था, जिसका नाम है , जहां ग्लोमेरुलर निस्पंदन दर है। , कैटोलिज़्म का एक मार्कर, जहां इकाइयों को फ्रैक्टल ज्यामिति का उपयोग करके समझा जाता है जैसे कि , वजन एक चार आयामी भग्न ज्यामितीय निर्माण था , और वी, वॉल्यूम, को यूक्लिडियन, या तीन आयामी चर कहा जाता था। फिरजीएफआर=*डब्ल्यू1/4वी2/3जीएफआरडब्ल्यू1=1443+23। इतना है कि फार्मूला चयापचय के अनुरूप है। यह एक आसान बयान नहीं है। इस बात पर विचार करें कि 1) यह आमतौर पर अनजान (अज्ञात) है कि चयापचय का एक मार्कर है। 2) भग्न ज्यामिति केवल बार-बार सिखाई जाती है और प्रस्तुत सूत्र की भौतिक व्याख्या किसी ऐसे व्यक्ति के लिए भी समझ पाना मुश्किल है, जिसके पास गणितीय प्रशिक्षण है।जीएफआर


2
यह विशेष रूप से स्टेपवाइज रिग्रेशन के बजाय सामान्य रूप से प्रतिगमन की समस्या का वर्णन करता है।
एक्सीडेंटल स्टेटिस्टिशियन

2
हां, ये सामान्य रूप से विचार करने के लिए प्रतिगमन के पहलू हैं। अगर मैं सही ढंग से समझता हूं कि प्रश्न कहां से आ रहा है, हालांकि, यह स्टेपवाइज रिग्रेशन से प्रेरित है, जिसे अक्सर LASSO की पसंद का उपयोग करने के पक्ष में निरूपित किया जाता है, जो आपके द्वारा यहां दी गई चिंताओं को संबोधित नहीं करेगा।
एक्सीडेंटल स्टेटिस्टिशियन

4
मैं इस मामले में आपकी स्पष्टता और आपकी भलाई की सराहना करता हूं, कार्ल। मैं इस बात से इनकार नहीं करूंगा कि मतदान की अपनी समस्याएं हैं। एक पोस्ट पर मतदान को बदलने का एकमात्र प्रभावी तरीका मुझे उत्तर बदलना है - या तो इसे तकनीकी रूप से सुधारना, इस पर विस्तार करना, या विचारों को अलग तरीके से संवाद करना - और तब भी कोई गारंटी नहीं है, इसे वांछित प्रतिक्रिया मिलेगी (या यहां तक ​​कि किसी भी प्रतिक्रिया!)। कभी-कभी, नीच लोगों को समझने के लिए किए गए सम्मानजनक प्रयासों से ऐसी जानकारी मिल जाएगी जो किसी पोस्ट को बेहतर बनाने में ऐसे प्रयासों की सराहना करने (और उत्थान) में मदद करती है।
whuber

3
@Carl मुझे लगता है कि अगर आप नियमित रूप से डाउनवोट हो रहे हैं तो पहली बात यह है कि आप यह सोचें कि आप अपने पदों में सुधार कैसे कर सकते हैं (और अक्सर आप उन टिप्पणियों के तहत हैं जो सुधार का सुझाव देते हैं)। खुद के लिए बोलते हुए, यहां तक ​​कि जहां मैं एक टिप्पणीकार से असहमत हूं, यह पता चला है कि वे अक्सर ऐसे मुद्दों को उठाते हैं जो किसी भी तरह बेहतर जवाब देते हैं। मैं कहूंगा कि मैं नियमित रूप से आपके उत्तरों के साथ मुद्दों को नोटिस करता हूं जो मुझे लगभग खुद को नीचा दिखाने के लिए ले जाएंगे। जहां मेरे पास ऐसा करने का समय है, मैं एक टिप्पणी छोड़ने की कोशिश करता हूं।
Glen_b -Reinstate मोनिका

3
ध्यान दें कि स्टेप वाइज रिग्रेशन की कई समस्याएं - जैसे 0 से दूर पक्षपाती अनुमानों के साथ समस्याएँ, 0 के प्रति पक्षपाती मानक त्रुटियाँ, नाममात्र प्रकार I त्रुटि दर वास्तविक की तुलना में बहुत कम और अन्य समस्याओं का एक प्रकार अभी भी सभी-सबसेट के साथ मौजूद हैं - - वास्तव में, यह लगभग किसी भी प्रकार के अनुकूलन के साथ एक मुद्दा है (फ्रैंक हरेल के प्रतिगमन मॉडलिंग रणनीतियों का अध्याय 4 एक उपयोगी संदर्भ है)। श्रिंकेज / नियमितिकरण इनमें से कुछ मुद्दों को कम कर सकता है (विशेषकर चयन की प्रवृत्ति जावक के लिए पूर्वाग्रह का अनुमान लगाती है) और आउट-ऑफ-सैंपल मूल्यांकन उनमें से कई के लिए एक महत्वपूर्ण उपकरण है।
Glen_b -रिटनेट मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.