क्या हमें वास्तव में "सभी प्रासंगिक भविष्यवक्ताओं को शामिल करने की आवश्यकता है?"


15

अनुमान के लिए प्रतिगमन मॉडल का उपयोग करने की एक बुनियादी धारणा यह है कि "सभी प्रासंगिक भविष्यवक्ताओं" को भविष्यवाणी समीकरण में शामिल किया गया है। औचित्य यह है कि एक महत्वपूर्ण वास्तविक दुनिया कारक को शामिल करने में विफलता पक्षपाती गुणांक की ओर ले जाती है और इस प्रकार गलत अनुमान (यानी, छोड़े गए चर पूर्वाग्रह)।

लेकिन अनुसंधान अभ्यास में, मैंने कभी किसी को "सभी संबंधित भविष्यवाणियों" जैसा कुछ भी नहीं देखा । कई घटनाओं में महत्वपूर्ण कारणों का असंख्य है, और उन सभी को शामिल करना असंभव नहीं तो बहुत मुश्किल होगा। एक ऑफ-द-कफ उदाहरण अवसाद का एक परिणाम के रूप में मॉडलिंग कर रहा है: किसी ने भी किसी मॉडल के करीब कुछ भी नहीं बनाया है जिसमें "सभी प्रासंगिक चर" शामिल हैं: उदाहरण के लिए, माता-पिता का इतिहास, व्यक्तित्व लक्षण, सामाजिक समर्थन, आय, उनकी बातचीत आदि। आदि...

इसके अलावा, इस तरह के एक जटिल मॉडल को फिट करने पर अत्यधिक अस्थिर अनुमानों का सामना करना पड़ेगा जब तक कि बहुत बड़े नमूना आकार नहीं थे।

मेरा सवाल बहुत सरल है: क्या "सभी प्रासंगिक भविष्यवाणियों को शामिल करने की धारणा / सलाह" बस कुछ ऐसा है जिसे हम "कहते हैं" लेकिन वास्तव में कभी मतलब नहीं है? यदि नहीं, तो हम इसे वास्तविक मॉडलिंग सलाह के रूप में क्यों देते हैं?

और क्या इसका मतलब यह है कि ज्यादातर गुणांक संभवतः भ्रामक हैं? (उदाहरण के लिए, व्यक्तित्व कारकों और अवसाद पर एक अध्ययन जो केवल कई भविष्यवाणियों का उपयोग करता है)। दूसरे शब्दों में, हमारे विज्ञान के निष्कर्ष के लिए यह कितनी बड़ी समस्या है?


6
इस तर्क का एक संस्करण 19 वीं शताब्दी में मनोविज्ञान, अर्थशास्त्र और सामाजिक विज्ञानों में व्याप्त था। वैज्ञानिकों ने तर्क दिया कि सांख्यिकीय तरीके लोगों और सामाजिक प्रणालियों के लिए अनुपयुक्त थे क्योंकि लोग बहुत विविध और जटिल हैं। उस सदी के अंत तक, उपयोगिता ने दर्शन पर जीत हासिल की: जब हम सभी भविष्यवक्ताओं को शामिल नहीं करते हैं, तब भी हम बहुत कुछ सीख सकते हैं। शीर्षक वाक्यांश में "प्रासंगिक" के समावेश में ज्ञान है।
whuber

जवाबों:


18

आप सही हैं - हम "सभी प्रासंगिक भविष्यवक्ता" कहने में शायद ही कभी यथार्थवादी हैं। व्यवहार में हम उन भविष्यवाणियों को संतुष्ट कर सकते हैं जो में भिन्नता के प्रमुख स्रोतों की व्याख्या करते हैं । एक पर्यवेक्षणीय अध्ययन में जोखिम कारक या उपचार के बारे में ड्राइंग के विशेष मामले में, यह काफी हद तक अच्छा है। उसके लिए, की जरूरत है सत्यानाशी के लिए समायोजन अत्यधिक आक्रामक होने के लिए, चर सहित सकता है परिणाम से संबंधित हो और हो सकता है उपचार पसंद करने के लिए या जोखिम कारक आप प्रचारित करने के लिए कोशिश कर रहे हैं से संबंधित हो।Y

यह दिलचस्पी है कि सामान्य रैखिक मॉडल के साथ, कोविएट को छोड़ दिया जाता है, खासकर अगर शामिल कोवेरेट्स को ऑर्थोगोनल, बस त्रुटि अवधि को बढ़ाने के रूप में सोचा जा सकता है। नॉनलाइनियर मॉडल (लॉजिस्टिक, कॉक्स, कई अन्य) में वेरिएबल्स का चूक मॉडल में शामिल सभी वेरिएबल्स के प्रभावों को पूर्वाग्रह कर सकता है (उदाहरण के लिए, ऑड्स अनुपात के गैर-ढहने के कारण)।


सहायक जानकारी के लिए आपका धन्यवाद। उपचार के प्रभावों का आकलन करना, मैं इस मुद्दे के व्यावहारिक प्रभावों के बारे में अधिक पूछना चाहता हूं। यदि आपने एक पेपर की समीक्षा की और स्पष्ट रूप से महत्वपूर्ण भविष्यवक्ता छोड़ दिए गए, तो क्या यह अस्वीकृति का आधार हो सकता है? मैं ऐसा इसलिए पूछता हूं क्योंकि (ए) मैंने इस घटना को कभी नहीं सुना है और बी।) सामाजिक वैज्ञानिकों में अक्सर केवल भविष्यवाणियां शामिल होती हैं, जिनके बारे में वे और अधिक जानना चाहते हैं (यानी, अध्ययन का विषय) और उपेक्षा "पहले से ही ज्ञात" कारक ( अधिक कुशल माप की आवश्यकता के आधार पर)।
एटीजे

उदाहरण के लिए, एक अंतर्जात चर के लिए केवल एक पूर्ववर्ती भविष्यवक्ता के साथ एक अव्यक्त चर मॉडल को देखना असामान्य नहीं है। क्या यह आंकड़ों के क्षेत्र और वास्तविक विषय क्षेत्रों में इसके कार्यान्वयन के बीच की खाई को बताता है?
एटीजे

6
यह शायद करता है। अस्वीकृति के लिए पहले प्रश्न के आधार में महत्वपूर्ण चर का समावेश शामिल होगा जिनके समावेश में शामिल चर की एक अलग व्याख्या होगी, या जिसने मॉडल को काफी बदल दिया होगा। मैंने एक बार फेफड़े के कैंसर के जोखिम पर एक पेपर की समीक्षा की थी जो केवल उपलब्ध था कि क्या कभी कोई विषय धूम्रपान किया था या नहीं, और लेखकों ने धूम्रपान की खुराक का आकलन करने का प्रयास नहीं किया (उदाहरण के लिए, पैक-वर्ष)। मैंने एकमुश्त अस्वीकृति की सिफारिश की।
फ्रैंक हर्ल

9

हां, आपको सभी "प्रासंगिक चर" को शामिल करना चाहिए, लेकिन आपको इसके बारे में स्मार्ट होना चाहिए। आपको उन प्रयोगों के निर्माण के तरीकों के बारे में सोचना चाहिए जो आपकी घटना के प्रभाव को असंबंधित सामान से अलग कर देंगे, जो वास्तविक दुनिया में (क्लास रूम के विपरीत) शोध में बहुत कुछ है। इससे पहले कि आप आँकड़ों में उतरें, आपको अपने डोमेन में भारी उठाने की ज़रूरत है, न कि आँकड़ों में।

मैं आपको प्रोत्साहित करता हूं कि आप सभी प्रासंगिक चर सहित निंदक न बनें, क्योंकि यह केवल एक महान लक्ष्य नहीं है, बल्कि इसलिए भी कि यह अक्सर संभव है। हम इसे केवल कहने के लिए नहीं कहते हैं। हम वास्तव में इसका मतलब है। वास्तव में, प्रयोगों और अध्ययनों को डिजाइन करना जो सभी प्रासंगिक चर शामिल करने में सक्षम हैं, जो विज्ञान को वास्तव में दिलचस्प बनाता है, और मैकेनिकल बॉयलर प्लेट "प्रयोगों" से अलग है।

अपने कथन को प्रेरित करने के लिए, मैं आपको एक उदाहरण दूंगा कि गैलीलियो ने त्वरण का अध्ययन कैसे किया। यहाँ एक वास्तविक प्रयोग का वर्णन है ( इस वेब पेज से ):

लकड़ी की ढलाई या खुरचन का एक टुकड़ा, लगभग 12 हाथ लंबा, आधा हाथ चौड़ा, और तीन अंगुल-मोटा, लिया जाता था; इसके किनारे को चौड़ाई में एक उंगली से थोड़ा अधिक चैनल काट दिया गया था; इस खांचे को बहुत सीधा, चिकना और पॉलिश किया गया है, और इसे चर्मपत्र के साथ पंक्तिबद्ध किया गया है, जितना संभव हो उतना चिकनी और पॉलिश किया गया है, हमने इसे एक कठिन, चिकनी और बहुत गोल कांस्य गेंद के साथ घुमाया। इस बोर्ड को ढलान वाली स्थिति में रखते हुए, एक छोर को एक या दो हाथ ऊपर उठाकर, हमने गेंद को लुढ़काया, जैसा कि मैं अभी कह रहा था, चैनल के साथ, नोटिंग, वर्तमान में वर्णित तरीके से, समय की आवश्यकता है वंश बनाने के लिए। हमने इस प्रयोग को एक सटीकता के साथ समय को मापने के लिए एक से अधिक बार दोहराया है ताकि दो अवलोकनों के बीच विचलन कभी भी एक नाड़ी-बीट के दसवें से अधिक न हो। इस ऑपरेशन को करने और अपनी विश्वसनीयता सुनिश्चित करने के बाद, हमने अब गेंद को केवल एक-चौथाई चैनल की लंबाई में लुढ़काया; और इसके वंश के समय को मापने के बाद, हमने इसे पूर्व का एक-आधा भाग पाया। आगे हमने अन्य दूरियों की कोशिश की, आधी के लिए पूरी लंबाई के लिए समय की तुलना की, या उसके साथ दो-तिहाई के लिए, या तीन-चौथाई के लिए, या वास्तव में किसी भी अंश के लिए; इस तरह के प्रयोगों में, पूरे सौ बार दोहराया गया, हमने हमेशा पाया कि ट्रेस किए गए स्थान एक-दूसरे के समय के वर्गों के रूप में थे, और यह विमान के सभी झुकावों के लिए सही था, अर्थात, चैनल के साथ, जिसके साथ हम लुढ़के थे। गेंद। हमने यह भी देखा कि विमान के विभिन्न झुकावों के लिए वंश का समय, एक दूसरे से ठीक उसी अनुपात में बोर होता है, जैसा कि हम बाद में देखेंगे।

समय की माप के लिए, हमने एक ऊंचे स्थान पर रखा पानी का एक बड़ा पोत नियोजित किया; इस जहाज के निचले हिस्से में पानी के एक पतले जेट देने वाले छोटे व्यास के एक पाइप को मिलाया गया था जिसे हमने प्रत्येक वंश के समय एक छोटे गिलास में एकत्र किया था, चाहे वह चैनल की पूरी लंबाई के लिए हो या उसकी लंबाई के हिस्से के लिए; इस प्रकार एकत्र किए गए पानी को एक बहुत सटीक संतुलन पर प्रत्येक वंश के बाद तौला गया; इन वज़न के अंतर और अनुपात ने हमें समय के अंतर और अनुपात दिए, और यह इतनी सटीकता के साथ था कि यद्यपि ऑपरेशन कई बार दोहराया गया था, कई बार, परिणामों में कोई सराहनीय विसंगति नहीं थी।

d=gt2,
dgtd0=1t0diti0/मैं तथा टी02/टीमैं2। अगर उसका मॉडल सही था तो आपके पास होगा
0मैं=टी02टीमैं2

ध्यान दें कि उसने समय कैसे मापा। यह इतना कच्चा है कि यह याद दिलाता है कि इन दिनों अप्राकृतिक विज्ञान अपने चर कैसे मापता है, "ग्राहक संतुष्टि" या "उपयोगिता" के बारे में सोचें। उन्होंने उल्लेख किया है कि माप त्रुटि समय की एक इकाई के दसवें के भीतर थी, btw।

क्या उसने सभी प्रासंगिक चर शामिल किए? हाँ उसने किया। अब, आपको यह समझना होगा कि सभी शरीर गुरुत्वाकर्षण द्वारा एक दूसरे के प्रति आकर्षित होते हैं। तो, सिद्धांत में गेंद पर सटीक बल की गणना करने के लिए आपको ब्रह्मांड के प्रत्येक शरीर को समीकरण में जोड़ना होगा। इसके अलावा, अधिक महत्वपूर्ण बात यह है कि उन्होंने सतह प्रतिरोध, एयर ड्रैग, कोणीय गति आदि को शामिल नहीं किया? हाँ। हालाँकि, वे इस बात के लिए प्रासंगिक नहीं थे कि वह क्या पढ़ रहा था क्योंकि वह अपने द्वारा पढ़ी गई संपत्ति के प्रभाव को अलग करके उनके प्रभाव को कम या समाप्त करने में सक्षम था।

अब, क्या आप कहेंगे कि उसका गुणांक (ठीक 2 के लिए) टी2) भ्रामक था क्योंकि वह "प्रयोगों के बीच हवा के दबाव और तापमान में परिवर्तन के लिए नियंत्रण नहीं करता था"? सभी समस्याओं और सीमाओं के बावजूद, वह गति के प्रमुख कानून को सही ढंग से स्थापित करने में सक्षम था, जो अभी भी पागल परिशुद्धता पर है! वह सांख्यिकीय पैकेज और कंप्यूटर के बिना इसे पूरा करने में सक्षम था क्योंकि उसने इस तरह से एक महान प्रयोग डिजाइन किया था कि सांख्यिकीय भाग को तुच्छ और लगभग अप्रासंगिक बना दिया गया था। यही विचार स्थिति आप होना चाहते हैं।


समय के अपने तरीके के बारे में इतना कच्चा क्या है? सेटअप की एक विशिष्ट दर होगी जिस पर पानी बड़े बर्तन को छोड़ देगा और कप में प्रवेश करेगा; बर्तन को संभालने पर बड़ी मात्रा में पानी होता है, वह दर न्यूनतम रूप से बदल जाएगी। इससे भी महत्वपूर्ण बात यह है कि यह प्रयोगों में लगातार बना रहेगा। यह वास्तव में एक बहुत ही सुंदर तरीका है क्योंकि उनके पास स्टॉपवॉच और फैंसी स्वचालित टाइमर नहीं थे।
JAB

@JAB, यह निश्चित रूप से समय को मापने के लिए घड़ी या आधुनिक तरीकों को रोकने की तुलना में केवल कच्चा है। आप बिलकुल सही कह रहे हैं कि गैलीलियो के दिनों में समय मापने की कला को देखते हुए यह बहुत ही सुंदर है। हालाँकि, मैं जो बिंदु बना रहा था, वह यह भी था कि इतनी कम सटीकता (एक अंतराल का १/१०) अभी भी समय और दूरी के बीच के संबंध को देखने के लिए पर्याप्त है
अक्सकल

@JAB, भौतिकी में हास्यास्पद माप विधियों के मेरे पसंदीदा उदाहरणों में से एक है कि कैसे चेरनकोव ने अपने विकिरण की खोज की । वह एक अंधेरे कमरे में बैठ जाता है जब तक कि उसकी आंखों को अंधेरे से समायोजित नहीं किया जाता है, तब तक वह उस रोशनी से छेद को खोलना या बंद करना होगा जब तक कि प्रकाश गायब न हो जाए। वह रिकॉर्ड कर रहा होगा कि विकिरण के स्तर का पता लगाने के लिए कितना छेद खुला था। जाहिर है, मानव आंख मुट्ठी भर फोटॉनों में मापा प्रकाश में अंतर का पता लगा सकती है! पेपर 3 पेज लंबा है।
अक्कल

6

प्रतिगमन मॉडल को पूरी तरह से धारण करने की धारणाओं के लिए, सभी प्रासंगिक भविष्यवाणियों को शामिल किया जाना चाहिए। लेकिन किसी भी सांख्यिकीय विश्लेषण में कोई भी धारणा पूरी तरह से धारण नहीं करती है और सांख्यिकीय अभ्यास का अधिकांश भाग "क्लोज एनफ" पर आधारित है।

प्रयोगों के डिजाइन और उचित यादृच्छिकरण के साथ, मॉडल में शामिल नहीं किए गए शब्दों के प्रभाव को अक्सर अनदेखा किया जा सकता है (यादृच्छिकरण की संभावना के बराबर माना जाता है)। लेकिन, रिग्रेशन का उपयोग आमतौर पर तब किया जाता है जब मॉडल में शामिल नहीं किए जाने वाले सभी संभावित चरों के लिए पूर्ण रैंडमाइजेशन संभव नहीं होता है, इसलिए आपका प्रश्न महत्वपूर्ण हो जाता है।

बहुत अधिक हर प्रतिगमन मॉडल जो कभी फिट होता है, शायद कुछ संभावित भविष्यवाणियों को याद कर रहा है, लेकिन "मैं नहीं जानता" बिना किसी और स्पष्टीकरण के काम करने वाले सांख्यिकीविदों को काम करने की अनुमति नहीं होगी, इसलिए हम अपनी पूरी कोशिश करते हैं और फिर काम करने की कोशिश करते हैं कि कितना अंतर है मान्यताओं और वास्तविकता के बीच हमारे परिणामों को प्रभावित करेगा। कुछ मामलों में मान्यताओं से अंतर बहुत कम होता है और हम अंतर के बारे में ज्यादा चिंता नहीं करते हैं, लेकिन अन्य मामलों में यह बहुत गंभीर हो सकता है।

एक विकल्प जब आप जानते हैं कि ऐसे भविष्यवक्ता हो सकते हैं जो उस मॉडल में शामिल नहीं थे जो प्रासंगिक होगा एक संवेदनशीलता विश्लेषण करना है। यह मापता है कि अनमास्कुलर चर (ओं) के साथ संभावित संबंधों के आधार पर पूर्वाग्रह कितना संभव होगा। यह कागज़:

लिन, डीवाई और Psaty, बीएम और क्रोनमल, आरए। (1998): ऑब्जर्वेशन स्टडीज में अनसोल्ड कन्फ्यूडर्स को रिग्रेशन रिजल्ट की संवेदनशीलता का आकलन करना। बायोमेट्रिक्स, 54 (3), सिपाही, पीपी। 948-963।

एक संवेदनशीलता विश्लेषण के कुछ उपकरण (और उदाहरण) देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.