कई प्रतिगमन और कई तुलना


10

कहो कि मैं पी व्याख्यात्मक चर के एक से अधिक प्रतिगमन फिट बैठता हूं। टी-टेस्ट मुझे जांचने की अनुमति देगा कि क्या उनमें से कोई भी एक महत्वपूर्ण है ( )। मैं जांचने के लिए आंशिक एफ-परीक्षण कर सकता हूं कि क्या उनमें से कुछ सबसेट महत्वपूर्ण है ( )।एच 0 : β मैं = β j = = Β कश्मीर = 0एच0:βमैं=0एच0:βमैं=βजे==β=0

हालांकि मैं अक्सर देखता हूं कि किसी को 5 टी-टेस्ट से 5 पी-मान मिलते हैं (यह मानते हुए कि उनके पास 5 कोवरिएट्स हैं) और केवल लोगों को एक पी-वैल्यू <0.05 के साथ रखता है। यह थोड़ा गलत लगता है क्योंकि वास्तव में एक बहु तुलनात्मक जांच संख्या होनी चाहिए? क्या वास्तव में कुछ कहना उचित है जैसे और महत्वपूर्ण हैं, लेकिन , और नहीं हैं?β 2 β 3 β 4 β 5β1β2β3β4β5

एक संबंधित नोट पर, मैं कहता हूं कि मैं 2 अलग-अलग मॉडल (अलग-अलग परिणाम) पर 2 रजिस्टर चलाता हूं। क्या दो परिणामों के बीच महत्वपूर्ण मापदंडों के लिए कई तुलनात्मक जांच की आवश्यकता है?

संपादित करें: समान प्रश्न से अंतर करने के लिए, क्या पी-मूल्यों के अलावा कोई अन्य व्याख्या है: "बी_आई (महत्वपूर्ण) है, जब अन्य सभी सहसंयोजकों के लिए समायोजन है"? ऐसा नहीं लगता कि यह व्याख्या मुझे हर B_i को देखने और 0.5 से कम छोड़ने की अनुमति देती है (जो कि अन्य पोस्ट के समान है)।

यह मुझे लगता है कि B_i और Y के बीच संबंध है या नहीं, इसका परीक्षण करने के लिए एक निश्चित आग तरीका यह होगा कि प्रत्येक सहसंयोजक के लिए सहसंबंध गुणांक पी-मूल्य प्राप्त किया जाए और फिर एक मल्टीपैक किया जाए (हालांकि यह निश्चित रूप से संकेत खो देगा)।

अंत में, मान लीजिए कि मैंने बी 1 / वाई 1, बी 2 / वाई 1 और बी 3 / वाई 1 (इस प्रकार तीन पी-वैल्यू) के बीच सहसंबंध की गणना की। अविश्वसनीय रूप से, मैंने T1 / Y2, T2 / Y2, T3 / Y2 के बीच सहसंबंध भी किया। मैं मान रहा हूं कि सही बोनफेरोनी समायोजन सभी 6 परीक्षणों के लिए 6 एक साथ होगा (पहले समूह के लिए 3 और दूसरे समूह के लिए 3 - और इस तरह 2 "अर्ध" -सुधार पी-मान प्राप्त करना)।


1
यह (इस प्रश्न) के एक डुप्लिकेट की तरह दिखता है ([ आँकड़े .stackexchange.com/questions/3200/…] यदि यह कृपया नहीं है तो क्यों नहीं कहते हैं।
पीटर Flom

नमस्ते, यह समान है, लेकिन बिल्कुल समान नहीं है। शायद एक बेहतर सवाल यह होगा कि जब किसी को पी-मानों की सूची मिलती है, तो निम्नलिखित के लिए एकमात्र व्याख्या संभव है: "अन्य सभी मापदंडों के लिए नियंत्रण, यह चर / महत्वपूर्ण है"। हालांकि आप उन सभी को कैसे देखेंगे।
user1357015

यदि आप अपने प्रश्न को संपादित करना चाहते हैं, तो यह ठीक है, लेकिन यह बेहतर है कि इसे प्रश्न में ही करें, ताकि लोग इसे पहले देखें। लेकिन मैं इस बात पर मुकदमा नहीं कर रहा हूं कि "आप उन सभी पर कैसे विचार करेंगे" का अर्थ है।
पीटर Flom

जवाबों:


10

आप सही हे। कई तुलनाओं की समस्या हर जगह मौजूद है, लेकिन, आमतौर पर इसे पढ़ाए जाने के तरीके के कारण, लोग केवल यह सोचते हैं कि यह एक-दूसरे के खिलाफ कई समूहों की तुलना सेट के पूरे समूह के माध्यम से करता है । हकीकत में, कई उदाहरण हैं जहां कई तुलनाओं की समस्या मौजूद है, लेकिन जहां यह बहुत सारे जोड़ीदार तुलनाओं की तरह नहीं दिखता है; उदाहरण के लिए, यदि आपके पास बहुत सारे निरंतर चर हैं और आपको आश्चर्य है कि यदि कोई सहसंबंधित है, तो आपको कई तुलनात्मक समस्या होगी (यहां देखें: देखो और आपको सहसंबंध मिलेगा )। t

एक और उदाहरण आप उठाते हैं। यदि आप 20 चर के साथ एक से अधिक प्रतिगमन चलाने के लिए थे, और आपने अपनी सीमा के रूप में उपयोग किया था , तो आप अपने सभी चरों में से एक को अकेले संयोग से 'महत्वपूर्ण' होने की उम्मीद करेंगे, भले ही सभी शून्य सही थे। एकाधिक तुलना की समस्या बस बहुत सारे विश्लेषण चलाने के गणित से आती है। यदि सभी अशक्त परिकल्पनाएं सच थीं और चर पूरी तरह से असंबंधित थे, तो किसी भी सच्चे शून्य को गलत तरीके से खारिज नहीं करने की संभावना (जैसे, , यह )। α=.051 - ( 1 - α ) p p = 5 .231(1α)pp=5.23

इसके विरुद्ध शमन करने की पहली रणनीति अपने मॉडल का एक साथ परीक्षण करना है। यदि आप एक ओएलएस प्रतिगमन फिटिंग कर रहे हैं, तो अधिकांश सॉफ्टवेयर आपको अपने आउटपुट के एक डिफ़ॉल्ट हिस्से के रूप में एक वैश्विक -टेस्ट देंगे । यदि आप सामान्यीकृत रैखिक मॉडल चला रहे हैं, तो अधिकांश सॉफ्टवेयर आपको एक अनुरूप वैश्विक संभावना अनुपात परीक्षण देंगे। यह परीक्षण आपको कई तुलनाओं की समस्या के कारण टाइप I त्रुटि मुद्रास्फीति के खिलाफ कुछ सुरक्षा प्रदान करेगा (cf., मेरा जवाब यहां: रैखिक प्रतिगमन में गुणांक का महत्व: महत्वपूर्ण टी-परीक्षण बनाम गैर-महत्वपूर्ण एफ-स्टेटिस्टिक )। एक समान मामला तब होता है जब आपके पास एक श्रेणीगत चर होता है जिसे कई डमी कोड के साथ दर्शाया जाता है; आप उन व्याख्या नहीं करना चाहेंगेFटीt-टेस्ट, लेकिन सभी डमी कोड को छोड़ देगा और इसके बजाय नेस्टेड मॉडल टेस्ट करेगा।

एक अन्य संभावित रणनीति है बोनफ़्रोनी सुधार की तरह एक अल्फा समायोजन प्रक्रिया का उपयोग करना। आपको महसूस करना चाहिए कि ऐसा करने से आपकी शक्ति कम हो जाएगी और साथ ही आपके परिवार के प्रकार I त्रुटि दर को कम किया जा सकेगा। चाहे यह ट्रेडऑफ सार्थक हो, आपके लिए एक निर्णय कॉल है। (एफडब्ल्यूआईडब्ल्यू, मैं आमतौर पर कई रिग्रेशन में अल्फा सुधार का उपयोग नहीं करता हूं।)

मॉडल चयन करने के लिए -values का उपयोग करने के मुद्दे के बारे में , मुझे लगता है कि यह वास्तव में एक बुरा विचार है। मैं 5 से एक मॉडल के साथ केवल 2 के साथ एक मॉडल से नहीं हटूंगा क्योंकि अन्य 'गैर-महत्वपूर्ण' थे। जब लोग ऐसा करते हैं, तो वे अपने मॉडल को पूर्वाग्रह करते हैं। इससे आपको मेरे उत्तर को पढ़ने में मदद मिल सकती है: इसे बेहतर समझने के लिए स्वचालित मॉडल चयन के लिए एल्गोरिदमp

आपके अपडेट के बारे में, मैं आपको सुझाव नहीं दूंगा कि आप पहले एक से अधिक सहसंबंधों का आकलन करें ताकि यह तय किया जा सके कि अंतिम एकाधिक प्रतिगमन मॉडल में कौन से चर का उपयोग करना है। ऐसा करने से एंडोजेनिटी के साथ समस्याएं पैदा होंगी जब तक कि चर एक दूसरे के साथ पूरी तरह से असंबंधित नहीं होते हैं। मैंने इस मुद्दे पर अपने उत्तर में यहां चर्चा की: बजाय अनुमानb1x1+b2x21एक्स1+2एक्स2+3एक्स3

विभिन्न आश्रित चर के साथ विश्लेषण को कैसे संभालना है, इस सवाल के संबंध में, क्या आप किसी प्रकार के समायोजन का उपयोग करना चाहते हैं, इस पर आधारित है कि आप एक दूसरे के सापेक्ष विश्लेषण कैसे देखते हैं। पारंपरिक विचार यह निर्धारित करना है कि क्या उन्हें सार्थक रूप से एक 'परिवार' माना जाता है। इस पर यहां चर्चा की गई है: "परिकल्पना के परिवार" के लिए एक स्पष्ट, व्यावहारिक परिभाषा क्या हो सकती है? आप इस सूत्र को भी पढ़ना चाहेंगे: कई आश्रित चर की भविष्यवाणी करने के तरीके


इसके लिए शुक्रिया। यह वही है जो मुझे चाहिए था। आपकी अश्लील टिप्पणी के बारे में। यह समझ में आता है, लेकिन ऐसा लगता है कि अगर मैं सहसंबंध पी-मानों पर रूढ़िवादी बोनफेर्रोनी सुधार करता हूं, भले ही एंडेजोनिटी हो, तो बोनफेरोनी सुधार को इसके लिए क्या करना चाहिए?
user1357015

बोनफर्रोनी सुधार एंडोजीनिटी से असंबंधित है। यदि आपके सहसंयोजक सभी सह-संबद्ध डब्ल्यू / एक-दूसरे पर हैं, तो एकतरफा XY सहसंबंध रिश्ते के पक्षपाती अनुमान होंगे। आपको उस मॉडल को फिट करना चाहिए जिसे आप फिट करना चाहते हैं और वहीं रुक जाना चाहिए। आम तौर पर, किसी भी आगे जाने की कोई वास्तविक आवश्यकता नहीं है। यदि आपको एक सच्चा भविष्य कहनेवाला मॉडल बनाने की आवश्यकता है, तो आपको क्रॉस सत्यापन या अन्य तकनीकों का उपयोग करना चाहिए जो इसके लिए उपयुक्त हैं।
गूँग - मोनिका

0

व्यावहारिक स्तर पर, मुझे लगता है कि अगर बेटों को एक श्रेणीगत चर (यानी डमी) के स्तर को दर्शाते हैं, तो इस पर भी विचार करने की जरूरत है। इन परिस्थितियों में यह जानना वाजिब है कि किसी दिए गए बीटा की तुलना (अर्थपूर्ण) रेफरेंट बीटा की तुलना में अलग है या नहीं। लेकिन जोड़ीदार तुलना करने से पहले, किसी को यह जानना होगा कि समग्र श्रेणी के स्तर महत्वपूर्ण हैं (संयुक्त F परीक्षण या संभावना अनुपात परीक्षण का उपयोग करके)। ऐसा करने से कम df उपयोग करने का फायदा होता है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.