आप सही हे। कई तुलनाओं की समस्या हर जगह मौजूद है, लेकिन, आमतौर पर इसे पढ़ाए जाने के तरीके के कारण, लोग केवल यह सोचते हैं कि यह एक-दूसरे के खिलाफ कई समूहों की तुलना सेट के पूरे समूह के माध्यम से करता है । हकीकत में, कई उदाहरण हैं जहां कई तुलनाओं की समस्या मौजूद है, लेकिन जहां यह बहुत सारे जोड़ीदार तुलनाओं की तरह नहीं दिखता है; उदाहरण के लिए, यदि आपके पास बहुत सारे निरंतर चर हैं और आपको आश्चर्य है कि यदि कोई सहसंबंधित है, तो आपको कई तुलनात्मक समस्या होगी (यहां देखें: देखो और आपको सहसंबंध मिलेगा )। टी
एक और उदाहरण आप उठाते हैं। यदि आप 20 चर के साथ एक से अधिक प्रतिगमन चलाने के लिए थे, और आपने अपनी सीमा के रूप में उपयोग किया था , तो आप अपने सभी चरों में से एक को अकेले संयोग से 'महत्वपूर्ण' होने की उम्मीद करेंगे, भले ही सभी शून्य सही थे। एकाधिक तुलना की समस्या बस बहुत सारे विश्लेषण चलाने के गणित से आती है। यदि सभी अशक्त परिकल्पनाएं सच थीं और चर पूरी तरह से असंबंधित थे, तो किसी भी सच्चे शून्य को गलत तरीके से खारिज नहीं करने की संभावना (जैसे, , यह )। α = .051 - ( 1 - α ) p p = 5 .231 - ( 1 - α )पीपी = 5.23
इसके विरुद्ध शमन करने की पहली रणनीति अपने मॉडल का एक साथ परीक्षण करना है। यदि आप एक ओएलएस प्रतिगमन फिटिंग कर रहे हैं, तो अधिकांश सॉफ्टवेयर आपको अपने आउटपुट के एक डिफ़ॉल्ट हिस्से के रूप में एक वैश्विक -टेस्ट देंगे । यदि आप सामान्यीकृत रैखिक मॉडल चला रहे हैं, तो अधिकांश सॉफ्टवेयर आपको एक अनुरूप वैश्विक संभावना अनुपात परीक्षण देंगे। यह परीक्षण आपको कई तुलनाओं की समस्या के कारण टाइप I त्रुटि मुद्रास्फीति के खिलाफ कुछ सुरक्षा प्रदान करेगा (cf., मेरा जवाब यहां: रैखिक प्रतिगमन में गुणांक का महत्व: महत्वपूर्ण टी-परीक्षण बनाम गैर-महत्वपूर्ण एफ-स्टेटिस्टिक )। एक समान मामला तब होता है जब आपके पास एक श्रेणीगत चर होता है जिसे कई डमी कोड के साथ दर्शाया जाता है; आप उन व्याख्या नहीं करना चाहेंगेएफटीटी-टेस्ट, लेकिन सभी डमी कोड को छोड़ देगा और इसके बजाय नेस्टेड मॉडल टेस्ट करेगा।
एक अन्य संभावित रणनीति है बोनफ़्रोनी सुधार की तरह एक अल्फा समायोजन प्रक्रिया का उपयोग करना। आपको महसूस करना चाहिए कि ऐसा करने से आपकी शक्ति कम हो जाएगी और साथ ही आपके परिवार के प्रकार I त्रुटि दर को कम किया जा सकेगा। चाहे यह ट्रेडऑफ सार्थक हो, आपके लिए एक निर्णय कॉल है। (एफडब्ल्यूआईडब्ल्यू, मैं आमतौर पर कई रिग्रेशन में अल्फा सुधार का उपयोग नहीं करता हूं।)
मॉडल चयन करने के लिए -values का उपयोग करने के मुद्दे के बारे में , मुझे लगता है कि यह वास्तव में एक बुरा विचार है। मैं 5 से एक मॉडल के साथ केवल 2 के साथ एक मॉडल से नहीं हटूंगा क्योंकि अन्य 'गैर-महत्वपूर्ण' थे। जब लोग ऐसा करते हैं, तो वे अपने मॉडल को पूर्वाग्रह करते हैं। इससे आपको मेरे उत्तर को पढ़ने में मदद मिल सकती है: इसे बेहतर समझने के लिए स्वचालित मॉडल चयन के लिए एल्गोरिदम । पी
आपके अपडेट के बारे में, मैं आपको सुझाव नहीं दूंगा कि आप पहले एक से अधिक सहसंबंधों का आकलन करें ताकि यह तय किया जा सके कि अंतिम एकाधिक प्रतिगमन मॉडल में कौन से चर का उपयोग करना है। ऐसा करने से एंडोजेनिटी के साथ समस्याएं पैदा होंगी जब तक कि चर एक दूसरे के साथ पूरी तरह से असंबंधित नहीं होते हैं। मैंने इस मुद्दे पर अपने उत्तर में यहां चर्चा की: बजाय अनुमानख1एक्स1+ बी2एक्स2ख1एक्स1+ बी2एक्स2+ बी3एक्स3 ।
विभिन्न आश्रित चर के साथ विश्लेषण को कैसे संभालना है, इस सवाल के संबंध में, क्या आप किसी प्रकार के समायोजन का उपयोग करना चाहते हैं, इस पर आधारित है कि आप एक दूसरे के सापेक्ष विश्लेषण कैसे देखते हैं। पारंपरिक विचार यह निर्धारित करना है कि क्या उन्हें सार्थक रूप से एक 'परिवार' माना जाता है। इस पर यहां चर्चा की गई है: "परिकल्पना के परिवार" के लिए एक स्पष्ट, व्यावहारिक परिभाषा क्या हो सकती है? आप इस सूत्र को भी पढ़ना चाहेंगे: कई आश्रित चर की भविष्यवाणी करने के तरीके ।