मेरे पास बड़े सर्वेक्षण डेटा, एक बाइनरी परिणाम चर और बाइनरी और निरंतर सहित कई व्याख्यात्मक चर हैं। मैं मॉडल सेट (GLM और मिश्रित GLM दोनों के साथ प्रयोग कर रहा हूं) और शीर्ष मॉडल का चयन करने के लिए सूचना सिद्धांत का उपयोग कर रहा हूं। मैंने सहसंबंधों के लिए स्पष्टीकरण (निरंतर और श्रेणीबद्ध दोनों) की सावधानीपूर्वक जांच की और मैं केवल उन्हीं मॉडल का उपयोग कर रहा हूं जिनमें एक पियर्सन या फाइसर कोएफ़ 0.3 से कम है। मैं अपने सभी निरंतर चरों को शीर्ष मॉडल के लिए प्रतिस्पर्धा करने का उचित मौका देना चाहूंगा। मेरे अनुभव में, जिन लोगों को इसे तिरछा करने की आवश्यकता है, उन्हें बदलने से वे (निम्न एआईसी) में भाग लेने वाले मॉडल में सुधार होता है।
मेरा पहला सवाल है: क्या यह सुधार है क्योंकि परिवर्तन लॉजिट के साथ रैखिकता में सुधार करता है? या तिरछा सही करने से डेटा को अधिक सममित बनाकर किसी तरह व्याख्यात्मक चर के संतुलन में सुधार होता है? काश मैं इसके पीछे के गणितीय कारणों को समझ पाता लेकिन अब के लिए, अगर कोई इसे आसान शब्दों में समझा सकता है, तो यह बहुत अच्छा होगा। यदि आपके पास कोई संदर्भ है जो मैं उपयोग कर सकता हूं, तो मैं वास्तव में इसकी सराहना करूंगा।
कई इंटरनेट साइटों का कहना है कि क्योंकि सामान्यता बाइनरी लॉजिस्टिक रिग्रेशन में एक धारणा नहीं है, चर को रूपांतरित न करें। लेकिन मुझे लगता है कि अपने चरों को नहीं बदलने से मैं दूसरों की तुलना में कुछ नुकसान में रह जाता हूं और यह प्रभावित हो सकता है कि शीर्ष मॉडल क्या है और परिवर्तन को बदल देता है (ठीक है, यह आमतौर पर नहीं होता है, लेकिन कुछ डेटासेट में ऐसा होता है)। मेरे कुछ वैरिएबल बेहतर प्रदर्शन करते हैं जब लॉग तब्दील हो जाता है, कुछ जब चुकता (तिरछा की अलग दिशा) और कुछ अनियंत्रित होता है।
क्या कोई मुझे एक गाइडलाइन दे पाएगा कि लॉजिस्टिक रिग्रेशन के लिए व्याख्यात्मक चर को बदलते समय क्या सावधानी बरतनी चाहिए और यदि ऐसा नहीं करना है, तो क्यों नहीं?