मैं एक उन्नत रैखिक प्रतिगमन मामले के अध्ययन की तलाश कर रहा हूं, जो जीएलएम या ओएलएस का उपयोग करके मॉडल जटिल, कई गैर-रैखिक संबंधों के लिए आवश्यक कदमों को दर्शाता है। बुनियादी विद्यालय के उदाहरणों से परे जाने वाले संसाधनों को खोजना आश्चर्यजनक रूप से कठिन है: मैंने जो किताबें पढ़ी हैं उनमें से अधिकांश एक भविष्यवक्ता के बॉक्सकॉक्स के साथ युग्मित प्रतिक्रिया के एक लॉग ट्रांसफ़ॉर्मेशन या सबसे अच्छे मामले में एक प्राकृतिक सीमा से आगे नहीं जाएगी। इसके अलावा सभी उदाहरण मैंने अब तक एक अलग मॉडल में प्रत्येक डेटा ट्रांसफ़ॉर्मेशन समस्या को देखा है, अक्सर एक ही प्रेडिक्टर मॉडल में।
मुझे पता है कि एक BoxCox या YeoJohnson परिवर्तन क्या है। मैं जो देख रहा हूं वह एक विस्तृत, वास्तविक जीवन का अध्ययन है, जहां प्रतिक्रिया / संबंध स्पष्ट नहीं हैं। उदाहरण के लिए, प्रतिक्रिया सख्ती से सकारात्मक नहीं है (इसलिए आप लॉग या बॉक्सकॉक्स का उपयोग नहीं कर सकते हैं), भविष्यवाणियों के पास स्वयं और प्रतिक्रिया के बीच गैर-रैखिक संबंध हैं, और अधिकतम संभावना डेटा परिवर्तन एक मानक 0.33 का अर्थ नहीं लगता है या 0.5 घातांक। इसके अलावा अवशिष्ट विचरण गैर-स्थिर पाया जाता है (यह कभी नहीं है), इसलिए प्रतिक्रिया को भी रूपांतरित करना होगा और गैर-मानक जीएलएम परिवार प्रतिगमन या प्रतिक्रिया परिवर्तन के बीच विकल्प बनाना होगा। शोधकर्ता संभवतः डेटा को ओवरफिट करने से बचने के लिए विकल्प बनाएंगे।
संपादित करें
अब तक मैंने निम्नलिखित संसाधन जुटाए:
- रिग्रेशन मॉडलिंग रणनीतियाँ, एफ। हरेल
- एप्लाइड इकोनोमेट्रिक टाइम सीरीज़, डब्ल्यू एंडर्स
- आर, जी पेट्रीस के साथ गतिशील रैखिक मॉडल
- एप्लाइड रिग्रेशन एनालिसिस, डी। क्लेनबाम
- एक परिचय सांख्यिकीय सीखना, जी। जेम्स / डी। Witten
मैं केवल अंतिम (ISLR) पढ़ता हूं और यह एक बहुत अच्छा पाठ है (मेरी नजर में एक 5 पांच सितारे), हालांकि उन्नत प्रतिगमन मॉडलिंग की तुलना में एमएल के लिए अधिक उन्मुख है।
सीवी पर यह अच्छा पद भी है जो एक चुनौतीपूर्ण प्रतिगमन मामले को प्रस्तुत करता है।