रैखिक और गैर-रैखिक मॉडल के बीच अंतर का क्या महत्व है? प्रश्न Nonlinear बनाम सामान्यीकृत रैखिक मॉडल: आप लॉजिस्टिक, पॉइसन, आदि प्रतिगमन को कैसे देखते हैं? और इसका जवाब सामान्यीकृत रैखिक मॉडल की रैखिकता / गैर-रैखिकता का एक अत्यंत सहायक स्पष्टीकरण था। यह गैर-रैखिक मॉडल से रैखिक को अलग करने के लिए गंभीर रूप से महत्वपूर्ण लगता है, लेकिन मेरे लिए यह स्पष्ट नहीं है कि क्यों? उदाहरण के लिए, इन प्रतिगमन मॉडल पर विचार करें:
मॉडल 1 और 2 दोनों रैखिक हैं, और के समाधान बंद रूप में मौजूद हैं, आसानी से एक मानक ओएलएस अनुमानक का उपयोग करके पाया जाता है। मॉडल 3 और 4 के लिए ऐसा नहीं है, जो गैर-अस्पष्ट हैं क्योंकि (कुछ) wrt के डेरिवेटिव अभी भी कार्य हैं ।ई [ Y | एक्स ] बीटा बीटा
अनुमान लगाने के लिए एक सरल उपाय मॉडल 3 में सेटिंग से मॉडल linearize है , अनुमान एक रेखीय मॉडल का उपयोग कर, और फिर गणना । γ = बीटा 2 1 γ बीटा 1 = √
मॉडल 4 में मापदंडों का अनुमान लगाने के लिए, हम मान सकते हैं कि एक द्विपद वितरण (घातीय परिवार का सदस्य) का अनुसरण करता है, और, इस तथ्य का उपयोग करते हुए कि मॉडल का लॉजिस्टिक रूप विहित लिंक है, मॉडल के आरएच को रैखिक करें। यह नेल्डर और वेडरबर्न के सेमिनल योगदान था।
लेकिन यह गैर-रैखिकता पहली जगह में समस्या क्यों है? वर्गम फ़ंक्शन का उपयोग करके रैखिक 3 को हल करने के लिए या जीएलवी को लागू किए बिना मॉडल 4 को हल करने के लिए कोई बस कुछ पुनरावृत्त एल्गोरिथ्म का उपयोग क्यों नहीं कर सकता है। मुझे संदेह है कि व्यापक कम्प्यूटेशनल शक्ति से पहले, सांख्यिकीविद् सब कुछ रेखीय करने की कोशिश कर रहे थे। अगर सच है, तो शायद ग़ैर-मौजूदगी द्वारा पेश की गई "समस्याएं" अतीत का अवशेष हैं? क्या गैर-रेखीय मॉडल द्वारा प्रस्तुत जटिलताएं केवल कम्प्यूटेशनल हैं, या कुछ अन्य सैद्धांतिक मुद्दे हैं जो गैर-रैखिक मॉडल को रैखिक मॉडल की तुलना में डेटा के लिए फिट होने के लिए अधिक चुनौतीपूर्ण बनाते हैं?