मेरे पास भोला विचार है कि रैखिक प्रतिगमन केवल तभी उपयुक्त होता है जब कोई संदेह करता है कि व्याख्यात्मक चर और प्रतिक्रिया चर के बीच रैखिक कार्यात्मक संबंध हैं। लेकिन कई वास्तविक दुनिया के आवेदन इस कसौटी पर खरे नहीं उतरते।
यह "रैखिक प्रतिगमन" में "रैखिक" क्या है की एक सही समझ नहीं है।
yx
yx
यहाँ एक एकल भविष्यवक्ता के साथ एक उदाहरण है , लेकिन वक्रता मॉडल को अक्सर कई प्रतिगमन के रूप में फिट किया जाता है, जहाँ प्रतिगमन में एक भविष्यवक्ता (x चर, स्वतंत्र चर) के कई कार्य हो सकते हैं और यह बहुत अधिक लचीलेपन की अनुमति देता है। इसमें बहुपद प्रतिगमन शामिल है, उदाहरण के लिए। कुछ चर्चा और उदाहरण यहां देखें ।
हालांकि, अगर हम इस तथ्य के लिए अनुमति देते हैं कि घुमावदार रिश्तों को फिट करने के लिए भविष्यवाणियों को रूपांतरित किया जा सकता है, तो मापदंडों में रैखिकता भी उन परिवर्तित भविष्यवाणियों में रैखिकता के अनुरूप होती है।
इसके अलावा, कई समस्याएं रैखिक के करीब हैं (कम से कम मूल्यों पर विचार किया जा रहा है), या इतना शोर कर रहे हैं कि किसी भी हल्के वक्रता को समझने योग्य नहीं है, और बढ़ते या घटते रिश्ते के लिए विभिन्न प्रकार के सरल मॉडल कर सकते हैं - और उस मामले में एक रेखीय विकल्प फिट और समझने के लिए पर्याप्त और सरल दोनों हो सकता है।
एक अनुभवी सांख्यिकीविद् किसी परियोजना के क्या पहलुओं के बारे में सोच रहा होगा यदि वे मेरे जूते में थे, एक प्रश्न + डेटा की तलाश में जो रैखिक प्रतिगमन के लिए अच्छी तरह से अनुकूल है।
जब मैं शिक्षण के लिए एक अच्छा उदाहरण खोजने की कोशिश कर रहा हूं, तब केवल एक ही समय मैं प्रतिगमन लागू करने के लिए एक समस्या की तलाश कर सकता हूं। जब वास्तव में सांख्यिकीय कार्य करने की स्थिति में (इसे समझाने या सिखाने के बजाय), मैं विधि के अनुरूप डेटा चुनने के बजाय ब्याज के सवाल (और डेटा की विशेषताओं) के अनुरूप होने के लिए पद्धति का चयन करता हूं।
उदाहरण के लिए, बढ़ई की कल्पना करें। बढ़ई ने एक प्रवक्ता नहीं उठाया और कहा कि "मैं इस पर क्या उपयोग कर सकता हूं ?"। बल्कि, बढ़ई को हल करने के लिए एक समस्या है, और समस्या की विशेषताओं को देखते हुए ("मैं क्या बनाने की कोशिश कर रहा हूं?" और "मैं किस तरह की लकड़ी का उपयोग कर रहा हूं?" और इतने पर ...) विशेष उपकरण हो सकते हैं? दूसरों की तुलना में अधिक प्रासंगिक है। कभी-कभी जो उपकरण उपलब्ध होते हैं वे विकल्पों को सीमित कर सकते हैं या मार्गदर्शन कर सकते हैं (यदि आपके पास एक प्रवक्ता नहीं है , तो आपको कुछ और करना होगा ... या आपको बस एक प्रवक्ता खरीदना होगा)।
हालाँकि, मान लें कि आपके पास एक पॉकेट सांख्यिकीविद है जो आपकी सहायता कर रहा है और आप रेखीय प्रतिगमन के अनुकूल एक समस्या खोजने की कोशिश कर रहे हैं। तब वे सुझाव दे सकते हैं कि आप विभिन्न प्रतिगमन मान्यताओं पर विचार करें और जब वे बात करें। मैं कुछ बातों का उल्लेख करूंगा।
E(y|g(x))g(x)gx∗=xE(y|x∗)=a+bx∗
यदि आप कई प्रतिगमन का उपयोग करने में सक्षम हैं, यहां तक कि विशेष रूप से एक प्रमुख मुद्दा नहीं है, क्योंकि एक (उदाहरण के लिए) घन प्रतिगमन का उपयोग कर सकते हैं काफी सामान्य संबंधों को फिट करने के लिए।
मैं आपको समय के साथ डेटा को स्पष्ट करने का सुझाव दूंगा जब तक कि आप गंभीर रिग्रेशन वाले मुद्दों को नहीं समझते हैं; पार के अनुभागीय समस्याओं के साथ रहना।
xx
x
यदि आप परिकल्पना परीक्षण, आत्मविश्वास अंतराल या भविष्यवाणी अंतराल में रुचि रखते हैं, तो सामान्य प्रतिगमन मान्यताओं में से अधिक मायने रख सकते हैं (लेकिन ऐसे विकल्प हैं जो उन धारणाओं को नहीं बनाते हैं, और कुछ मामलों में, कम से कम कुछ धारणाएं नहीं हो सकती हैं वैसे भी विशेष रूप से महत्वपूर्ण हो)।
इसलिए कम से कम एक चीज़ के बारे में जानने की कोशिश करें कि वे कौन सी धारणाएँ हैं जो आपके द्वारा उपयोग की जाने वाली हीन प्रक्रियाओं को प्राप्त करने में बनाई गई हैं और वे आपकी विशेष समस्या में कितनी महत्वपूर्ण हो सकती हैं (उदाहरण के लिए, सामान्य परिकल्पना परीक्षणों का प्रदर्शन करते समय, सामान्यता एक धारणा है, लेकिन बड़े नमूनों में धारणा महत्वपूर्ण नहीं हो सकती है; दूसरी तरफ, निरंतर विचरण की धारणा एक मुद्दे से अधिक हो सकती है)।
ऐसे कई पद हैं जो प्रतिगमन की मान्यताओं पर चर्चा करते हैं, और कुछ पद जो चर्चा करते हैं कि उन्हें कब बनाया जाना चाहिए, और वे कितना मायने रखते हैं, और यहां तक कि उन पर विचार करने का क्या आदेश है।