जैसा कि आप कहते हैं, रैखिक मॉडल आमतौर पर गैर-रेखीय मॉडल की तुलना में सरल होते हैं, जिसका अर्थ है कि वे तेजी से चलते हैं (निर्माण और भविष्यवाणी), व्याख्या और व्याख्या करना आसान है, और आमतौर पर त्रुटि माप में सीधे-आगे। तो लक्ष्य यह पता लगाना है कि क्या रेखीय प्रतिगमन की धारणाएं आपके डेटा के साथ हैं (यदि आप रैखिक का समर्थन करने में विफल हैं, तो बस गैर-रैखिक के साथ जाएं)। आमतौर पर आप अपने एकल-चर भूखंड को सभी चर के साथ व्यक्तिगत रूप से दोहराते हैं, अन्य सभी चर स्थिर रखते हुए।
शायद अधिक महत्वपूर्ण बात है, हालांकि, आप जानना चाहते हैं कि क्या आप अपने डेटा को रैखिक स्थान पर स्थानांतरित करने के लिए किसी प्रकार का परिवर्तन, चर इंटरैक्शन या डमी चर लागू कर सकते हैं। यदि आप मान्यताओं को मान्य करने में सक्षम हैं, या यदि आप अपने डेटा को अच्छी तरह से अच्छी तरह से प्रेरित या अन्यथा समझदारी से परिवर्तनों या संशोधनों को लागू करने के लिए जानते हैं, तो आप उस परिवर्तन के साथ आगे बढ़ना चाहते हैं और रैखिक प्रतिगमन का उपयोग करना चाहते हैं। एक बार जब आपके पास अवशिष्ट होते हैं, तो आप उन्हें गैर-रेखीय तरीकों पर आगे बढ़ने की आवश्यकता होने पर आगे का निर्णय लेने के लिए बनाम अनुमानित मूल्यों या स्वतंत्र चर की साजिश कर सकते हैं।
ड्यूक में यहाँ रैखिक प्रतिगमन की मान्यताओं का एक उत्कृष्ट टूटना है । चार मुख्य मान्यताओं को सूचीबद्ध किया गया है, और प्रत्येक को मॉडल पर प्रभाव में कैसे तोड़ा जाता है, डेटा में इसका निदान कैसे किया जाता है, और अनुमान लगाने के लिए डेटा को "ठीक" (यानी बदलने या जोड़ने) के संभावित तरीके। यहाँ चार मान्यताओं को संक्षेप में शीर्ष से एक छोटा सा अंश दिया गया है, लेकिन आपको वहाँ जाना चाहिए और ब्रेकडाउन को पढ़ना चाहिए।
चार प्रमुख धारणाएं हैं जो अनुमान या भविष्यवाणी के प्रयोजनों के लिए रैखिक प्रतिगमन मॉडल के उपयोग को सही ठहराती हैं:
(i) निर्भर और स्वतंत्र चर के बीच संबंध की रैखिकता और परिवर्धन:
(ए) आश्रित चर का अपेक्षित मूल्य प्रत्येक स्वतंत्र चर का एक सीधा-रेखा कार्य है, जो अन्य को निर्धारित करता है।
(b) उस पंक्ति का ढलान अन्य चरों के मूल्यों पर निर्भर नहीं करता है।
(c) आश्रित चर के अपेक्षित मूल्य पर विभिन्न स्वतंत्र चर के प्रभाव योगात्मक होते हैं।
(ii) त्रुटियों की सांख्यिकीय स्वतंत्रता (विशेष रूप से, समय श्रृंखला डेटा के मामले में लगातार त्रुटियों के बीच कोई संबंध नहीं)
(iii) त्रुटियों की समरूपता (निरंतर विचरण)
(ए) बनाम समय (समय श्रृंखला डेटा के मामले में)
(b) भविष्यवाणियों के विरुद्ध
(c) किसी स्वतंत्र चर के विरुद्ध
(iv) त्रुटि वितरण की सामान्यता।