मैं थोड़ा उलझन में हूं कि रैखिक प्रतिगमन की धारणाएं क्या हैं।
अब तक मैंने जाँच की कि क्या:
- सभी व्याख्यात्मक चर प्रतिक्रिया चर के साथ रैखिक रूप से संबंधित हैं। (यह मामला था)
- व्याख्यात्मक चरों के बीच किसी भी तरह की मिलीभगत थी। (थोड़ी मिलीभगत थी)।
- मेरे मॉडल के डेटा पॉइंट्स की कुक की दूरी 1 से कम है (यह मामला है, सभी दूरी 0.4 से नीचे हैं, इसलिए कोई प्रभाव अंक नहीं है)।
- अवशिष्ट सामान्य रूप से वितरित किए जाते हैं। (यह मामला नहीं हो सकता है)
लेकिन मैंने फिर निम्नलिखित पढ़ा:
सामान्यता का उल्लंघन अक्सर होता है क्योंकि (ए) आश्रित और / या स्वतंत्र चर के वितरण स्वयं काफी गैर-सामान्य होते हैं, और / या (बी) रैखिकता धारणा का उल्लंघन किया जाता है।
प्रश्न 1 यह ऐसा लगता है जैसे कि स्वतंत्र और निर्भर चर को सामान्य रूप से वितरित करने की आवश्यकता होती है, लेकिन जहां तक मुझे पता है कि यह मामला नहीं है। मेरे आश्रित चर और साथ ही मेरे स्वतंत्र चर में से एक भी सामान्य रूप से वितरित नहीं किया जाता है। क्या उन्हें होना चाहिए?
प्रश्न 2 मेरे अवशेषों की QQnormal साजिश कुछ इस तरह दिखती है:
यह थोड़ा सामान्य वितरण से भिन्न होता है और यह shapiro.test
भी शून्य परिकल्पना को खारिज करता है कि अवशिष्ट एक सामान्य वितरण से हैं:
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
अवशेषों बनाम सज्जित मूल्यों की तरह दिखते हैं:
यदि मेरे अवशेष सामान्य रूप से वितरित नहीं किए जाते हैं तो मैं क्या कर सकता हूं? क्या इसका मतलब यह है कि रैखिक मॉडल पूरी तरह से बेकार है?