मेरे पास तीन वेरिएबल्स के 365 अवलोकन वाले डेटा सेट हैं pm
, temp
और rain
। अब मैं pm
अन्य दो चर में परिवर्तन के जवाब में व्यवहार की जांच करना चाहता हूं । मेरे चर हैं:
pm10
= प्रतिक्रिया (आश्रित)temp
= भविष्यवक्ता (स्वतंत्र)rain
= भविष्यवक्ता (स्वतंत्र)
मेरे डेटा के लिए सहसंबंध मैट्रिक्स निम्नलिखित है:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
समस्या तब है जब मैं प्रतिगमन मॉडल के निर्माण का अध्ययन कर रहा था, यह लिखा गया था कि योज्य विधि उस चर के साथ शुरू होनी है जो प्रतिक्रिया चर से सबसे अधिक संबंधित है। मेरे डेटा सेट rain
में अत्यधिक सहसंबद्ध है pm
(जैसा कि तुलना में temp
), लेकिन एक ही समय में यह एक डमी चर (बारिश = 1, कोई बारिश = 0) नहीं है, इसलिए मुझे अब कहां से शुरू करना चाहिए, इसका सुराग है। मैं सवाल के साथ दो छवियों संलग्न किया है: पहला डेटा की एक scatterplot है, और दूसरी छवि के एक scatterplot है pm10
बनाम rain
, मैं भी की scatterplot व्याख्या करने में असमर्थ हूँ pm10
बनाम rain
। क्या कोई मुझे शुरू करने में मदद कर सकता है?