मेरे पास तीन वेरिएबल्स के 365 अवलोकन वाले डेटा सेट हैं pm, tempऔर rain। अब मैं pmअन्य दो चर में परिवर्तन के जवाब में व्यवहार की जांच करना चाहता हूं । मेरे चर हैं:
pm10= प्रतिक्रिया (आश्रित)temp= भविष्यवक्ता (स्वतंत्र)rain= भविष्यवक्ता (स्वतंत्र)
मेरे डेटा के लिए सहसंबंध मैट्रिक्स निम्नलिखित है:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
समस्या तब है जब मैं प्रतिगमन मॉडल के निर्माण का अध्ययन कर रहा था, यह लिखा गया था कि योज्य विधि उस चर के साथ शुरू होनी है जो प्रतिक्रिया चर से सबसे अधिक संबंधित है। मेरे डेटा सेट rainमें अत्यधिक सहसंबद्ध है pm(जैसा कि तुलना में temp), लेकिन एक ही समय में यह एक डमी चर (बारिश = 1, कोई बारिश = 0) नहीं है, इसलिए मुझे अब कहां से शुरू करना चाहिए, इसका सुराग है। मैं सवाल के साथ दो छवियों संलग्न किया है: पहला डेटा की एक scatterplot है, और दूसरी छवि के एक scatterplot है pm10बनाम rain, मैं भी की scatterplot व्याख्या करने में असमर्थ हूँ pm10बनाम rain। क्या कोई मुझे शुरू करने में मदद कर सकता है?

