डिस्क्लेमर: यह एक होमवर्क प्रोजेक्ट के लिए है।
मैं हीरे की कीमतों के लिए सबसे अच्छे मॉडल के साथ आने की कोशिश कर रहा हूं, कई चर पर निर्भर करता है और मुझे लगता है कि अब तक बहुत अच्छा मॉडल है। हालाँकि मैं दो चर में चला गया हूँ जो स्पष्ट रूप से मिल रहे हैं:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
तालिका और गहराई एक-दूसरे पर निर्भर हैं, लेकिन मैं अभी भी उन्हें अपने पूर्वानुमान मॉडल में शामिल करना चाहता हूं। मैंने हीरों पर कुछ शोध किया और पाया कि टेबल और डेप्थ ऊपर की लंबाई और हीरे की नोक के ऊपर से नीचे तक की दूरी है। चूंकि हीरे की ये कीमतें सुंदरता से संबंधित लगती हैं और सौंदर्य संबंधित अनुपात से प्रतीत होता है, मैं कीमतों का अनुमान लगाने के लिए , उनका अनुपात शामिल करने जा रहा था । क्या यह मानक प्रक्रिया कोलीन चर से निपटने के लिए है? यदि नहीं, तो क्या है?
संपादित करें: यहाँ गहराई ~ तालिका का एक भूखंड है: