मैं रेखीय प्रतिगमन मॉडल में उपयोग करने के लिए डेटा मैट्रिक्स को स्केल करने की अवधारणा को समझता हूं। उदाहरण के लिए, R में आप उपयोग कर सकते हैं:
scaled.data <- scale(data, scale=TRUE)
मेरा एकमात्र प्रश्न यह है कि नई टिप्पणियों के लिए, जिनके लिए मैं आउटपुट मानों की भविष्यवाणी करना चाहता हूं, उन्हें सही ढंग से कैसे बढ़ाया जाता है? क्या यह होगा scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, लेकिन मुझे लगता है कि मॉडल के गुणों के साथ खिलवाड़ होगा, इसलिए मैं भी अधिक तकनीकी जवाब का इंतजार कर रहा हूं!