जब मॉडल को स्केल किए गए डेटा के साथ फिट किया गया था, तो भविष्यवाणियां करने के लिए नई टिप्पणियों को कैसे स्केल किया जाए?

मैं रेखीय प्रतिगमन मॉडल में उपयोग करने के लिए डेटा मैट्रिक्स को स्केल करने की अवधारणा को समझता हूं। उदाहरण के लिए, R में आप उपयोग कर सकते हैं:

scaled.data <- scale(data, scale=TRUE)

मेरा एकमात्र प्रश्न यह है कि नई टिप्पणियों के लिए, जिनके लिए मैं आउटपुट मानों की भविष्यवाणी करना चाहता हूं, उन्हें सही ढंग से कैसे बढ़ाया जाता है? क्या यह होगा scaled.new <- (new - mean(data)) / std(data)?

r regression prediction scales

— SamuelNLP
स्रोत

मूल्यों को वापस पाने के लिए y = y_esc * sd(y) + mean(y), लेकिन मुझे लगता है कि मॉडल के गुणों के साथ खिलवाड़ होगा, इसलिए मैं भी अधिक तकनीकी जवाब का इंतजार कर रहा हूं!

— फर्नांडो

मैं मूल्यों को वापस नहीं चाहता, मैं जानना चाहता हूं कि नए उदाहरणों को उसी तरह कैसे सही ढंग से बढ़ाया जा सकता है। मैंने आपकी टिप्पणी के आधार पर अपना प्रश्न संपादित किया है।

— शमूएलएनएलपी

आपके प्रश्न का संक्षिप्त उत्तर है, हां - स्केल्ड.न्यू के लिए यह अभिव्यक्ति सही है (इसके sdबजाय आप चाहते थे std)।

यह ध्यान देने योग्य हो सकता है कि पैमाने पर वैकल्पिक तर्क हैं, जिनका आप उपयोग कर सकते हैं:

scaled.new <- scale(new, center = mean(data), scale = sd(data))

इसके अलावा, स्केल (स्केल्ड.डेटा) द्वारा लौटाए गए ऑब्जेक्ट में संख्यात्मक सेंटिंग और स्केलिंग (यदि कोई हो) का उपयोग करने के गुण हैं, जिसका आप उपयोग कर सकते हैं:

scaled.new <- scale(new, attr(scaled.data, "scaled:center"), attr(scaled.data, "scaled:scale"))

इसका लाभ तब दिखाई देता है जब मूल डेटा में एक से अधिक कॉलम होते हैं, इसलिए विचार करने के लिए कई साधन और / या मानक विचलन होते हैं।

— user20637
स्रोत

काश ऐसा करने का थोड़ा सरल तरीका होता, जैसेscaled.new <- scale(new, use.attrs = scaled.data)

— शब्दार्थी

@wordsforthewise इसे प्राप्त करने के लिए scale.default के लिए एक आवरण लिखना मुश्किल नहीं होगा। मुझे संदेह है कि आर-कोर इसे उच्च प्राथमिकता देगा।

— user20637

हाँ। अगर मैं यह पता लगा सकता हूं कि आर-कोर में योगदान कैसे करें और इसे करने के लिए समय मिले, तो मैं ऐसा कर सकता हूं।

— शब्दफोर्ट वाइज