जब मॉडल को स्केल किए गए डेटा के साथ फिट किया गया था, तो भविष्यवाणियां करने के लिए नई टिप्पणियों को कैसे स्केल किया जाए?


13

मैं रेखीय प्रतिगमन मॉडल में उपयोग करने के लिए डेटा मैट्रिक्स को स्केल करने की अवधारणा को समझता हूं। उदाहरण के लिए, R में आप उपयोग कर सकते हैं:

scaled.data <- scale(data, scale=TRUE)

मेरा एकमात्र प्रश्न यह है कि नई टिप्पणियों के लिए, जिनके लिए मैं आउटपुट मानों की भविष्यवाणी करना चाहता हूं, उन्हें सही ढंग से कैसे बढ़ाया जाता है? क्या यह होगा scaled.new <- (new - mean(data)) / std(data)?


1
मूल्यों को वापस पाने के लिए y = y_esc * sd(y) + mean(y), लेकिन मुझे लगता है कि मॉडल के गुणों के साथ खिलवाड़ होगा, इसलिए मैं भी अधिक तकनीकी जवाब का इंतजार कर रहा हूं!
फर्नांडो

मैं मूल्यों को वापस नहीं चाहता, मैं जानना चाहता हूं कि नए उदाहरणों को उसी तरह कैसे सही ढंग से बढ़ाया जा सकता है। मैंने आपकी टिप्पणी के आधार पर अपना प्रश्न संपादित किया है।
शमूएलएनएलपी

जवाबों:


13

आपके प्रश्न का संक्षिप्त उत्तर है, हां - स्केल्ड.न्यू के लिए यह अभिव्यक्ति सही है (इसके sdबजाय आप चाहते थे std)।

यह ध्यान देने योग्य हो सकता है कि पैमाने पर वैकल्पिक तर्क हैं, जिनका आप उपयोग कर सकते हैं:

scaled.new <- scale(new, center = mean(data), scale = sd(data))

इसके अलावा, स्केल (स्केल्ड.डेटा) द्वारा लौटाए गए ऑब्जेक्ट में संख्यात्मक सेंटिंग और स्केलिंग (यदि कोई हो) का उपयोग करने के गुण हैं, जिसका आप उपयोग कर सकते हैं:

scaled.new <- scale(new, attr(scaled.data, "scaled:center"), attr(scaled.data, "scaled:scale"))

इसका लाभ तब दिखाई देता है जब मूल डेटा में एक से अधिक कॉलम होते हैं, इसलिए विचार करने के लिए कई साधन और / या मानक विचलन होते हैं।


काश ऐसा करने का थोड़ा सरल तरीका होता, जैसेscaled.new <- scale(new, use.attrs = scaled.data)
शब्दार्थी

@wordsforthewise इसे प्राप्त करने के लिए scale.default के लिए एक आवरण लिखना मुश्किल नहीं होगा। मुझे संदेह है कि आर-कोर इसे उच्च प्राथमिकता देगा।
user20637

हाँ। अगर मैं यह पता लगा सकता हूं कि आर-कोर में योगदान कैसे करें और इसे करने के लिए समय मिले, तो मैं ऐसा कर सकता हूं।
शब्दफोर्ट वाइज
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.