मैं नहीं जानता कि क्या आप वास्तव में इसका मतलब है, लेकिन मैं बहुत से लोग देख रहा हूँ जो सामान्यीकरण का अर्थ है डेटा मानकीकरण। मानकीकरण आपके डेटा को बदल रहा है, इसलिए इसका मतलब 0 और मानक विचलन 1 है:
x <- (x - mean(x)) / sd(x)
मैं डेटा स्केलिंग के लिए सामान्यीकरण शब्द का उपयोग करते हुए लोगों को भी देखता हूं, जैसा कि आपके डेटा को 0-1 रेंज में बदलने के लिए:
x <- (x - min(x)) / (max(x) - min(x))
यह भ्रामक हो सकता है!
दोनों तकनीकों में उनके पेशेवरों और विपक्ष हैं। जब कई बाहरी लोगों के साथ एक डेटासेट स्केलिंग करते हैं, तो आपका गैर-बाह्य डेटा बहुत कम अंतराल में समाप्त हो सकता है। इसलिए यदि आपके डेटासेट में बहुत अधिक आउटलेयर हैं, तो आप इसे मानकीकृत करने पर विचार कर सकते हैं। बहरहाल, जब आप ऐसा करते हैं कि आप नकारात्मक डेटा (कभी-कभी आप ऐसा नहीं चाहते) और अनबाउंड डेटा (आप या तो नहीं चाहते हो सकता है) के साथ समाप्त हो जाएंगे।