डेटा सामान्यीकरण से संबंधित भ्रम


9

मैं एक रेखीय प्रतिगमन मॉडल सीखने की कोशिश कर रहा हूं। हालांकि, मुझे डेटा के सामान्यीकरण से संबंधित कुछ भ्रम है। मैंने फीचर्स / प्रेडिक्टर्स को शून्य माध्य और यूनिट वेरिएशन के लिए सामान्य कर दिया है। क्या मुझे लक्ष्य के लिए ऐसा करने की आवश्यकता है। यदि हां तो क्यों?


1
आपने सुविधाओं / भविष्यवाणियों को सामान्य क्यों किया?
पीटर Flom

4
BTW मुझे लगता है कि 'मानकीकृत' उसके लिए एक बेहतर शब्द है।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


6

रैखिक प्रतिगमन में लक्ष्य को सामान्य करना कोई मायने नहीं रखता। रैखिक प्रतिगमन में, आपका फिट रूप होगा

y^i=a0+axi.
जब आप भविष्यवाणी करते हैं xi केंद्रित हैं, निरंतर शब्द a0 हमेशा का मतलब होगा yi। इसलिए अगर आप केंद्र में हैंyi प्रतिगमन चलाने से पहले, आपको बस मिल जाएगा a0=0, लेकिन आपके सभी अन्य गुणांक अपरिवर्तित रहेंगे।

(यह कहा जा रहा है, भविष्यवाणियों को सामान्य करना --- जैसा कि आप वर्तमान में कर रहे हैं --- एक अच्छा विचार है।)


1
भविष्यवक्ताओं को सामान्य विचार देना क्यों सामान्य है?
Scortchi - को पुनः स्थापित मोनिका

@Stefan। हां, जब मैं भविष्यवाणियों को केंद्र में रखता हूं, तो मुझे लगातार कार्यकाल मिलता हैa0वाई का मतलब है। लेकिन मुझे नहीं पता था कि यह कैसे मतलब है। क्या आप मुझे इसके पीछे के गणित बता सकते हैं?
user34790

2
@ स्कोर्टची भविष्यवक्ताओं का सामान्यीकरण करना आवश्यक नहीं है, लेकिन प्रतिगमन से गुणांक की व्याख्या करना आसान बना सकता है: सामान्यीकरण के बाद, बड़े गुणांक महत्वपूर्ण भविष्यवक्ताओं के अनुरूप होते हैं। इसके अलावा, सामान्यीकरण के बिना, बातचीत की शर्तों के गुणांक गंभीर रूप से भ्रामक हो सकते हैं। कहा जा रहा है, सामान्यीकरण आपके मॉडल से मिलने वाली भविष्यवाणियों को प्रभावित नहीं करेगा, इसलिए सामान्यीकरण केवल तभी मायने रखता है जब आप प्रतिगमन में गुणांक की व्याख्या करने का इरादा रखते हैं।
स्टीफन वगेर

1
@ user34790 गणित में काम किया जाता है pmean.com/10/LeastSquares.html
स्टीफन दांव

0

मुझे लगता है कि सैद्धांतिक रूप से यह कोई फर्क नहीं पड़ता, लेकिन संख्यात्मक रूप से यह मायने रखता है। इस जवाब पर एक नज़र डालें।

https://stats.stackexchange.com/a/111997/57240

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.