standardization पर टैग किए गए जवाब

आमतौर पर "जेड-मानकीकरण" को संदर्भित करता है, जो यह सुनिश्चित करने के लिए डेटा को स्थानांतरित और पुन: व्यवस्थित कर रहा है कि उनके पास शून्य माध्य और इकाई संस्करण है। अन्य "मानकीकरण" भी संभव हैं।

7
कई प्रतिगमन का संचालन करते समय, आपको अपने भविष्यवक्ता चर को कब केंद्रित करना चाहिए और कब उन्हें मानकीकृत करना चाहिए?
कुछ साहित्य में, मैंने पढ़ा है कि कई व्याख्यात्मक चर के साथ एक प्रतिगमन, यदि विभिन्न इकाइयों में, मानकीकृत होने की आवश्यकता है। (मानकीकरण में माध्य को घटाना और मानक विचलन द्वारा विभाजित करना शामिल है।) अन्य मामलों में मुझे अपने डेटा को मानकीकृत करने की आवश्यकता है? क्या ऐसे …

5
सामान्यीकरण और मानकीकरण के बीच क्या अंतर है?
काम के दौरान हम इस पर चर्चा कर रहे थे क्योंकि मेरे बॉस ने सामान्यीकरण के बारे में कभी नहीं सुना। रैखिक बीजगणित में, सामान्यीकरण अपनी लंबाई से एक वेक्टर के विभाजन को संदर्भित करता है। और आँकड़ों में, मानकीकरण का तात्पर्य किसी माध्य के घटाव का उल्लेख करना होता …

3
मॉडल बनाने से पहले चर को अक्सर समायोजित किया जाता है (जैसे मानकीकृत) - यह एक अच्छा विचार कब है, और यह एक बुरा कब है?
मॉडल फिटिंग से पहले आप किन परिस्थितियों में एक चर को मापना या मानकीकृत नहीं करना चाहते हैं? और वैरिएबल स्केलिंग के क्या फायदे / नुकसान हैं?

3
मॉडल सत्यापन से पहले या भीतर सुविधा सामान्यीकरण करें?
मशीन लर्निंग में एक सामान्य अच्छा अभ्यास भविष्यवक्ता चर की सामान्यीकरण या डेटा मानकीकरण करना है, यह है, मतलब को बदलने वाले डेटा को केंद्र में रखना और इसे विचरण (या मानक विचलन) द्वारा विभाजित करना सामान्य करना। स्व-नियंत्रण और मेरी समझ के लिए हम दो मुख्य चीजों को प्राप्त …

1
यदि प्रशिक्षण लक्ष्य है तो मानकीकरण / प्रशिक्षण और सामान्यीकरण कैसे लागू करें?
क्या मैं एक ही समय में अपने सभी डेटा या सिलवटों को बदल देता हूं (यदि CV लागू है)? जैसे (allData - mean(allData)) / sd(allData) क्या मैं ट्रेनसेट और टेस्टसेट को अलग-अलग करूंगा? जैसे (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) या क्या मैं ट्रेनसेट को बदल …

3
क्या लॉजिस्टिक रिग्रेशन फिट करने से पहले मानकीकरण की आवश्यकता है?
मेरा सवाल यह है कि लॉजिस्टिक रिग्रेशन को फिट करने से पहले हमें यह सुनिश्चित करने के लिए डेटा सेट को मानकीकृत करने की ज़रूरत है कि सभी वेरिएबल्स के बीच एक ही पैमाना हो, [0,1]। सूत्र है: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} मेरे डेटा सेट में 2 चर हैं, वे दो चैनलों के …

2
रैखिक प्रतिगमन में मानकीकृत व्याख्यात्मक चर का उपयोग कब और कैसे करें
मेरे पास रेखीय प्रतिगमन के बारे में 2 सरल प्रश्न हैं: व्याख्यात्मक चरों को मानकीकृत करने की सलाह कब दी जाती है? एक बार मानकीकृत मूल्यों के साथ आकलन किया जाता है, तो कोई नए मूल्यों के साथ कैसे भविष्यवाणी कर सकता है (नए मूल्यों का मानकीकरण कैसे किया जाना …

3
चाहे LASSO के लिए संकेतक / बाइनरी / डमी भविष्यवाणियों को पुनर्विक्रय करना है
LASSO (और अन्य मॉडल चयन प्रक्रियाओं के लिए) भविष्यवक्ताओं को पुनर्विक्रय करना महत्वपूर्ण है। मेरे द्वारा अनुसरण की जाने वाली सामान्य सिफारिश केवल निरंतर चर के लिए 0 मतलब, 1 मानक विचलन सामान्यीकरण का उपयोग करने के लिए है। लेकिन डमी के साथ क्या करना है? उदाहरण के लिए उसी …

2
क्या लैस्सो से पहले मानकीकरण वास्तव में आवश्यक है?
मैंने Lassoप्रतिगमन जैसे कुछ के पहले चर के मानकीकरण के तीन मुख्य कारण पढ़े हैं : 1) गुणांकों की व्याख्या। 2) बाद के संकोचन गुणांक अनुमानों के सापेक्ष परिमाण द्वारा गुणांक महत्व को रैंक करने की क्षमता। 3) अवरोधन की कोई आवश्यकता नहीं। लेकिन मैं सबसे महत्वपूर्ण बिंदु के बारे …


3
"सामान्यीकरण" का क्या अर्थ है और यह कैसे सत्यापित करें कि नमूना या वितरण सामान्यीकृत है?
मेरा एक प्रश्न है जिसमें यह सत्यापित करने के लिए कहा जाता है कि क्या वर्दी वितरण ( सामान्यीकृत है।Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) एक के लिए, किसी भी वितरण को सामान्य बनाने के लिए इसका क्या मतलब है? और दो, हम यह सत्यापित करने के बारे में क्या कहते हैं कि वितरण …

2
रिज प्रतिगमन में मानकीकरण के बारे में प्रश्न
हे दोस्तों मुझे एक या दो पेपर मिले जो रिज रिग्रेशन (बास्केटबॉल डेटा के लिए) का उपयोग करते हैं। मुझे हमेशा अपने वैरिएबल को मानकीकृत करने के लिए कहा जाता था यदि मैं एक रिज रिग्रेशन चलाता था, लेकिन मुझे बस ऐसा करने के लिए कहा गया था क्योंकि रिज …

2
क्या पैनल / अनुदैर्ध्य डेटा के साथ प्रतिगमन में अपने डेटा को मानकीकृत करना अच्छा है?
सामान्य तौर पर, मैं गुणकों की तुलना करने के लिए अपने स्वतंत्र चर को मानकीकृत करता हूं, ठीक से गुणांक की तुलना करने के लिए (इस तरह उनकी इकाइयां हैं: मानक विचलन)। हालाँकि, पैनल / अनुदैर्ध्य डेटा के साथ, मुझे यकीन नहीं है कि मुझे अपने डेटा को कैसे मानकीकृत …

1
प्रतिगमन में डेटा को केंद्र और मानकीकृत करने की आवश्यकता
कुछ नियमितीकरण के साथ रैखिक प्रतिगमन पर विचार करें: जैसे कि पता लगाएं कि xxx कम करता है ||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 आमतौर पर, ए के कॉलम को शून्य मीन और यूनिट मानदंड के लिए मानकीकृत किया जाता है, जबकि को शून्य माध्य के लिए केंद्रित किया जाता है। मैं यह …

2
क्या यादृच्छिक वन को स्केल या केंद्रित करने के लिए इनपुट चर की आवश्यकता होती है?
मेरे इनपुट चर के विभिन्न आयाम हैं। कुछ चर दशमलव हैं जबकि कुछ सैकड़ों हैं। क्या यादृच्छिक वन का उपयोग करते समय डेटा को आयामहीन बनाने के लिए इन इनपुट चर को केंद्र (घटाना औसत) या स्केल (मानक विचलन द्वारा विभाजित) करना आवश्यक है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.