निर्णय वृक्ष चर (सुविधा) स्केलिंग और चर (सुविधा) सामान्यीकरण (ट्यूनिंग) किस कार्यान्वयन में आवश्यक है?


10

कई मशीन लर्निंग एल्गोरिदम में, फीचर स्केलिंग (उर्फ वैरिएबल स्केलिंग, नॉर्मलाइजेशन) विकिपीडिया - फ़ीचर स्केलिंग का एक सामान्य प्रीपोसिंग चरण है - यह प्रश्न करीब # 41704 था - सामान्यीकरण और फ़ीचर स्केलिंग का काम कैसे और क्यों होता है?

निर्णय वृक्षों के संबंध में मेरे दो प्रश्न हैं:

  1. क्या कोई निर्णय ट्री कार्यान्वयन है जिसे फ़ीचर स्केलिंग की आवश्यकता होगी? मैं इस धारणा के तहत हूं कि अधिकांश एल्गोरिदम के विभाजन के मापदंड पैमाने के प्रति उदासीन हैं।
  2. इन चरों पर विचार करें: (१) इकाइयाँ, (२) घंटे, (३) प्रति घंटा इकाइयाँ - इन तीन चरों को "ऐस" के रूप में छोड़ना सबसे अच्छा है जब एक निर्णय पेड़ में खिलाया जाता है या क्या हम किसी प्रकार के संघर्ष में भागते हैं चूंकि "सामान्यीकृत" चर (3) से संबंधित है (1) और (2)? यही है, क्या आप मिक्स में तीनों वेरिएबल्स को फेंककर इस स्थिति पर हमला करेंगे, या आप आमतौर पर तीनों में से कुछ संयोजन चुनेंगे या "सामान्यीकृत / मानकीकृत" फीचर (3) का उपयोग करेंगे?

जवाबों:


6

1 के लिए, आम तौर पर निर्णय पेड़ों को स्केलिंग की आवश्यकता नहीं होती है। हालाँकि, यह डेटा विज़ुअलाइज़ेशन / हेरफेर के साथ मदद करता है, और यदि आप एसवीएम के साथ अन्य डेटा या अन्य तरीकों के साथ प्रदर्शन की तुलना करने का इरादा रखते हैं तो यह उपयोगी हो सकता है।

2 के लिए, यह ट्यूनिंग का सवाल है। इकाइयों / घंटे को एक प्रकार की परिवर्तनशील बातचीत माना जा सकता है और प्रत्येक से अलग भविष्य कहनेवाला शक्ति हो सकती है। यह वास्तव में आपके डेटा पर निर्भर करता है, हालांकि। अगर कोई अंतर है तो मैं उसके साथ और बिना देखने की कोशिश करूंगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.