मशीन लर्निंग में पावर या लॉग ट्रांसफ़ॉर्मेशन को ज्यादा क्यों नहीं सिखाया गया?


24

मशीन लर्निंग (एमएल) रैखिक और लॉजिस्टिक रिग्रेशन तकनीकों का भारी उपयोग करता है। यह भी सुविधा इंजीनियरिंग तकनीक (पर निर्भर करता है feature transform, kernel, आदि)।

क्यों है कुछ भी नहीं के बारे में variable transformation(उदाहरण के लिए power transformation) एमएल में उल्लेख किया है? (उदाहरण के लिए, मैं कभी रूट या लॉग इन फीचर्स के बारे में नहीं सुनता, वे आमतौर पर बहुपद या आरबीएफ का उपयोग करते हैं।) इसी तरह, एमएल विशेषज्ञ आश्रित चर के लिए फीचर परिवर्तनों की परवाह क्यों नहीं करते? (उदाहरण के लिए, मैं वाई के लॉग ट्रांसफ़ॉर्म लेने के बारे में कभी नहीं सुनता; वे सिर्फ वाई ट्रांसफॉर्म नहीं करते।)

संपादन: शायद सवाल निश्चित रूप से नहीं है, मेरा वास्तव में सवाल यह है "क्या चर में बिजली परिवर्तन एमएल में महत्वपूर्ण नहीं है?"


4
मैं जानना चाहता हूं कि इसे क्यों डाउन किया गया था; यह वास्तव में एक दिलचस्प सवाल है।
छायाकार

1
मुझे लगता है कि ज्यादातर लोगों ने अपने पहले एमएल कोर्स से पहले एक रेखीय प्रतिगमन पाठ्यक्रम लिया होगा। निश्चित रूप से, स्टॉक LR कोर्स में इन चीजों (परिवर्तनों) पर एक अध्याय होगा। Btw, मैंने सवाल को कम नहीं किया।
user603

जवाबों:


12

कुह्न एंड जॉनसन की पुस्तक एप्लाइड प्रिडिक्टिव मॉडलिंग , बॉक्स-कॉक्स सहित परिवर्तनशील परिवर्तन पर एक बड़े खंड के साथ एक उच्च-माना व्यावहारिक मशीन लर्निंग बुक है। लेखकों का दावा है कि कई मशीन लर्निंग एल्गोरिदम बेहतर काम करते हैं अगर सुविधाओं में सममित और असमान वितरण होते हैं। इस तरह की विशेषताओं को बदलना "फीचर इंजीनियरिंग" का एक महत्वपूर्ण हिस्सा है।


8

खैर मेरे अपने दृष्टिकोण से, अक्सर मैं प्रतिक्रियाशील चर के भविष्य कहनेवाला वितरण में दिलचस्पी लेता हूं, केवल सशर्त माध्य के बजाय, और इस मामले में यह संभावना का उपयोग करने के लिए बेहतर है कि लक्ष्य वितरण का सही ढंग से प्रतिनिधित्व करता है। उदाहरण के लिए, मैं वेक्टर प्रतिगमन के बजाय (कहना) समर्थन के बजाय कर्नेलित रैखिक मॉडल का उपयोग करना पसंद करता हूं, क्योंकि अगर मैं चाहता हूं तो मैं एक पॉइसन संभावना का उपयोग कर सकता हूं। चूंकि मशीन सीखने वाले बहुत से लोग बायेसियन हैं, मुझे संदेह है कि परिवर्तनों की तुलना में एक अलग संभावना का उपयोग करना अधिक सुरुचिपूर्ण होगा (एक उपयुक्त संभावना चुनना आमतौर पर पहला कदम है)।


0

यहाँ मेरे बाद के विचार हैं।

मुझे लगता है कि यह इसलिए है क्योंकि एमएल बड़े पैमाने पर वर्गीकरण से संबंधित है, और वर्गीकरण को y (y स्पष्ट है) को बदलने की कोई आवश्यकता नहीं है। एमएल आमतौर पर बड़े स्वतंत्र चर (उदाहरण के लिए एनएलपी में हजारों) के साथ सौदा करते हैं और लॉजिस्टिक प्रतिगमन को सामान्यता की आवश्यकता नहीं होती है; मुझे लगता है कि गति पर विचार के कारण वे बॉक्स-कॉक्स बिजली परिवर्तन का उपयोग नहीं करते हैं। (नोट: मैं सत्ता परिवर्तन से परिचित नहीं हूं।)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.