data-preprocessing पर टैग किए गए जवाब

1
स्किकिट-सीख में एक-बनाम बनाम डमी एन्कोडिंग
श्रेणीबद्ध चर को एन्कोडिंग करने के दो अलग-अलग तरीके हैं। कहें, एक श्रेणीगत चर में n मान हैं। एक-हॉट एन्कोडिंग इसे n चरों में परिवर्तित करता है , जबकि डमी एन्कोडिंग इसे n-1 चरों में परिवर्तित करता है । यदि हमारे पास श्रेणीगत चर हैं, जिनमें से प्रत्येक में एन …

2
क्या यादृच्छिक वन को स्केल या केंद्रित करने के लिए इनपुट चर की आवश्यकता होती है?
मेरे इनपुट चर के विभिन्न आयाम हैं। कुछ चर दशमलव हैं जबकि कुछ सैकड़ों हैं। क्या यादृच्छिक वन का उपयोग करते समय डेटा को आयामहीन बनाने के लिए इन इनपुट चर को केंद्र (घटाना औसत) या स्केल (मानक विचलन द्वारा विभाजित) करना आवश्यक है?

2
तंत्रिका जाल: एक गर्म चर लगातार भारी?
मेरे पास कच्चा डेटा है जिसमें लगभग 20 कॉलम (20 सुविधाएँ) हैं। उनमें से दस निरंतर डेटा हैं और उनमें से 10 श्रेणीबद्ध हैं। श्रेणीबद्ध डेटा में से कुछ में 50 अलग-अलग मूल्य (यूएस स्टेट्स) हो सकते हैं। डेटा को पूर्व-संसाधित करने के बाद 10 निरंतर कॉलम 10 तैयार किए …

3
क्या एल्गोरिदम को एक-गर्म एन्कोडिंग की आवश्यकता होती है?
मुझे यकीन नहीं है कि गैर-क्रमबद्ध श्रेणीगत चर के लिए एक-हॉट एन्कोडिंग का उपयोग कब करना है और कब नहीं। जब भी एल्गोरिथ्म समानता की गणना करने के लिए दूरी मीट्रिक का उपयोग करता है, तो मैं इसका उपयोग करता हूं। क्या कोई भी अंगूठे का एक सामान्य नियम दे …

1
ट्रेन / वैध / परीक्षण सेट पर घटाव के बारे में प्रश्न
मैं डेटा प्रीप्रोसेस कर रहा हूं और बाद में अपने डेटा पर एक कॉनवॉनेट बनाने जा रहा हूं। मेरा प्रश्न है: कहो कि मेरे पास 100 छवियों के साथ कुल डेटा सेट है, मैं प्रत्येक 100 छवियों में से प्रत्येक के लिए माध्य की गणना कर रहा था और फिर …

2
बाल्टीकरण क्या है?
मैं मशीन लर्निंग में "बकेटाइजेशन" का स्पष्ट विवरण खोजने के लिए चारों ओर जा रहा हूं। मैं अब तक जो समझ रहा हूं वह यह है कि बकेटिटेज डिजिटल सिग्नल प्रोसेसिंग में क्वांटिज़ेशन के समान है जहां निरंतर मूल्यों की एक श्रृंखला को एक अलग मूल्य के साथ बदल दिया …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.