तंत्रिका नेटवर्क के लिए सुविधाओं का चयन कैसे करें?


16

मुझे पता है कि इस प्रश्न का कोई स्पष्ट उत्तर नहीं है, लेकिन मान लीजिए कि मेरे पास एक विशाल तंत्रिका नेटवर्क है, जिसमें बहुत अधिक डेटा है और मैं इनपुट में एक नई सुविधा जोड़ना चाहता हूं। "सबसे अच्छा" तरीका यह होगा कि नई सुविधा के साथ नेटवर्क का परीक्षण करें और परिणाम देखें, लेकिन क्या यह परीक्षण करने की एक विधि है कि क्या सुविधा UNLIKELY सहायक है? सहसंबंध उपायों की तरह ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) आदि?


1
एक गैर यादृच्छिक सहसंबंध एक संकेतक है कि सुविधा हो सकता है उपयोगी। लेकिन मैं पूर्व प्रशिक्षण परीक्षणों के बारे में निश्चित नहीं हूं जो विचारों को नियंत्रित कर सकते हैं। आपके द्वारा लिंक किया गया पेपर यह स्पष्ट करता है कि उपलब्ध परीक्षणों द्वारा गैर-रेखीय सहसंबंधों का अच्छी तरह से पता नहीं लगाया जा सकता है, लेकिन एक तंत्रिका जाल में उन्हें खोजने और उपयोग करने का एक मौका है।
नील स्लेटर

जवाबों:


16

नई सुविधा और मौजूदा विशेषता के बीच एक बहुत मजबूत संबंध एक अच्छा संकेत है कि नई सुविधा थोड़ी नई जानकारी प्रदान करती है। नई सुविधा और मौजूदा सुविधाओं के बीच कम सहसंबंध बेहतर होने की संभावना है।

नई सुविधा और अनुमानित चर के बीच एक मजबूत रैखिक सहसंबंध एक अच्छा संकेत है कि एक नई सुविधा मूल्यवान होगी, लेकिन उच्च सहसंबंध की अनुपस्थिति आवश्यक नहीं है एक खराब विशेषता का संकेत है, क्योंकि तंत्रिका नेटवर्क रैखिक संयोजनों तक सीमित नहीं हैं चर का।

यदि नई सुविधा को मौजूदा सुविधाओं के संयोजन से मैन्युअल रूप से निर्मित किया गया था, तो इसे छोड़ने पर विचार करें। तंत्रिका नेटवर्क की सुंदरता यह है कि थोड़ा फीचर इंजीनियरिंग और प्रीप्रोसेसिंग की आवश्यकता होती है - इसके बजाय मध्यवर्ती परतों द्वारा सुविधाओं को सीखा जाता है। जब भी संभव हो, उन्हें इंजीनियरिंग करने के लिए सीखने की सुविधाओं को प्राथमिकता दें।


मैंने हमेशा सुविधाओं के साथ भविष्यवाणी करने के लिए मूल्य की तुलना करने के लिए सोचा था, आप सुविधाओं के बीच सहसंबंध के बारे में बात कर रहे हैं। क्या आपका जवाब मेरे मामले पर भी लागू है? सिद्धांत रूप में मुझे केवल नई विशेषताओं को जोड़ना चाहिए जो कि भविष्यवाणी करने के लिए मूल्य से संबंधित हैं, है ना?
मार्कोडेना

यह भी एक मूल्यवान मीट्रिक है - बस मेरे जवाब को अद्यतन करने के लिए कि साथ ही साथ।
मैडिसन मई

संक्षेप में, भविष्यवाणी करने के लिए मूल्य के साथ मजबूत सहसंबंध एक महान संकेत है, लेकिन भविष्यवाणी के मूल्य के साथ कमजोर सहसंबंध आवश्यक रूप से एक बुरा संकेत नहीं है।
मैडिसन मई

धन्यवाद। मैं एक रिपोर्ट लिख रहा हूं और मैं सुविधाओं के औचित्य के लिए रैखिक / गैर-रेखीय सहसंबंध दिखाना चाहता था (परिणामों से पहले भी)। क्या इसका कोई अर्थ बनता है? आपके उत्तर से मैं सहसंबंधों का एक मैट्रिक्स बना सकता था, लेकिन शायद यह बकवास है
marcodena

1
मैं गैर-रेखीय सहसंबंधों का उपयोग करता हूं, लेकिन ठीक है धन्यवाद
marcodena

0

यदि आप स्केलेर का उपयोग कर रहे हैं, तो एक अच्छा फ़ंक्शन उपलब्ध है जिसे मॉडल कहा जाता है ।feature_importances_। इसे अपने मॉडल / नई सुविधा के साथ आज़माएं और देखें कि क्या यह मदद करता है। उदाहरण के लिए यहां और यहां भी देखें ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.