डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

10
विखंडनशील परतें क्या हैं?
मैंने हाल ही में जोनाथन लॉन्ग, इवान शेल्मर, ट्रेवर डेरेल द्वारा सिमेंटिक सेग्मेंटेशन के लिए पूरी तरह से कन्वेंशनल नेटवर्क पढ़ा । मुझे समझ में नहीं आता है कि "deconvolutional परतों" क्या / कैसे वे काम करते हैं। प्रासंगिक हिस्सा है 3.3। अपसम्पलिंग पीछे की ओर दी गई सजा है ...

30
सार्वजनिक रूप से उपलब्ध डेटासेट
डेटा विज्ञान में आम समस्याओं में से एक उच्च स्तरीय विश्लेषण करने के लिए विभिन्न स्रोतों से डेटा को किसी तरह से साफ (अर्ध-संरचित) प्रारूप में इकट्ठा करना और विभिन्न स्रोतों से मैट्रिक्स का संयोजन करना है। इस साइट पर अन्य लोगों के प्रयास, विशेष रूप से अन्य प्रश्नों को ...

13
K- मीन्स मिश्रित संख्यात्मक और श्रेणीबद्ध डेटा के लिए क्लस्टरिंग है
मेरे डेटा सेट में कई संख्यात्मक विशेषताएँ और एक श्रेणीबद्ध है। कहो NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, जहां CategoricalAttrतीन संभावित एक मान लेता है: CategoricalAttrValue1, CategoricalAttrValue2या CategoricalAttrValue3। मैं ऑक्टेव https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ के लिए डिफ़ॉल्ट k- साधन क्लस्टरिंग कार्यान्वयन का उपयोग कर रहा हूं । यह केवल संख्यात्मक डेटा के साथ काम ...

17
तंत्रिका नेटवर्क के लिए सबसे अच्छा अजगर पुस्तकालय
मैं विभिन्न मशीन सीखने की समस्याओं को हल करने के लिए तंत्रिका नेटवर्क का उपयोग कर रहा हूं। मैं पायथन और पाइब्रेन का उपयोग कर रहा हूं लेकिन यह लाइब्रेरी लगभग बंद है। क्या पायथन में अन्य अच्छे विकल्प हैं?

8
केरस में असंतुलित वर्गों के लिए वर्ग भार कैसे सेट करें?
मुझे पता है कि class_weightsफिटिंग में पैरामीटर शब्दकोश के साथ केरस में एक संभावना है , लेकिन मुझे कोई उदाहरण नहीं मिला। क्या कोई ऐसा प्रदान करना चाहेगा? वैसे, इस मामले में उपयुक्त प्रैक्सिस केवल अल्पसंख्यक वर्ग को आनुपातिक रूप से अपने अंडरप्रिटेशन के लिए भारित करने के लिए है?

5
तंत्रिका नेटवर्क में "मर रहा है ReLU" समस्या क्या है?
दृश्य मान्यता के लिए संवैधानिक तंत्रिका नेटवर्क पर स्टैनफोर्ड पाठ्यक्रम नोट्स का उल्लेख करते हुए , एक पैराग्राफ कहता है: "दुर्भाग्य से, प्रशिक्षण के दौरान ReLU इकाइयाँ नाजुक हो सकती हैं और" मर "सकती हैं। उदाहरण के लिए, एक ReLU न्यूरॉन के माध्यम से बहने वाली एक बड़ी ढाल इस ...

5
तंत्रिका नेटवर्क में क्रॉस-एन्ट्रापी त्रुटि फ़ंक्शन
में एमएल शुरुआती के लिए MNIST वे के रूप में क्रोस एंट्रोपी को परिभाषित Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) वर्ग के लिए भविष्यवाणी की संभावना मूल्य है मैं और y ' मैं उस वर्ग के लिए सच संभावना है।yiyiy_iiiiy′iyi′y_i' प्रश्न 1 क्या यह एक समस्या नहीं है ...

8
Scikit_learn मॉडल में फिट और fit_transform के बीच अंतर?
मैं डेटा साइंस के लिए नौसिखिया हूं और मुझे स्किकिट-लर्न में अंतर fitऔर fit_transformतरीकों के बारे में समझ नहीं है । क्या कोई केवल यह बता सकता है कि हमें डेटा बदलने की आवश्यकता क्यों हो सकती है? प्रशिक्षण डेटा पर फिटिंग मॉडल और परीक्षण डेटा को बदलने का क्या ...

6
एक मल्टीकासल वर्गीकरण सेटिंग में माइक्रो औसत बनाम मैक्रो औसत प्रदर्शन
मैं 3 वर्गों के साथ एक मल्टीस्केलर वर्गीकरण सेटिंग की कोशिश कर रहा हूं। 3 में से 1 कक्षा में गिरने वाले अधिकांश डेटा के साथ वर्ग वितरण तिरछा है। (वर्ग लेबल 1,2,3 रहा, जिसमें 67.28% डेटा कक्षा लेबल 1, 11.99% डेटा कक्षा 2 में और कक्षा 3 में शेष ...

15
मशीन सीखने के लिए पायथन बनाम आर
मैं सिर्फ शैक्षणिक उद्देश्यों के लिए मशीन लर्निंग एप्लीकेशन विकसित करना शुरू कर रहा हूं । मैं वर्तमान में आर का उपयोग कर रहा हूं और इसमें खुद को प्रशिक्षित कर रहा हूं । हालांकि, बहुत सी जगहों पर, मैंने लोगों को पायथन का उपयोग करते हुए देखा है । ...

3
कब एक हॉट एन्कोडिंग बनाम लेबलइंकोडर बनाम डिक्टेक्टरिज़ोर का उपयोग करें?
मैं कुछ समय के लिए श्रेणीबद्ध डेटा वाले मॉडल का निर्माण कर रहा हूं और जब इस स्थिति में मैं मूल रूप से एक मॉडल बनाने से पहले इस डेटा को बदलने के लिए scikit-learn's LabelEncoder फ़ंक्शन का उपयोग करने के लिए डिफ़ॉल्ट हूं। मैं उनके बीच अंतर को समझता ...

6
LSTM पर GRU का उपयोग कब करें?
एक GRU और एक LSTM के बीच मुख्य अंतर यह है कि एक GRU में दो गेट ( रीसेट और अपडेट गेट्स) होते हैं जबकि एक LSTM में तीन गेट होते हैं (जैसे इनपुट , आउटपुट और गेट्स भूल जाते हैं)। जब हम स्पष्ट रूप से LSTM मॉडल के माध्यम ...

12
कितना बड़ा डेटा है?
बहुत से लोग इस शब्द का इस्तेमाल बड़े डेटा एक नहीं बल्कि में वाणिज्यिक , जिस तरह से यह दर्शाता है कि बड़े डेटासेट गणना में शामिल कर रहे हैं, और इसलिए संभावित समाधानों अच्छा प्रदर्शन होना आवश्यक है के एक साधन के रूप में। बेशक, बड़ा डेटा हमेशा संबद्ध ...

8
एक सीखने की दर का चयन
मैं वर्तमान में स्टोकेस्टिक ग्रैडिएंट डिसेंट को लागू करने पर काम कर रहा हूं, SGDपीछे के प्रसार का उपयोग करते हुए तंत्रिका जाल के लिए, और जब मैं इसके उद्देश्य को समझता हूं तो मुझे कुछ सवाल हैं कि सीखने की दर के लिए मूल्यों का चयन कैसे करें। क्या ...

15
आप तंत्रिका नेटवर्क आर्किटेक्चर की कल्पना कैसे करते हैं?
जब एक पेपर लिखना / किसी विषय के बारे में प्रस्तुति देना जो तंत्रिका नेटवर्क के बारे में है, तो आमतौर पर नेटवर्क वास्तुकला की कल्पना करता है। स्वचालित रूप से सामान्य आर्किटेक्चर की कल्पना करने के अच्छे / सरल तरीके क्या हैं?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.