डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

6
बड़े डेटा के साथ SVD और PCA कैसे करें?
मेरे पास डेटा (लगभग 8GB) का एक बड़ा सेट है। मैं इसका विश्लेषण करने के लिए मशीन लर्निंग का उपयोग करना चाहूंगा। इसलिए, मुझे लगता है कि दक्षता के लिए डेटा की गतिशीलता को कम करने के लिए मुझे SVD तो PCA का उपयोग करना चाहिए। हालाँकि, MATLAB और ऑक्टेव …

6
क्या सुविधा इंजीनियरिंग के लिए कोई उपकरण हैं?
विशेष रूप से मैं जो देख रहा हूं वह कुछ कार्यक्षमता वाले उपकरण हैं, जो कि इंजीनियरिंग की विशेषता है। मैं एमएस एक्सेल के समान कुछ आसानी से आसानी से देखने, कल्पना करने, अंतराल को भरने आदि में सक्षम होना चाहूंगा, लेकिन इसमें वीबी के बजाय अंतर्निहित भाषा के रूप …

4
बाद की संकेंद्रण परतें कैसे काम करती हैं?
यह सवाल उबलता है "कैसे कनवल्शन लेयर्स बिल्कुल काम करती हैं। मान लीजिए कि मेरे पास एक greyscale छवि है। तो छवि में एक चैनल है। पहली परत में, मैं फ़िल्टर और पैडिंग के साथ कनवल्शन लागू करता हूं । फिर मेरे पास कनवल्शन और फ़िल्टर के साथ एक और …

4
अत्यधिक असंतुलित डेटा सेट के प्रशिक्षण में त्वरित मार्गदर्शिका
मुझे प्रशिक्षण सेट में लगभग 1000 सकारात्मक और 10000 नकारात्मक नमूनों के साथ एक वर्गीकरण समस्या है। इसलिए यह डेटा सेट काफी असंतुलित है। सादा यादृच्छिक वन बस सभी परीक्षण नमूनों को एक बहुसंख्यक वर्ग के रूप में चिह्नित करने की कोशिश कर रहा है। उप-नमूने और भारित यादृच्छिक वन …

3
एक तंत्रिका नेटवर्क के प्रशिक्षण के लिए सीपीयू और जीपीयू के बीच चयन
मैंने एक जीपीयू के 'ओवरहेड' के बारे में चर्चा की है, और 'छोटे' नेटवर्क के लिए, यह वास्तव में एक जीपीयू की तुलना में सीपीयू (या सीपीयू के नेटवर्क) पर प्रशिक्षित करने के लिए तेज़ हो सकता है। 'छोटा' से क्या तात्पर्य है? उदाहरण के लिए, क्या 100 छिपी इकाइयों …

3
पदानुक्रमित डेटा प्रारूप। वैकल्पिक प्रारूपों की तुलना में क्या फायदे हैं?
एचडीएफ में डेटा संग्रहीत करने से मुख्य लाभ क्या हैं? और एचडीएफ वास्तव में उपयुक्त और उपयोगी है, जहां मुख्य डेटा विज्ञान कार्य क्या हैं?

4
तंत्रिका नेटवर्क पार्स स्ट्रिंग डेटा?
इसलिए, मैं अभी सीखना शुरू कर रहा हूं कि कैसे एक तंत्रिका नेटवर्क पैटर्न को पहचानने और आदानों को वर्गीकृत करने के लिए काम कर सकता है, और मैंने देखा है कि एक कृत्रिम तंत्रिका नेटवर्क छवि डेटा को पार्स और छवियों को वर्गीकृत कर सकता है ( डेमोनेटेक्स के …

4
SVM पर और इसके विपरीत रैंडम फ़ॉरेस्ट का उपयोग कब करें?
जब कोई Random Forestओवर SVMऔर इसके विपरीत इस्तेमाल करेगा ? मैं समझता हूं कि cross-validationऔर मॉडल तुलना एक मॉडल को चुनने का एक महत्वपूर्ण पहलू है, लेकिन यहां मैं दो तरीकों के अंगूठे और यकृत के नियमों के बारे में अधिक जानना चाहूंगा। क्या कोई सहपाठियों की सूक्ष्मताओं, शक्तियों और …

4
रिज्यूम डेटा के आधार पर जॉब क्लासिफिकेशन करने के लिए मुझे किन एल्गोरिदम का इस्तेमाल करना चाहिए?
ध्यान दें कि मैं आर में सब कुछ कर रहा हूं। समस्या इस प्रकार है: मूल रूप से, मेरे पास रिज्यूमे (सीवी) की एक सूची है। कुछ उम्मीदवारों को पहले काम का अनुभव होगा और कुछ को नहीं। यहाँ लक्ष्य है: उनके सीवी पर पाठ के आधार पर, मैं उन्हें …

4
क्या एक मॉडल को फिर से प्रशिक्षित किया जाना चाहिए यदि नई टिप्पणियां उपलब्ध हैं?
इसलिए, मुझे इस विषय पर कोई साहित्य नहीं मिला है, लेकिन ऐसा लगता है जैसे कुछ विचार देने लायक है: यदि नए अवलोकन उपलब्ध हैं, तो मॉडल प्रशिक्षण और अनुकूलन में सर्वोत्तम अभ्यास क्या हैं? क्या भविष्यवाणियों को नीचा दिखाना शुरू करने से पहले किसी मॉडल को फिर से प्रशिक्षित …

3
MultiOutputClassifier से predict_proba को समझना
मैं एक रैंडम फ़ॉरेस्ट मॉडल के साथ एक मल्टीपाउट वर्गीकरण करने के लिए scikit-learn वेबसाइट पर इस उदाहरण का अनुसरण कर रहा हूं । from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, …

6
मॉडल हाइपरपरमेटर्स और मॉडल मापदंडों के बीच अंतर क्या है?
मैंने देखा है कि मॉडल हाइपरपरमीटर और मॉडल पैरामीटर जैसे शब्दों को पूर्व स्पष्टीकरण के बिना वेब पर परस्पर उपयोग किया गया है। मुझे लगता है कि यह गलत है और स्पष्टीकरण की आवश्यकता है। एक मशीन लर्निंग मॉडल पर विचार करें, एक एसवीएम / एनएन / एनबी आधारित क्लासिसिपेटर …

3
Hypertuning XGBoost पैरामीटर
XGBoost एक अच्छा काम कर रहा है, जब यह स्पष्ट और निरंतर निर्भर चर दोनों से निपटने की बात करता है। लेकिन, मैं एक XGBoost समस्या के लिए अनुकूलित मापदंडों का चयन कैसे करूं? यह है कि मैंने हाल ही में कागल समस्या के लिए पैरामीटर लागू किया है: param …
27 r  python  xgboost 

4
जैकार्ड समानता और कोसाइन समानता के लिए अनुप्रयोग और अंतर
आइटम समानता की तुलना करते समय जैकार्ड समानता और कोसाइन समानता दो बहुत ही सामान्य माप हैं। हालांकि, मैं इस स्थिति में बहुत स्पष्ट नहीं हूं कि किस स्थिति में किसी को दूसरे की तुलना में बेहतर होना चाहिए। क्या कोई इन दोनों मापों के अंतर (अवधारणा या सिद्धांत में …
27 similarity 

1
RNN कई विशेषताओं के साथ है
मेरे पास मशीन लर्निंग एल्गोरिदम (मूल यादृच्छिक वन और रैखिक प्रतिगमन प्रकार के सामान) के साथ काम करने का थोड़ा सा सिखाया गया ज्ञान है। मैंने शाखा लगाने का फैसला किया और आरएनएन को केर के साथ सीखना शुरू किया। जब अधिकांश उदाहरणों को देखते हुए, जिनमें आमतौर पर स्टॉक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.