डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
क्या MongoDB के लिए लिखे गए मैप-कम एल्गोरिदम को बाद में Hadoop में पोर्ट किया जा सकता है?
हमारी कंपनी में, हमारे पास एक MongoDB डेटाबेस है जिसमें बहुत से असंरचित डेटा हैं, जिस पर हमें रिपोर्ट और अन्य विश्लेषण उत्पन्न करने के लिए मैप-कम एल्गोरिदम को चलाने की आवश्यकता है। आवश्यक विश्लेषणों को लागू करने के लिए हमारे पास दो दृष्टिकोण हैं: एक दृष्टिकोण मानगोडीबी से एक …

2
LSTM की किन परतों पर ड्रॉपआउट?
LSTMड्रॉप - आउट के साथ एक बहु-परत का उपयोग करना , क्या सभी छिपी हुई परतों के साथ-साथ आउटपुट घने परतों पर ड्रॉपआउट डालना उचित है? हिंटन के पेपर में (जिसने ड्रॉपआउट का प्रस्ताव रखा) उसने केवल ड्राउट परतों पर ड्रॉपआउट रखा, लेकिन ऐसा इसलिए था क्योंकि छिपी हुई आंतरिक …

3
मैं श्रेणीबद्ध डेटा के साथ वर्गीकरण कैसे कर सकता हूं जो तय नहीं है?
मुझे श्रेणीबद्ध और संख्यात्मक डेटा दोनों के साथ एक वर्गीकरण समस्या है। मुझे जो समस्या आ रही है, वह यह है कि मेरा श्रेणीबद्ध डेटा तय नहीं है, इसका मतलब यह है कि जिस नए उम्मीदवार के लिए मैं भविष्यवाणी करना चाहता हूं, उसके पास एक नई श्रेणी हो सकती …

1
ग्राफ़ संरचित डेटा पर Scikit-Learn Label Propagation का उपयोग कैसे करें?
मेरे शोध के भाग के रूप में, मैं एक ग्राफ पर लेबल प्रसार करने में रुचि रखता हूं। मुझे उन दो तरीकों में विशेष रूप से दिलचस्पी है: ज़ियाओजिन ज़ू और ज़ौबिन घर्रामानी। लेबल प्रसार के साथ लेबल और लेबल रहित डेटा से सीखना। तकनीकी रिपोर्ट CMU-CALD-02-107, कार्नेगी मेलन विश्वविद्यालय, …

5
अनसुचित छवि विभाजन
मैं एक एल्गोरिथ्म को लागू करने की कोशिश कर रहा हूं जहां एक विमान की मेज पर कई वस्तुओं के साथ एक छवि दी गई है, वांछित प्रत्येक वस्तु के लिए विभाजन मास्क का उत्पादन है। सीएनएन के विपरीत, यहां का उद्देश्य अपरिचित वातावरण में वस्तुओं का पता लगाना है। …

3
हैशिंग वेक्टाइज़र और एक tfidf वेक्टराइज़र के बीच अंतर क्या है
मैं प्रत्येक दस्तावेज़ के लिए पाठ दस्तावेज़ों के शब्द वैक्टर में परिवर्तित कर रहा हूँ। मैं एक TfidfVectorizer और एक HashingVectorizer का उपयोग करके यह कोशिश की है मैं समझता हूं कि अंकों HashingVectorizerको IDFअंकों की तरह ध्यान में नहीं रखा जाता TfidfVectorizerहै। जिस कारण से मैं अभी भी काम …

1
मल्टी-मशीन मल्टी-कोर सीपीयू सिस्टम पर कार्स को चलाएं
मैं Seq2Seq मॉडल पर केआरएस से LSTM (थीनो पृष्ठभूमि का उपयोग करके) का उपयोग कर काम कर रहा हूं और मैं प्रक्रियाओं को समानांतर करना चाहूंगा, क्योंकि प्रशिक्षण के लिए भी कुछ एमबी डेटा की कई घंटों की आवश्यकता होती है। यह स्पष्ट है कि सीपीयू की तुलना में जीपीआर …

3
तंत्रिका नेटवर्क - हानि और सटीकता सहसंबंध
तंत्रिका नेटवर्क में हानि और सटीकता मेट्रिक्स के सह-अस्तित्व से मैं थोड़ा भ्रमित हूं। दोनों की तुलना की "शुद्धता" रेंडर करने के लिए अपेक्षा की जाती है yyy और y , है ना? तो प्रशिक्षण काल ​​में दो अतिरेक का आवेदन नहीं है? इसके अलावा, वे सहसंबद्ध क्यों नहीं हैं?y^y^\hat{y}

3
क्या TensorFlow एक पूरी मशीन लर्निंग लाइब्रेरी है?
मैं TensorFlow में नया हूं और मुझे इसका उपयोग करने से पहले TensorFlow की क्षमताओं और कमियों को समझना होगा। मुझे पता है कि यह एक गहरा सीखने का ढांचा है, लेकिन इसके अलावा जो अन्य मशीन लर्निंग एल्गोरिदम हैं, जिनका उपयोग हम टेंसर प्रवाह के साथ कर सकते हैं। …

2
संवैधानिक नेटवर्क में पूर्वाग्रह के बारे में प्रश्न
मैं यह पता लगाने की कोशिश कर रहा हूं कि CNN के लिए कितने वज़न और बायसेज़ की ज़रूरत है। मान लें कि मेरे पास एक (3, 32, 32) -image है और वह (32, 5, 5) -फिल्टर लगाना चाहता है। प्रत्येक फीचर मैप के लिए मेरे पास 5x5 वज़न है, …

4
कौन सा पहला: एल्गोरिदम बेंचमार्किंग, फीचर चयन, पैरामीटर ट्यूनिंग?
जब एक वर्गीकरण करने की कोशिश कर रहा है, मेरा दृष्टिकोण वर्तमान में है पहले विभिन्न एल्गोरिदम आज़माएं और उन्हें बेंचमार्क करें ऊपर से सर्वश्रेष्ठ एल्गोरिथ्म पर सुविधा चयन करें चयनित सुविधाओं और एल्गोरिथ्म का उपयोग करते हुए मापदंडों को ट्यून करें हालाँकि, मैं अक्सर खुद को नहीं समझा सकता …

3
क्या प्रतिगमन पेड़ लगातार भविष्यवाणी कर सकते हैं?
मान लीजिए कि मेरे पास जैसा एक सुचारू फ़ंक्शन है । मेरे पास एक प्रशिक्षण सेट D \ subsetneq \ {(x, y), f (x, y)) है (एक्स, वाई) \ में \ mathbb {R} ^ 2 \} और, ज़ाहिर है, मैं नहीं जानता कि च हालांकि मैं मूल्यांकन कर सकते हैं …

2
Pyspark में संख्यात्मक डेटा को श्रेणीबद्ध डेटा कैसे परिवर्तित करें
मैं pyspark अनुप्रयोगों के साथ काम करने के लिए Ipython नोटबुक का उपयोग कर रहा हूं। मेरे पास CSV फ़ाइल है जिसमें यह निर्धारित करने के लिए कई श्रेणीगत कॉलम हैं कि आय 50k से अधिक है या नहीं। मैं आय सीमा निर्धारित करने के लिए सभी आदानों को लेते …

3
मल्टीपार्टी सिस्टम में चुनाव के परिणाम की गणना करने के लिए किस प्रतिगमन का उपयोग करें?
मैं संसदीय चुनावों के परिणाम के लिए एक भविष्यवाणी करना चाहता हूं। मेरा आउटपुट प्रत्येक पार्टी को प्राप्त होने वाला% होगा। 2 से अधिक पार्टियां हैं इसलिए लॉजिस्टिक रिग्रेशन व्यवहार्य विकल्प नहीं है। मैं प्रत्येक पार्टी के लिए एक अलग प्रतिगमन कर सकता था, लेकिन उस स्थिति में परिणाम किसी …

2
फ़ीचर स्केलिंग का परिणाम
मैं वर्तमान में SVM का उपयोग कर रहा हूं और अपने प्रशिक्षण सुविधाओं को [0,1] की सीमा तक बढ़ा रहा हूं। मैं अपने प्रशिक्षण सेट को पहले फिट / रूपांतरित करता हूँ और फिर उसी परिवर्तन को अपने परीक्षण सेट में लागू करता हूँ। उदाहरण के लिए: ### Configure transformation …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.