डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

7
पायथन लाइब्रेरी जो मल्टी-लेबल वर्गीकरण के लिए भ्रम मैट्रिक्स की गणना कर सकती है
मैं एक पायथन लाइब्रेरी की तलाश कर रहा हूं जो मल्टी-लेबल वर्गीकरण के लिए भ्रम मैट्रिक्स की गणना कर सकती है । जानकारी के लिए: scikit-learn भ्रम मैट्रिक्स के लिए मल्टी-लेबल का समर्थन नहीं करता है ) Multiclass और Multilabel Problem में क्या अंतर है

2
अमेज़न पर उपयोगकर्ता के खरीद व्यवहार को कैसे मॉडल करें?
डेटा साइंस में हमारी अंतिम पाठ्यक्रम परियोजना के लिए, हमने निम्नलिखित का प्रस्ताव दिया- अमेज़ॅन की समीक्षा डेटासैट को दें , हम एक एल्गोरिथ्म के साथ आने की योजना बनाते हैं (जो कि निजीकृत पेजरैंक पर आधारित है) जो अमेज़ॅन पर विज्ञापन रखने के लिए एक रणनीतिक स्थिति निर्धारित करता …

3
वाक्य विश्लेषण ट्यूटोरियल
मैं भावना विश्लेषण और किसी भी भाषा (आर, पायथन आदि) का उपयोग करके इसे लागू करने का तरीका समझने की कोशिश कर रहा हूं। मैं जानना चाहूंगा कि क्या ट्यूटोरियल के लिए इंटरनेट पर कोई अच्छी जगह है जिसका मैं अनुसरण कर सकता हूं। मैंने गुगली की, लेकिन मैं बहुत …

2
वेक्टर अनुक्रमों का वर्गीकरण
मेरा डेटासेट वेक्टर अनुक्रमों से युक्त है। प्रत्येक वेक्टर में 50 वास्तविक-मूल्यवान आयाम हैं। एक क्रम में वैक्टर की संख्या 3-5 से 10-15 तक होती है। दूसरे शब्दों में, एक अनुक्रम की लंबाई तय नहीं है। सीक्वेंस की कुछ उचित मात्रा (वैक्टर नहीं!) को एक वर्ग लेबल के साथ एनोटेट …

1
पंडों के डेटाफ्रेम से बाइनरी एनकोड मल्टी-वैल्युएबल श्रेणीबद्ध चर कैसे करें?
मान लें कि हमारे पास एक निश्चित कॉलम के लिए कई मानों के साथ निम्नलिखित डेटाफ़्रेम हैं: categories 0 - ["A", "B"] 1 - ["B", "C", "D"] 2 - ["B", "D"] हम इस तरह से एक टेबल कैसे प्राप्त कर सकते हैं? "A" "B" "C" "D" 0 - 1 1 …
9 python  pandas 

1
समर्थन वेक्टर मशीनों के लिए फ़ीचर चयन
मेरा प्रश्न तीन गुना है वेक्टर मशीनों का "कर्नेलाइज़्ड" समर्थन के संदर्भ में क्या परिवर्तनीय / सुविधा चयन वांछनीय है - विशेष रूप से जब हम ओवरफ़िटिंग को रोकने के लिए पैरामीटर सी को नियमित करते हैं और एसवीएम के लिए कर्नेल को शुरू करने के पीछे मुख्य उद्देश्य समस्या …

5
गहरे सपने के आवेदन के बारे में कोई विचार?
हाल ही में Google ने दिलचस्प गहरे सपने का प्रचार किया। कला पीढ़ी जैसे http://deepdreamgenerator.com/ के अलावा , क्या आपको कंप्यूटर विज़न या मशीन लर्निंग में गहरे सपने के कोई संभावित अनुप्रयोग दिखाई देते हैं?

2
कुलपति आयाम और स्वतंत्रता की डिग्री के बीच संबंध
मैं मशीन लर्निंग का अध्ययन कर रहा हूं और मुझे लगता है कि कुलपति आयाम की अवधारणा और स्वतंत्रता की डिग्री के अधिक शास्त्रीय (सांख्यिकीय) अवधारणा के बीच एक मजबूत संबंध है। क्या कोई ऐसे संबंध की व्याख्या कर सकता है?

1
NER के लिए Vowpal Wabbit का उपयोग करना
Vowpal Wabbit (VW) स्पष्ट रूप से SEARN के माध्यम से अनुक्रम टैगिंग कार्यक्षमता का समर्थन करता है । समस्या यह है कि मैं स्पष्टीकरण के साथ और कुछ उदाहरणों के साथ कहीं भी विस्तृत पैरामीटर सूची नहीं पा सकता हूं। सबसे अच्छा मुझे मिल सकता है Zinkov के ब्लॉग प्रविष्टि …

2
क्या एक ऐसी विधि है जो आयामीता में कमी के विपरीत है?
मैं मशीन लर्निंग के क्षेत्र में नया हूं, लेकिन सिग्नल प्रोसेसिंग के अपने हिस्से का काम किया है। कृपया मुझे बताएं कि क्या यह प्रश्न गलत समझा गया है। मेरे पास दो आयामी डेटा हैं जिन्हें कम से कम तीन चर द्वारा परिभाषित किया गया है, अत्यधिक गैर-रेखीय मॉडल तरीके …

2
अजगर में पूरक Naive Bayes लागू करना?
मुसीबत मैंने अपराध डेटा के एक लेबल डेटा सेट पर Naive बेयस का उपयोग करने की कोशिश की है लेकिन वास्तव में खराब परिणाम (7% सटीकता) मिला है। Naive Bayes मेरे द्वारा उपयोग किए जा रहे अन्य एलोगोरिथम्स की तुलना में बहुत तेज़ी से चलता है इसलिए मैं यह जानने …

1
क्या समय अनुक्रमित डेटा के लिए कोई अप्रशिक्षित शिक्षण एल्गोरिदम हैं?
मेरे डेटा में प्रत्येक अवलोकन को 0.1 सेकंड के अंतर के साथ एकत्र किया गया था। मैं इसे टाइम सीरीज़ नहीं कहता क्योंकि इसमें डेट और टाइम स्टैम्प नहीं है। क्लस्टरिंग एल्गोरिदम (मैंने ऑनलाइन पाया) के उदाहरणों में और पीसीए नमूना डेटा में प्रति मामले में 1 अवलोकन है और …

3
Amazon ec2 त्रुटि पर यादृच्छिक वन: आकार का वेक्टर आवंटित नहीं कर सकते 5.4 Gb
मैं randomForest()लगभग 20 भविष्यवक्ताओं और 600K पंक्तियों के साथ 1000 पेड़ों और डेटा फ़्रेमों का उपयोग करके आर में यादृच्छिक वन मॉडल का प्रशिक्षण दे रहा हूं । मेरे लैपटॉप पर सब कुछ ठीक काम करता है, लेकिन जब मैं amazon ec2 में जाता हूं, उसी चीज को चलाने के …

2
अव्यक्त डिरिचलेट आवंटन से प्राप्त विषयों का उपयोग करते हुए दस्तावेजों की क्लस्टरिंग
मैं एक परियोजना के लिए अव्यक्त डिरिचलेट आवंटन का उपयोग करना चाहता हूं और मैं gensim पुस्तकालय के साथ पायथन का उपयोग कर रहा हूं। विषयों को खोजने के बाद, मैं एक एल्गोरिथ्म का उपयोग करके दस्तावेजों को क्लस्टर करना चाहूंगा जैसे कि के-मीन्स (आदर्श रूप से मैं क्लस्टर्स को …

2
बैच और व्यक्तिगत अपडेट के बीच एमएलपी में नियमितीकरण में कोई अंतर?
मैंने ओवर-फिटिंग को नियंत्रित करने के लिए एक दृष्टिकोण के रूप में नियमितीकरण के बारे में सीखा है, और मैं बैकप्रॉपगैशन और मल्टीलेयर परसेप्ट्रॉन (एमएलपी) के एक सरल कार्यान्वयन में विचार को शामिल करना चाहूंगा । वर्तमान में ओवर-फिटिंग से बचने के लिए, मैं क्रॉस-वेलिडेट करता हूं और सत्यापन सेट …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.