डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

5
मशीन लर्निंग में आयाम-होपिंग
मशीन लर्निंग में समस्या को रोकने का आयाम क्या है (कन्वेन्शनल न्यूरल नेटवर्क और इमेज रिकॉग्निशन में)? मैं इसके बारे में गुगली कर चुका हूं, लेकिन मुझे जो कुछ भी मिला है वह भौतिक आकार विकृति के भौतिकी पर जानकारी है। यह मेरे लिए अधिक उपयोगी होगा यदि कोई इसे …

3
हमें एक डेटासेट को असंतुलित कब मानना ​​चाहिए?
मैं ऐसी स्थिति का सामना कर रहा हूं, जहां एक डेटासेट में सकारात्मक और नकारात्मक उदाहरणों की संख्या असंतुलित है। मेरा प्रश्न यह है कि क्या अंगूठे के कोई नियम हैं जो हमें बताते हैं कि जब हम डेटासेट में किसी प्रकार का संतुलन बनाने के लिए बड़ी श्रेणी को …

3
Word2Vec और Doc2Vec दोनों वितरणात्मक प्रतिनिधित्व या वितरित प्रतिनिधित्व हैं?
मैंने पढ़ा है कि वितरणात्मक प्रतिनिधित्व वितरण संबंधी परिकल्पना पर आधारित है जो समान संदर्भ में होने वाले शब्दों के समान अर्थ रखता है। Word2Vec और Doc2Vec दोनों इसी परिकल्पना के अनुसार बनाए गए हैं। लेकिन, मूल पेपर में, यहां तक ​​कि उन्हें शीर्षक के रूप में Distributed representation of …

2
पायथन मशीन लर्निंग / डाटा साइंस प्रोजेक्ट स्ट्रक्चर
मुझे जानकारी मिल रही है कि पायथन मशीन लर्निंग प्रोजेक्ट को कैसे व्यवस्थित किया जाना चाहिए। पाइथन की सामान्य परियोजनाओं के लिए कुकिसेटर है और आर प्रोजेक्टटेम्पलेट के लिए । यह मेरी वर्तमान फ़ोल्डर संरचना है, लेकिन मैं ज्यूपिटर नोटबुक को वास्तविक पायथन कोड के साथ मिला रहा हूं और …
10 python 

2
ggvis बनाम ggplot2 + चमकदार; इंटरएक्टिव विज़ुअलाइज़ेशन के लिए कौन सा चुनना है?
CrossValidated में यहां एक समान प्रश्न है, और मैंने जवाब पढ़ा है। मेरा सवाल थोड़ा अलग है। मैं केवल अपने डेटा की कल्पना नहीं करना चाहता, और वास्तव में जो मैं कल्पना करना चाहता हूं वह या तो पैकेज के साथ कल्पना करना आसान नहीं है। मेरे प्लॉट पर दो …

2
SQL टेबल पर स्वचालित विसंगति का पता लगाने के लिए उपकरण?
मेरे पास एक बड़ी SQL टेबल है जो अनिवार्य रूप से एक लॉग है। डेटा बहुत जटिल है और मैं सभी डेटा को समझने के बिना विसंगतियों की पहचान करने के लिए कोई रास्ता खोजने की कोशिश कर रहा हूं। मुझे एनोमली डिटेक्शन के लिए बहुत सारे उपकरण मिले हैं, …

2
आर में डेटा विज्ञान के लिए सॉफ्टवेयर परीक्षण
मैं अक्सर अपने पायथन कोड का परीक्षण करते समय नाक, टॉक्स या यूनीटेस्ट का उपयोग करता हूं, विशेष रूप से जब इसे अन्य मॉड्यूल या कोड के अन्य टुकड़ों के साथ एकीकृत करना होता है। हालाँकि, अब मैंने खुद को ML मॉडलिंग और विकास के लिए R से अधिक अजगर …

3
एक बेयर्स नेटवर्क में किनारों की दिशा अप्रासंगिक है?
आज, एक व्याख्यान में यह दावा किया गया था कि एक बेय्स नेटवर्क में किनारों की दिशा वास्तव में मायने नहीं रखती है। उन्हें कार्य-कारण का प्रतिनिधित्व नहीं करना है। यह स्पष्ट है कि आप किसी एक किनारे को बेय्स नेटवर्क में स्विच नहीं कर सकते। उदाहरण के लिए, को …

1
हार्टिगन-वोंग k- साधन विधि और अन्य एल्गोरिदम में अभिसरण
मैं मुख्य रूप statsसे Rभाषा के पैकेज में लागू किए गए अलग-अलग के-मतलब क्लस्टर एल्गोरिदम को समझने की कोशिश कर रहा हूं । मैं लॉयड के एल्गोरिथ्म और मैकक्वीन के ऑनलाइन एल्गोरिथ्म को समझता हूं। जिस तरह से मैं उन्हें समझता हूं वह इस प्रकार है: लॉयड्स का एल्गोरिथम: प्रारंभ …
10 r  clustering  k-means 

2
समस्या स्थान बहुत बड़ा होने पर AI कैसे कार्य करना सीखता है
मैं प्रयोग और उदाहरण के माध्यम से सबसे अच्छा सीखता हूं। मैं तंत्रिका नेटवर्क के बारे में सीख रहा हूं और मेरे पास (जो मुझे लगता है) वर्गीकरण और प्रतिगमन की एक बहुत अच्छी समझ है और पर्यवेक्षित और अनुपयोगी शिक्षा भी है, लेकिन मैंने कुछ ऐसा किया है जिसे …

1
पाठ-वर्गीकरण-समस्या: क्या Word2Vec / NN सबसे अच्छा तरीका है?
मैं एक ऐसी प्रणाली डिजाइन करना चाह रहा हूं, जिसमें पाठ का एक पैराग्राफ दिया गया है, जो इसे वर्गीकृत करने और संदर्भ की पहचान करने में सक्षम होगा: उपयोगकर्ता द्वारा उत्पन्न पाठ पैराग्राफ (जैसे टिप्पणी / प्रश्न / उत्तर) के साथ प्रशिक्षित किया जाता है प्रशिक्षण सेट में प्रत्येक …

1
मशीन लर्निंग का उपयोग कर सर्वर लॉग विश्लेषण
हमारे कार्य के सर्वर लॉग का विश्लेषण करने के लिए मुझे यह कार्य सौंपा गया था जिसमें अपवाद लॉग, डेटाबेस लॉग इवेंट लॉग आदि शामिल हैं। मैं मशीन सीखने के लिए नया हूं, हम लोचदार खोज और स्पार्क्स एमएललिब (या प्रिडिक्शनियो) के साथ स्पार्क का उपयोग करते हैं। वांछित का …

2
सहकारी सुदृढीकरण सीखना
मेरे पास पहले से ही एक कार्यशील कार्यान्वयन है जो एक गतिशील मूल्य निर्धारण समस्या पर काम कर रहा है जो राजस्व को अधिकतम करने के लक्ष्य के साथ है। हालांकि, मैं जिस समस्या के साथ काम कर रहा हूं, उसमें कई अलग-अलग उत्पाद शामिल हैं जो एक-दूसरे के लिए …

1
AutoEncoders को बदलना
मैंने अभी ऑटोएन्कोडर्स बदलने पर ज्योफ हिंटन का पेपर पढ़ा है हिंटन, क्रिज़ेव्स्की और वांग: ट्रांसफॉर्मिंग ऑटो-एनकोडर । आर्टिफिशियल न्यूरल नेटवर्क्स एंड मशीन लर्निंग, 2011 में। और काफी कुछ इस तरह से खेलना चाहते हैं। लेकिन इसे पढ़ने के बाद मुझे इस बात पर पर्याप्त विवरण नहीं मिल सका कि …

7
डेटा विज्ञान परियोजनाओं को चरणबद्ध तरीके से समझाया गया है?
मैं एक वेबसाइट या पुस्तक की तलाश कर रहा हूं, जहां कई व्यावहारिक उदाहरणों को चरण-दर-चरण दिया गया है, यह बताते हुए कि वे प्रासंगिक सुविधाओं, मॉडल चयन प्रक्रिया आदि का चयन कैसे करते हैं ...

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.