डेटा साइंस

5

मशीन लर्निंग में समस्या को रोकने का आयाम क्या है (कन्वेन्शनल न्यूरल नेटवर्क और इमेज रिकॉग्निशन में)? मैं इसके बारे में गुगली कर चुका हूं, लेकिन मुझे जो कुछ भी मिला है वह भौतिक आकार विकृति के भौतिकी पर जानकारी है। यह मेरे लिए अधिक उपयोगी होगा यदि कोई इसे …

10 machine-learning image-recognition

3

हमें एक डेटासेट को असंतुलित कब मानना चाहिए?

मैं ऐसी स्थिति का सामना कर रहा हूं, जहां एक डेटासेट में सकारात्मक और नकारात्मक उदाहरणों की संख्या असंतुलित है। मेरा प्रश्न यह है कि क्या अंगूठे के कोई नियम हैं जो हमें बताते हैं कि जब हम डेटासेट में किसी प्रकार का संतुलन बनाने के लिए बड़ी श्रेणी को …

10 classification dataset sampling class-imbalance

3

Word2Vec और Doc2Vec दोनों वितरणात्मक प्रतिनिधित्व या वितरित प्रतिनिधित्व हैं?

मैंने पढ़ा है कि वितरणात्मक प्रतिनिधित्व वितरण संबंधी परिकल्पना पर आधारित है जो समान संदर्भ में होने वाले शब्दों के समान अर्थ रखता है। Word2Vec और Doc2Vec दोनों इसी परिकल्पना के अनुसार बनाए गए हैं। लेकिन, मूल पेपर में, यहां तक कि उन्हें शीर्षक के रूप में Distributed representation of …

10 nlp word-embeddings terminology word2vec

2

पायथन मशीन लर्निंग / डाटा साइंस प्रोजेक्ट स्ट्रक्चर

मुझे जानकारी मिल रही है कि पायथन मशीन लर्निंग प्रोजेक्ट को कैसे व्यवस्थित किया जाना चाहिए। पाइथन की सामान्य परियोजनाओं के लिए कुकिसेटर है और आर प्रोजेक्टटेम्पलेट के लिए । यह मेरी वर्तमान फ़ोल्डर संरचना है, लेकिन मैं ज्यूपिटर नोटबुक को वास्तविक पायथन कोड के साथ मिला रहा हूं और …

10 python

2

ggvis बनाम ggplot2 + चमकदार; इंटरएक्टिव विज़ुअलाइज़ेशन के लिए कौन सा चुनना है?

CrossValidated में यहां एक समान प्रश्न है, और मैंने जवाब पढ़ा है। मेरा सवाल थोड़ा अलग है। मैं केवल अपने डेटा की कल्पना नहीं करना चाहता, और वास्तव में जो मैं कल्पना करना चाहता हूं वह या तो पैकेज के साथ कल्पना करना आसान नहीं है। मेरे प्लॉट पर दो …

10 r visualization ggplot2

2

SQL टेबल पर स्वचालित विसंगति का पता लगाने के लिए उपकरण?

मेरे पास एक बड़ी SQL टेबल है जो अनिवार्य रूप से एक लॉग है। डेटा बहुत जटिल है और मैं सभी डेटा को समझने के बिना विसंगतियों की पहचान करने के लिए कोई रास्ता खोजने की कोशिश कर रहा हूं। मुझे एनोमली डिटेक्शन के लिए बहुत सारे उपकरण मिले हैं, …

10 sql anomaly-detection outlier

2

आर में डेटा विज्ञान के लिए सॉफ्टवेयर परीक्षण

मैं अक्सर अपने पायथन कोड का परीक्षण करते समय नाक, टॉक्स या यूनीटेस्ट का उपयोग करता हूं, विशेष रूप से जब इसे अन्य मॉड्यूल या कोड के अन्य टुकड़ों के साथ एकीकृत करना होता है। हालाँकि, अब मैंने खुद को ML मॉडलिंग और विकास के लिए R से अधिक अजगर …

10 r software-development

3

एक बेयर्स नेटवर्क में किनारों की दिशा अप्रासंगिक है?

आज, एक व्याख्यान में यह दावा किया गया था कि एक बेय्स नेटवर्क में किनारों की दिशा वास्तव में मायने नहीं रखती है। उन्हें कार्य-कारण का प्रतिनिधित्व नहीं करना है। यह स्पष्ट है कि आप किसी एक किनारे को बेय्स नेटवर्क में स्विच नहीं कर सकते। उदाहरण के लिए, को …

10 bayesian-networks

1

हार्टिगन-वोंग k- साधन विधि और अन्य एल्गोरिदम में अभिसरण

मैं मुख्य रूप statsसे Rभाषा के पैकेज में लागू किए गए अलग-अलग के-मतलब क्लस्टर एल्गोरिदम को समझने की कोशिश कर रहा हूं । मैं लॉयड के एल्गोरिथ्म और मैकक्वीन के ऑनलाइन एल्गोरिथ्म को समझता हूं। जिस तरह से मैं उन्हें समझता हूं वह इस प्रकार है: लॉयड्स का एल्गोरिथम: प्रारंभ …

10 r clustering k-means

2

समस्या स्थान बहुत बड़ा होने पर AI कैसे कार्य करना सीखता है

मैं प्रयोग और उदाहरण के माध्यम से सबसे अच्छा सीखता हूं। मैं तंत्रिका नेटवर्क के बारे में सीख रहा हूं और मेरे पास (जो मुझे लगता है) वर्गीकरण और प्रतिगमन की एक बहुत अच्छी समझ है और पर्यवेक्षित और अनुपयोगी शिक्षा भी है, लेकिन मैंने कुछ ऐसा किया है जिसे …

10 machine-learning neural-network

1

पाठ-वर्गीकरण-समस्या: क्या Word2Vec / NN सबसे अच्छा तरीका है?

मैं एक ऐसी प्रणाली डिजाइन करना चाह रहा हूं, जिसमें पाठ का एक पैराग्राफ दिया गया है, जो इसे वर्गीकृत करने और संदर्भ की पहचान करने में सक्षम होगा: उपयोगकर्ता द्वारा उत्पन्न पाठ पैराग्राफ (जैसे टिप्पणी / प्रश्न / उत्तर) के साथ प्रशिक्षित किया जाता है प्रशिक्षण सेट में प्रत्येक …

10 neural-network text-mining multiclass-classification word-embeddings

1

मशीन लर्निंग का उपयोग कर सर्वर लॉग विश्लेषण

हमारे कार्य के सर्वर लॉग का विश्लेषण करने के लिए मुझे यह कार्य सौंपा गया था जिसमें अपवाद लॉग, डेटाबेस लॉग इवेंट लॉग आदि शामिल हैं। मैं मशीन सीखने के लिए नया हूं, हम लोचदार खोज और स्पार्क्स एमएललिब (या प्रिडिक्शनियो) के साथ स्पार्क का उपयोग करते हैं। वांछित का …

10 machine-learning predictive-modeling apache-spark

2

सहकारी सुदृढीकरण सीखना

मेरे पास पहले से ही एक कार्यशील कार्यान्वयन है जो एक गतिशील मूल्य निर्धारण समस्या पर काम कर रहा है जो राजस्व को अधिकतम करने के लक्ष्य के साथ है। हालांकि, मैं जिस समस्या के साथ काम कर रहा हूं, उसमें कई अलग-अलग उत्पाद शामिल हैं जो एक-दूसरे के लिए …

10 machine-learning reinforcement-learning

1

AutoEncoders को बदलना

मैंने अभी ऑटोएन्कोडर्स बदलने पर ज्योफ हिंटन का पेपर पढ़ा है हिंटन, क्रिज़ेव्स्की और वांग: ट्रांसफॉर्मिंग ऑटो-एनकोडर । आर्टिफिशियल न्यूरल नेटवर्क्स एंड मशीन लर्निंग, 2011 में। और काफी कुछ इस तरह से खेलना चाहते हैं। लेकिन इसे पढ़ने के बाद मुझे इस बात पर पर्याप्त विवरण नहीं मिल सका कि …

10 neural-network deep-learning autoencoder

7

डेटा विज्ञान परियोजनाओं को चरणबद्ध तरीके से समझाया गया है?

मैं एक वेबसाइट या पुस्तक की तलाश कर रहा हूं, जहां कई व्यावहारिक उदाहरणों को चरण-दर-चरण दिया गया है, यह बताते हुए कि वे प्रासंगिक सुविधाओं, मॉडल चयन प्रक्रिया आदि का चयन कैसे करते हैं ...

10 machine-learning feature-selection