डेटा साइंस

4

बिग डेटा केस स्टडी या केस उदाहरण का उपयोग करें

मैंने बहुत से ब्लॉग्स के लेख पढ़े हैं कि कैसे विभिन्न प्रकार के उद्योग बिग डेटा एनालिटिक का उपयोग कर रहे हैं। लेकिन इन लेखों में से अधिकांश का उल्लेख करने में विफल रहता है इन कंपनियों ने किस तरह का डेटा इस्तेमाल किया। डेटा का आकार क्या था डेटा …

13 data-mining bigdata usecase

5

ड्रॉपआउट परत को जोड़ने से गहरी / मशीन सीखने के प्रदर्शन में सुधार क्यों होता है, यह देखते हुए कि ड्रॉपआउट मॉडल से कुछ न्यूरॉन्स को दबा देता है?

यदि कुछ न्यूरॉन्स को हटाने से बेहतर प्रदर्शन करने वाला मॉडल होता है, तो पहली परत में कम परतों और कम न्यूरॉन्स के साथ एक सरल तंत्रिका नेटवर्क का उपयोग क्यों नहीं किया जाता है? शुरुआत में एक बड़ा, अधिक जटिल मॉडल क्यों बनाएं और बाद में इसके कुछ हिस्सों …

13 machine-learning deep-learning keras regularization dropout

3

ग्राफ एम्बेडिंग क्या हैं?

मैं हाल ही में दीपवॉक और लाइन जैसे ग्राफ एम्बेडिंग के पार आया। हालाँकि, मेरे पास अभी भी स्पष्ट विचार नहीं है क्योंकि ग्राफ एम्बेडिंग का क्या मतलब है और इसका उपयोग कब करना है (एप्लिकेशन)? किसी भी सुझाव का स्वागत है!

13 graphs

3

आयाम घटाने के लिए ऑटोकेनोडर्स सममित क्यों हैं?

मैं किसी भी तरह से ऑटोएन्कोडर्स या तंत्रिका नेटवर्क का विशेषज्ञ नहीं हूं, इसलिए अगर यह मूर्खतापूर्ण प्रश्न है तो मुझे क्षमा करें। उच्च आयाम डेटा में आयाम में कमी या विज़ुअलाइज़िंग क्लस्टर्स के उद्देश्य से, हम 2 नोड्स के साथ नेटवर्क लेयर के आउटपुट का निरीक्षण करके एक (हानिपूर्ण) …

13 neural-network dimensionality-reduction autoencoder

2

वजन और पूर्वाग्रह के आरंभ को 0 के आसपास क्यों चुना जाना चाहिए?

मैंने इसे पढ़ा: हमारे तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए, हम प्रत्येक पैरामीटर W (l) ijWij (l) और प्रत्येक b (l) ibi (l) को शून्य के पास एक छोटे से यादृच्छिक मूल्य पर कहेंगे (सामान्य के अनुसार कहें) (0, to2) सामान्य (0) , ϵϵ2) कुछ छोटे ϵϵ के लिए …

13 deep-learning stanford-nlp randomized-algorithms

3

क्यों कनवल्शन हमेशा फ़िल्टर_साइज़ के रूप में विषम-संख्याओं का उपयोग करते हैं

यदि हमारे पास सीएनएन (कन्वेंशन) का उपयोग करके प्रकाशित 90-99% कागज़ात हैं। उनमें से अधिकांश बहुमत विषम संख्याओं के फ़िल्टर आकार का उपयोग करते हैं : {1, 3, 5, 7} सबसे अधिक उपयोग के लिए। यह स्थिति कुछ समस्या पैदा कर सकती है: इन फ़िल्टर आकारों के साथ, आमतौर पर …

13 deep-learning convnet computer-vision convolution

1

पूर्वाग्रह को कैसे शुरू और नियमित किया जाना चाहिए?

मैंने कर्नेल इनिशियलाइज़ेशन के बारे में कुछ कागज़ात पढ़े हैं और कई कागज़ात में उल्लेख है कि वे कर्नेल के L2 नियमितीकरण का उपयोग करते हैं (अक्सर )।λ = 0.0001λ=0.0001\lambda = 0.0001 क्या कोई निरंतर शून्य के साथ पूर्वाग्रह को शुरू करने और इसे नियमित नहीं करने से अलग कुछ …

13 neural-network

3

क्या तंत्रिका नेटवर्क में व्याख्यात्मकता होती है जैसे निर्णय पेड़ करते हैं?

डिसीजन ट्रीज में, हम ट्री स्ट्रक्चर के आउटपुट को समझ सकते हैं और हम यह भी अंदाजा लगा सकते हैं कि डिसीजन ट्री कैसे निर्णय लेता है। इसलिए निर्णय पेड़ों में व्याख्यात्मकता होती है (उनके उत्पादन को आसानी से समझाया जा सकता है।) क्या हमारे पास निर्णय लेने वाले पेड़ों …

13 neural-network

1

डीप लर्निंग में 1D कन्वेंशनल लेयर क्या है?

मुझे 2D या 3D कार्यान्वयन के मामले में इमेज प्रोसेसिंग के लिए डीप लर्निंग में भूमिका की परतों की एक अच्छी समझ है - वे "बस" छवियों में 3 डी पैटर्न (3 डी के मामले में चैनलों) को पकड़ने की कोशिश करते हैं। लेकिन हाल ही में मैं नेचुरल लैंग्वेज …

13 deep-learning nlp convolution

1

एक गर्म एन्कोडिंग और एक बाहर एन्कोडिंग के बीच अंतर क्या है?

मैं एक प्रस्तुति पढ़ रहा हूं और यह अनुशंसा करता है कि किसी एक को एन्कोडिंग का उपयोग न करें, लेकिन यह एक गर्म एन्कोडिंग के साथ ठीक है। मुझे लगा कि वे दोनों एक ही हैं। क्या कोई बता सकता है कि उनके बीच क्या अंतर हैं?

13 machine-learning data-mining feature-selection feature-extraction feature-engineering

3

क्रॉस-वैलिडेशन के बाद क्लासिफायर का चयन कैसे करें?

जब हम के-फोल्ड क्रॉस सत्यापन करते हैं, तो क्या हमें उस क्लासिफायर का उपयोग करना चाहिए जिसमें सबसे अधिक परीक्षण सटीकता हो? क्रॉस वैरिफिकेशन से क्लासिफायर होने में आमतौर पर सबसे अच्छा तरीका क्या है?

13 machine-learning cross-validation

1

एक लेटेस्ट न्यूरल नेटवर्क (RNN) में परत को भूल जाओ -

मैं RNN में प्रत्येक चर के आयामों को भूलने की परत में जानने की कोशिश कर रहा हूं, हालांकि, मुझे यकीन नहीं है कि मैं सही रास्ते पर हूं। अगली तस्वीर और समीकरण कोला के ब्लॉग पोस्ट "अंडरस्टैंडिंग LSTM नेटवर्क" से है : कहाँ पे: m ∗ १एक्सटीxtx_t का आकार …

13 neural-network rnn

4

क्या हम word2vec मॉडल का प्रशिक्षण लेते समय स्थानांतरण सीखने का उपयोग करने का लाभ उठा सकते हैं?

मैं पहले से प्रशिक्षित मॉडल जैसे कि Google समाचार डेटा आदि का एक पूर्व-प्रशिक्षित वज़न खोजने के लिए देख रहा हूं। मैंने अपने लिए पर्याप्त मात्रा (10 जीबी आदि) के साथ एक नए मॉडल को प्रशिक्षित करना मुश्किल पाया। इसलिए, मैं ट्रांसफर लर्निंग से लाभ उठाना चाहता हूं, जिसमें मैं …

13 machine-learning bigdata word2vec

2

नैतिक और लागत प्रभावी रूप से स्केलिंग डेटा स्क्रेप्स

जीवन में कुछ चीजें मुझे आनंद देती हैं जैसे कि इंटरनेट से संरचित और असंरचित डेटा को स्क्रैप करना और मेरे मॉडलों में इसका उपयोग करना। उदाहरण के लिए, डेटा साइंस टूलकिट (या RDSTKआर प्रोग्रामर के लिए) मुझे आईपी या पते का उपयोग करके बहुत सारे अच्छे स्थान-आधारित डेटा खींचने …

13 text-mining scraping

3

मिश्रित प्रकार की विशेषताओं के साथ डेटासेट को वर्गीकृत करने का सबसे अच्छा तरीका

मैं यह जानना चाहूंगा कि मिश्रित प्रकार की विशेषताओं से बना डेटा सेट को वर्गीकृत करने का सबसे अच्छा तरीका क्या है, उदाहरण के लिए, पाठ और संख्यात्मक। मुझे पता है कि मैं टेक्स्ट को बूलियन में बदल सकता हूं, लेकिन शब्दावली विविध है और डेटा भी विरल हो गया …

13 machine-learning classification