डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

4
बिग डेटा केस स्टडी या केस उदाहरण का उपयोग करें
मैंने बहुत से ब्लॉग्स के लेख पढ़े हैं कि कैसे विभिन्न प्रकार के उद्योग बिग डेटा एनालिटिक का उपयोग कर रहे हैं। लेकिन इन लेखों में से अधिकांश का उल्लेख करने में विफल रहता है इन कंपनियों ने किस तरह का डेटा इस्तेमाल किया। डेटा का आकार क्या था डेटा …

5
ड्रॉपआउट परत को जोड़ने से गहरी / मशीन सीखने के प्रदर्शन में सुधार क्यों होता है, यह देखते हुए कि ड्रॉपआउट मॉडल से कुछ न्यूरॉन्स को दबा देता है?
यदि कुछ न्यूरॉन्स को हटाने से बेहतर प्रदर्शन करने वाला मॉडल होता है, तो पहली परत में कम परतों और कम न्यूरॉन्स के साथ एक सरल तंत्रिका नेटवर्क का उपयोग क्यों नहीं किया जाता है? शुरुआत में एक बड़ा, अधिक जटिल मॉडल क्यों बनाएं और बाद में इसके कुछ हिस्सों …

3
ग्राफ एम्बेडिंग क्या हैं?
मैं हाल ही में दीपवॉक और लाइन जैसे ग्राफ एम्बेडिंग के पार आया। हालाँकि, मेरे पास अभी भी स्पष्ट विचार नहीं है क्योंकि ग्राफ एम्बेडिंग का क्या मतलब है और इसका उपयोग कब करना है (एप्लिकेशन)? किसी भी सुझाव का स्वागत है!
13 graphs 

3
आयाम घटाने के लिए ऑटोकेनोडर्स सममित क्यों हैं?
मैं किसी भी तरह से ऑटोएन्कोडर्स या तंत्रिका नेटवर्क का विशेषज्ञ नहीं हूं, इसलिए अगर यह मूर्खतापूर्ण प्रश्न है तो मुझे क्षमा करें। उच्च आयाम डेटा में आयाम में कमी या विज़ुअलाइज़िंग क्लस्टर्स के उद्देश्य से, हम 2 नोड्स के साथ नेटवर्क लेयर के आउटपुट का निरीक्षण करके एक (हानिपूर्ण) …

2
वजन और पूर्वाग्रह के आरंभ को 0 के आसपास क्यों चुना जाना चाहिए?
मैंने इसे पढ़ा: हमारे तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए, हम प्रत्येक पैरामीटर W (l) ijWij (l) और प्रत्येक b (l) ibi (l) को शून्य के पास एक छोटे से यादृच्छिक मूल्य पर कहेंगे (सामान्य के अनुसार कहें) (0, to2) सामान्य (0) , ϵϵ2) कुछ छोटे ϵϵ के लिए …

3
क्यों कनवल्शन हमेशा फ़िल्टर_साइज़ के रूप में विषम-संख्याओं का उपयोग करते हैं
यदि हमारे पास सीएनएन (कन्वेंशन) का उपयोग करके प्रकाशित 90-99% कागज़ात हैं। उनमें से अधिकांश बहुमत विषम संख्याओं के फ़िल्टर आकार का उपयोग करते हैं : {1, 3, 5, 7} सबसे अधिक उपयोग के लिए। यह स्थिति कुछ समस्या पैदा कर सकती है: इन फ़िल्टर आकारों के साथ, आमतौर पर …

1
पूर्वाग्रह को कैसे शुरू और नियमित किया जाना चाहिए?
मैंने कर्नेल इनिशियलाइज़ेशन के बारे में कुछ कागज़ात पढ़े हैं और कई कागज़ात में उल्लेख है कि वे कर्नेल के L2 नियमितीकरण का उपयोग करते हैं (अक्सर )।λ = 0.0001λ=0.0001\lambda = 0.0001 क्या कोई निरंतर शून्य के साथ पूर्वाग्रह को शुरू करने और इसे नियमित नहीं करने से अलग कुछ …

3
क्या तंत्रिका नेटवर्क में व्याख्यात्मकता होती है जैसे निर्णय पेड़ करते हैं?
डिसीजन ट्रीज में, हम ट्री स्ट्रक्चर के आउटपुट को समझ सकते हैं और हम यह भी अंदाजा लगा सकते हैं कि डिसीजन ट्री कैसे निर्णय लेता है। इसलिए निर्णय पेड़ों में व्याख्यात्मकता होती है (उनके उत्पादन को आसानी से समझाया जा सकता है।) क्या हमारे पास निर्णय लेने वाले पेड़ों …

1
डीप लर्निंग में 1D कन्वेंशनल लेयर क्या है?
मुझे 2D या 3D कार्यान्वयन के मामले में इमेज प्रोसेसिंग के लिए डीप लर्निंग में भूमिका की परतों की एक अच्छी समझ है - वे "बस" छवियों में 3 डी पैटर्न (3 डी के मामले में चैनलों) को पकड़ने की कोशिश करते हैं। लेकिन हाल ही में मैं नेचुरल लैंग्वेज …

1
एक गर्म एन्कोडिंग और एक बाहर एन्कोडिंग के बीच अंतर क्या है?
मैं एक प्रस्तुति पढ़ रहा हूं और यह अनुशंसा करता है कि किसी एक को एन्कोडिंग का उपयोग न करें, लेकिन यह एक गर्म एन्कोडिंग के साथ ठीक है। मुझे लगा कि वे दोनों एक ही हैं। क्या कोई बता सकता है कि उनके बीच क्या अंतर हैं?

3
क्रॉस-वैलिडेशन के बाद क्लासिफायर का चयन कैसे करें?
जब हम के-फोल्ड क्रॉस सत्यापन करते हैं, तो क्या हमें उस क्लासिफायर का उपयोग करना चाहिए जिसमें सबसे अधिक परीक्षण सटीकता हो? क्रॉस वैरिफिकेशन से क्लासिफायर होने में आमतौर पर सबसे अच्छा तरीका क्या है?

1
एक लेटेस्ट न्यूरल नेटवर्क (RNN) में परत को भूल जाओ -
मैं RNN में प्रत्येक चर के आयामों को भूलने की परत में जानने की कोशिश कर रहा हूं, हालांकि, मुझे यकीन नहीं है कि मैं सही रास्ते पर हूं। अगली तस्वीर और समीकरण कोला के ब्लॉग पोस्ट "अंडरस्टैंडिंग LSTM नेटवर्क" से है : कहाँ पे: m ∗ १एक्सटीxtx_t का आकार …

4
क्या हम word2vec मॉडल का प्रशिक्षण लेते समय स्थानांतरण सीखने का उपयोग करने का लाभ उठा सकते हैं?
मैं पहले से प्रशिक्षित मॉडल जैसे कि Google समाचार डेटा आदि का एक पूर्व-प्रशिक्षित वज़न खोजने के लिए देख रहा हूं। मैंने अपने लिए पर्याप्त मात्रा (10 जीबी आदि) के साथ एक नए मॉडल को प्रशिक्षित करना मुश्किल पाया। इसलिए, मैं ट्रांसफर लर्निंग से लाभ उठाना चाहता हूं, जिसमें मैं …

2
नैतिक और लागत प्रभावी रूप से स्केलिंग डेटा स्क्रेप्स
जीवन में कुछ चीजें मुझे आनंद देती हैं जैसे कि इंटरनेट से संरचित और असंरचित डेटा को स्क्रैप करना और मेरे मॉडलों में इसका उपयोग करना। उदाहरण के लिए, डेटा साइंस टूलकिट (या RDSTKआर प्रोग्रामर के लिए) मुझे आईपी या पते का उपयोग करके बहुत सारे अच्छे स्थान-आधारित डेटा खींचने …

3
मिश्रित प्रकार की विशेषताओं के साथ डेटासेट को वर्गीकृत करने का सबसे अच्छा तरीका
मैं यह जानना चाहूंगा कि मिश्रित प्रकार की विशेषताओं से बना डेटा सेट को वर्गीकृत करने का सबसे अच्छा तरीका क्या है, उदाहरण के लिए, पाठ और संख्यात्मक। मुझे पता है कि मैं टेक्स्ट को बूलियन में बदल सकता हूं, लेकिन शब्दावली विविध है और डेटा भी विरल हो गया …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.