डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
समानांतर और वितरित कंप्यूटिंग
समानांतर और वितरित कंप्यूटिंग के बीच अंतर क्या है? जब स्केलेबिलिटी और दक्षता की बात आती है, तो मशीनों के समूहों में गणना से निपटने वाले समाधानों को देखना बहुत आम है, और कभी-कभी इसे समानांतर प्रसंस्करण, या वितरित प्रसंस्करण के रूप में संदर्भित किया जाता है। एक निश्चित तरीके …

1
निर्णय पेड़ों में निरंतर चर के लिए एक विभाजन बिंदु कैसे चुना जाता है?
मेरे पास निर्णय पेड़ों से संबंधित दो प्रश्न हैं: यदि हमारे पास एक निरंतर विशेषता है, तो हम विभाजन मूल्य कैसे चुनते हैं? उदाहरण: आयु = (20,29,50,40 ....) कल्पना कीजिए कि हमारे पास एक निरंतर विशेषता जिसमें मान हैं । मैं एक एल्गोरिथ्म कि विभाजन बिंदु पाता है कैसे लिख …

5
वाक्य समानता भविष्यवाणी
मैं निम्नलिखित समस्या को हल करने के लिए देख रहा हूं: मेरे पास मेरे डेटासेट के रूप में वाक्यों का एक सेट है, और मैं एक नया वाक्य टाइप करने में सक्षम होना चाहता हूं, और यह वाक्य ढूंढना चाहता हूं कि नया डेटासेट में सबसे समान है। एक उदाहरण …

2
Useragent, ip, session_id द्वारा अद्वितीय विज़िटर का क्लस्टरिंग
फॉर्म में वेबसाइट एक्सेस डेटा session_id, ip, user_agent, और वैकल्पिक रूप से टाइमस्टैम्प को देखते हुए , नीचे दी गई शर्तों का पालन करते हुए, आप अद्वितीय आगंतुकों में सत्रों को कैसे क्लस्टर करेंगे? session_id: हर नए आगंतुक को एक आईडी दी जाती है। यह समाप्त नहीं होता है, हालांकि …
15 clustering 

6
केरस - ट्रांसफर लर्निंग - इनपुट टेंसर आकार बदलना
यह पोस्ट इंगित करती है कि मैं जो पूरा करना चाहता हूं वह संभव नहीं है। हालाँकि, मैं इस बारे में आश्वस्त नहीं हूँ - जो मैंने पहले ही किया है, उसे देखते हुए, मैं यह नहीं देखता कि मैं जो करना चाहता हूँ उसे हासिल नहीं किया जा सकता …
15 keras 

4
निर्णय वृक्ष बनाम केएनएन
किन मामलों में निर्णय वृक्ष और अन्य मामलों का उपयोग करना बेहतर है? कुछ मामलों में उनमें से एक का उपयोग क्यों करें? और अन्य विभिन्न मामलों में? (एल्गोरिथ्म में नहीं, इसकी कार्यक्षमता को देखकर) किसी को भी इस बारे में कुछ स्पष्टीकरण या संदर्भ है?

2
एक विशिष्ट विषय के ज्ञान के बिना डेटा विज्ञान, क्या यह कैरियर के रूप में आगे बढ़ने के लायक है? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न अपडेट करें तो यह है -विषय पर डाटा विज्ञान स्टैक एक्सचेंज के लिए। 5 साल पहले बंद हुआ । मैंने हाल ही में किसी के साथ …

2
ट्रेन और परीक्षण डेटा के चर को राजधानी पत्र (पायथन में) का उपयोग करके क्यों परिभाषित किया गया है?
मुझे उम्मीद है कि यह प्रश्न इस साइट में सबसे उपयुक्त है ... पाइथन में, आमतौर पर वर्ग नाम को उदाहरण के लिए पहले अक्षर के रूप में कैपिटल अक्षर का उपयोग करके परिभाषित किया जाता है class Vehicle: ... हालांकि, मशीन लर्निंग क्षेत्र में, अक्सर ट्रेन और परीक्षण डेटा …
15 python  dataset 

3
केरस से मॉडल.प्रिक्ट फंक्शन के आउटपुट का क्या मतलब है?
मैंने Quora आधिकारिक डेटासेट पर डुप्लिकेट प्रश्नों की भविष्यवाणी करने के लिए एक LSTM मॉडल बनाया है। परीक्षण लेबल 0 या 1. 1 हैं जो इंगित करता है कि प्रश्न युग्म डुप्लिकेट है। मॉडल का उपयोग करने के निर्माण के बाद model.fit, मैं model.predictपरीक्षण डेटा पर उपयोग करके मॉडल का …

4
विभिन्न परीक्षण सेट और प्रशिक्षण सेट वितरण
मैं एक डेटा विज्ञान प्रतियोगिता पर काम कर रहा हूं जिसके लिए मेरे परीक्षण सेट का वितरण प्रशिक्षण सेट से अलग है। मैं प्रशिक्षण सेट से टिप्पणियों को कम करना चाहता हूं जो परीक्षण सेट के समान है। मैं यह कैसे कर सकता हूँ?

2
SelectKBest कैसे काम करता है?
मैं इस ट्यूटोरियल को देख रहा हूँ: https://www.dataquest.io/mission/75/improving-your-submission सबसे अच्छी सुविधाओं को खोजने के लिए, धारा 8 में, यह निम्नलिखित कोड दिखाता है। import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = …

1
पाइरॉच बनाम टेन्सरफ्लो उत्सुक
में tensorflow की रात को अपने बनाता है गूगल ने हाल ही शामिल उत्सुक मोड, पहुँच tensorflow गणना क्षमताओं के लिए एक अनिवार्य एपीआई। टेट्राफ़्लो उत्सुक पियर्टोच की तुलना कैसे करते हैं? तुलना को प्रभावित करने वाले कुछ पहलू निम्न हो सकते हैं: अपने स्थिर ग्राफ विरासत (जैसे नोड्स में …

3
GAN (जेनेरिक एडवरटाइजिंग नेटवर्क) पाठ के लिए भी संभव है?
क्या जीएएन - जेनरेटर के प्रतिकूल नेटवर्क - केवल छवियों के लिए अच्छा है, या पाठ के लिए भी इस्तेमाल किया जा सकता है? जैसे, सारांश से सार्थक ग्रंथों को उत्पन्न करने के लिए एक नेटवर्क को प्रशिक्षित करना। UPD - GAN के आविष्कारक Ian Goodfellow के उद्धरण। GAN को …
14 gan 

4
क्या हम जनरेटिव एडवरसरी नेटवर्क के साथ विशाल डेटासेट उत्पन्न कर सकते हैं
मैं एक ऐसी समस्या से निपट रहा हूँ जहाँ मुझे प्रशिक्षण के लिए अपने गहरे तंत्रिका नेटवर्क में फीड करने के लिए पर्याप्त डेटासेट (चित्र) नहीं मिल रहे हैं। मैं स्कॉट रीड एट अल द्वारा प्रकाशित इमेज सिंथेसिस के पेपर जनरेटिव एडवरसरी टेक्स्ट से बहुत प्रेरित था । जनरेशनल एडवाइजररल …

1
क्या स्तरीकृत नमूनाकरण आवश्यक है (यादृच्छिक वन, पायथन)?
मैं अपने असंतुलित डेटासेट पर एक यादृच्छिक वन मॉडल (लक्ष्य चर बाइनरी क्लास था) चलाने के लिए पायथन का उपयोग करता हूं। प्रशिक्षण और परीक्षण डेटासेट को विभाजित करते समय, मैंने संघर्ष किया कि क्या स्तरीकृत नमूने का उपयोग किया जाना चाहिए (जैसे दिखाए गए कोड) या नहीं। अब तक, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.