डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

7
बिग डेटा एनालिटिक्स के लिए कैरियर स्विच
मैं एक 35 वर्षीय आईटी पेशेवर हूं जो विशुद्ध रूप से तकनीकी है। मैं प्रोग्रामिंग, नई तकनीकों को सीखने, उन्हें समझने और लागू करने में अच्छा हूं। मुझे स्कूल में गणित पसंद नहीं था, इसलिए मैंने गणित में अच्छा स्कोर नहीं किया। मुझे बिग डेटा एनालिटिक्स में करियर बनाने का …
9 career 

1
सिग्नल एन्कोडिंग सीखना
मेरे पास बड़ी संख्या में नमूने हैं जो मैनचेस्टर को ऑडियो संकेतों के रूप में बिट धाराओं को एनकोड करते हैं। जिस आवृत्ति पर वे एन्कोडेड होते हैं वह उच्च होने पर प्राथमिक आवृत्ति घटक होता है, और पृष्ठभूमि में सफेद शोर की एक सुसंगत मात्रा होती है। मैंने इन …

4
टेक्स्ट क्लासिफायर ट्रेनिंग डेटासेट का सुझाव दें
टेक्स्ट क्लासिफायर ट्रेन करने के लिए मैं कौन से स्वतंत्र रूप से उपलब्ध डेटासेट का उपयोग कर सकता हूं? हम उसके लिए सबसे अधिक संबंधित सामग्री की सिफारिश करके अपने उपयोगकर्ताओं के जुड़ाव को बढ़ाने की कोशिश कर रहे हैं, इसलिए हमने सोचा कि यदि हम अपनी सामग्री को शब्दों …

1
ILP के बिना रिलेशनल डेटा माइनिंग
मेरे पास रिलेशनल डेटाबेस से एक विशाल डेटासेट है, जिसके लिए मुझे एक वर्गीकरण मॉडल बनाने की आवश्यकता है। आम तौर पर इस स्थिति के लिए मैं इंडक्टिव लॉजिक प्रोग्रामिंग (ILP) का उपयोग करता हूं , लेकिन विशेष परिस्थितियों के कारण मैं ऐसा नहीं कर सकता। इससे निपटने का दूसरा …

2
स्मार्टफोन डेटा सेट समस्या का उपयोग करके मानव गतिविधि मान्यता
मैं इस समुदाय के लिए नया हूं और उम्मीद है कि मेरा प्रश्न यहां पर अच्छी तरह से फिट होगा। मेरे स्नातक डेटा एनालिटिक्स पाठ्यक्रम के हिस्से के रूप में, मैं स्मार्टफोन डेटा सेट का उपयोग करके मानव गतिविधि मान्यता पर परियोजना करने का चयन करता हूं। जहाँ तक मुझे …

1
SMOTE तकनीक का उपयोग करके डेटासेट को संतुलित करने में उपयोग किया जाने वाला सबसे अच्छा प्रदर्शन मीट्रिक क्या है
मैंने अपने डेटासेट का निरीक्षण करने के लिए smote तकनीक का उपयोग किया और अब मेरे पास एक संतुलित डेटासेट है। मेरे सामने समस्या यह है कि प्रदर्शन मेट्रिक्स; सटीक, याद, एफ 1 माप, असंतुलित डेटासेट में सटीकता संतुलित डेटासेट की तुलना में बेहतर प्रदर्शन किया जाता है। माप को …

1
केरेस 'ModelCheckpoint काम नहीं कर रहा है
मैं keras में एक मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूँ और मैं एक निगरानी मान्यता सत्यापन मीट्रिक (मेरे मामले में जैकार्ड इंडेक्स ) के अनुसार सर्वश्रेष्ठ मॉडल को बचाने के लिए ModelCheckpoint का उपयोग कर रहा हूँ । जब मैं मॉडल को टेंसरबोर्ड में सुधार देख सकता …
8 keras  convnet 

1
असंतुलित वर्गों से निपटने के लिए दृष्टिकोणों का वर्गीकरण
असंतुलन वर्ग की समस्या से निपटने के लिए जो दृष्टिकोण विकसित किए गए हैं, उन्हें वर्गीकृत करने का सबसे अच्छा तरीका क्या है? यह लेख उन्हें इसमें वर्गीकृत करता है: प्रीप्रोसेसिंग: इसमें ओवरसैमलिंग, अंडरसम्पलिंग और हाइब्रिड तरीके शामिल हैं, लागत-संवेदी शिक्षण: इसमें प्रत्यक्ष विधियाँ और मेटा-लर्निंग शामिल हैं जिन्हें बाद …


3
भूखंडों / छवियों पर बिंदुओं की पहचान करने के लिए क्या कोई मशीन सीखने की तकनीक है?
मेरे पास प्रत्येक वाहन के पार्श्व स्थिति के लिए समय और लेन संख्या है, जैसा कि इन 3 भूखंडों में छवि और नमूना डेटा में दिखाया गया है। > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 …

5
विषय मॉडल और एलडीए पर ट्यूटोरियल
मैं जानना चाहूंगा कि यदि आप लोगों के पास विषय के मॉडल और LDA के बारे में कुछ अच्छे ट्यूटोरियल (तेज और सीधे) हैं, तो सहज ज्ञान युक्त शिक्षण, कुछ वास्तविक उदाहरणों के साथ, कुछ मापदंडों को निर्धारित करने और उनका उपयोग कैसे करें।

2
ग्रैडिएंट बूस्टिंग रिग्रेशन नकारात्मक मूल्यों की भविष्यवाणी क्यों करता है जब मेरे प्रशिक्षण सेट में नकारात्मक वाई-वैल्यू नहीं होते हैं?
मैं पेड़ों की संख्या में वृद्धि के रूप में में scikit जानने की GradientBoostingRegressor, मैं और अधिक नकारात्मक पूर्वानुमान प्राप्त करें, भले ही वहाँ मेरे प्रशिक्षण या सेट परीक्षण में कोई नकारात्मक मान हैं। मेरे पास लगभग 10 विशेषताएं हैं, जिनमें से अधिकांश बाइनरी हैं। कुछ पैरामीटर जो मैं ट्यूनिंग …

2
सीएनएन मॉडल में अधिक परतों का उपयोग करते समय मेमोरी त्रुटि
मेरे dell core i7 - 16GB RAM - 4gb 960m GPU लैपटॉप पर, मैं 3D CNN का उपयोग करके फेफड़े के CT इमेज को वर्गीकृत करने के लिए एक प्रोजेक्ट पर काम कर रहा हूं। मैं टेंसरफ़्लो के सीपीयू संस्करण का उपयोग कर रहा हूँ। चित्र सुस्पष्ट सरणी आकार (25,50,50) …

2
तंत्रिका नेटवर्क के लिए स्केलेर या टेंसरफ़्लो का उपयोग करना चाहिए?
मैंने सिर्फ cs231 से गहन सीखने के लिए न्यूरल नेटवर्क सीखना शुरू किया है। मैं पायथन में न्यूरल नेटवर्क को लागू करने की कोशिश कर रहा हूं। मैं Tensorflow या scikit-learn का उपयोग कर रहा हूँ। इस आवेदन के लिए इन पुस्तकालयों के कुछ पेशेवरों और विपक्ष क्या हैं?

1
पूर्वाग्रह-विचरण व्यापार और अनुकूलन के साधनों पर प्रश्न
इसलिए मैं सोच रहा था कि उदाहरण के लिए, उच्च पूर्वाग्रह या उच्च विचरण द्वारा प्रस्तुत मुद्दों के साथ सामना करने के लिए वे जिस मॉडल का निर्माण करने की कोशिश कर रहे हैं, उसे सर्वश्रेष्ठ रूप से अनुकूलित कर सकते हैं। अब, बेशक, आप एक संतोषजनक अंत पाने के …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.