डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

4
कई प्रकार के मॉडल लगभग समान परिणाम क्यों दे सकते हैं?
मैं ~ 400k रिकॉर्ड और 9 चर के डेटा सेट का विश्लेषण कर रहा हूं। आश्रित चर द्विआधारी है। मैंने एक लॉजिस्टिक रिग्रेशन, एक रिग्रेशन ट्री, एक रैंडम फॉरेस्ट और एक ग्रेडिएंट बूस्टेड ट्री फिट किया है। जब मैं उन्हें किसी अन्य डेटा सेट पर मान्य करता हूं, तो उनमें …

3
सांख्यिकी + कंप्यूटर विज्ञान = डेटा विज्ञान? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न अपडेट करें तो यह है -विषय पर डाटा विज्ञान स्टैक एक्सचेंज के लिए। 5 साल पहले बंद हुआ । मैं एक डेटा वैज्ञानिक बनना चाहता हूं …

1
गैर-परमाणु सुविधाओं के साथ भविष्यवाणी
मैं गैर-परमाणु डेटा का उपयोग करना चाहूंगा, एक भविष्यवाणी के लिए एक सुविधा के रूप में। मान लीजिए कि मेरे पास इन सुविधाओं के साथ एक तालिका है: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 …

3
एक नियमित रूप से बढ़ते सुविधा सेट को संभालना
मैं एक फ्रॉड डिटेक्शन सिस्टम पर काम कर रहा हूं। इस क्षेत्र में, नए फ्रॉड नियमित रूप से दिखाई देते हैं, ताकि नए फीचर्स को मौजूदा आधार पर मॉडल में जोड़ा जाए। मुझे आश्चर्य है कि इसे (विकास प्रक्रिया के नजरिए से) संभालने का सबसे अच्छा तरीका क्या है? बस …

2
तंत्रिका नेटवर्क के साथ विदेशी मुद्रा बाजार का पूर्वानुमान
मैं एएनएन का उपयोग व्यापारिक मुद्राओं को स्वचालित करने के लिए करना चाहता हूं, अधिमानतः यूएसडी / यूरो या यूएसडी / जीबीपी। मुझे पता है कि यह कठिन है और सीधा नहीं हो सकता है। मैंने पहले ही कुछ पेपर पढ़े हैं और कुछ प्रयोग किए हैं, लेकिन बहुत ज्यादा …

4
गैस की खपत का पता लगाने वाले का पता लगाने - तंत्रिका नेटवर्क परियोजना। बुरा परिणाम
मैंने एक न्यूरल नेटवर्क मॉडल का निर्माण करते हुए कुछ डच इमारतों की ऊर्जा गैस की खपत में आउटलेर्स का पता लगाने की कोशिश की। मेरे पास बहुत बुरे परिणाम हैं, लेकिन मुझे इसका कारण नहीं मिल रहा है। मैं एक विशेषज्ञ नहीं हूं इसलिए मैं आपसे पूछना चाहता हूं …

4
आर में अध्यादेशिक प्रतिगमन सीखना?
मैं एक परियोजना पर काम कर रहा हूं और मुझे गति प्राप्त करने के लिए संसाधनों की आवश्यकता है। डेटासेट 30 या इतने पर चर पर 35000 टिप्पणियों के आसपास है। लगभग आधे चर कुछ अलग-अलग संभव मानों के साथ श्रेणीबद्ध होते हैं, अर्थात यदि आप श्रेणीगत चर को डमी …

1
अगर एक सामान्य यूलर आरेख में सबसेट प्लॉट किया जा सकता है तो मुझे कैसे पता चलेगा?
कुछ मामलों में, सही अनुपात में सभी अतिव्यापी सबसेट का प्रतिनिधित्व करने के लिए अतिव्यापी हलकों के साथ यूलर आरेखों को खींचना असंभव हो सकता है । इस प्रकार के डेटा को प्रत्येक सेट का प्रतिनिधित्व करने के लिए बहुभुज या अन्य आंकड़ों का उपयोग करने की आवश्यकता होती है। …

1
सबसे कुशल डेटा इंडेक्सिंग तकनीक क्या है
जैसा कि हम सभी जानते हैं कि कुछ डेटा इंडेक्सिंग तकनीकें हैं, जो कि जानी-मानी इंडेक्सिंग एप्स का उपयोग करती हैं, जैसे कि ल्यूसिन (जावा के लिए) या ल्यूसिने.नेट (.NET के लिए), मुरमुराश, बी + ट्री इत्यादि। ओरिएंटेड डेटाबेस (जिसे मैं C # के साथ थोड़ा सा लिखने / खेलने …

2
क्या यह Neo4j RDBMS निष्पादन समय की तुलना सही है?
पृष्ठभूमि: पुस्तक ग्राफ डेटाबेस से निम्नलिखित है , जो किताब Neo4j इन एक्शन में उल्लिखित एक प्रदर्शन परीक्षण शामिल है : एक ग्राफ में संबंध स्वाभाविक रूप से पथ बनाते हैं। क्वेरी करना, या ट्रैवर्स करना, ग्राफ़ में निम्नलिखित पथ शामिल हैं। डेटामॉडल की मूल रूप से पथ-उन्मुख प्रकृति के …
10 databases  nosql  neo4j 

5
पीएचडी कार्यक्रमों के लिए योग्यता
यान लेकन ने अपने एएमए में उल्लेख किया कि वह एक शीर्ष कंपनी में नौकरी पाने के लिए पीएचडी को बहुत महत्वपूर्ण मानता है। मेरे पास सांख्यिकी में स्नातकोत्तर है और मेरा अंडरग्रेजुएट अर्थशास्त्र और अनुप्रयुक्त गणित में था, लेकिन मैं अब एमएल पीएचडी कार्यक्रमों में देख रहा हूं। अधिकांश …
10 education 

3
R की मेमोरी बाधाएं क्या हैं?
" एप्लाइड प्रिडिक्टिव मॉडलिंग " की समीक्षा में एक समीक्षक कहता है : एक समालोचना मेरे पास सांख्यिकीय शिक्षा (एसएल) शिक्षाशास्त्र है जो विभिन्न मॉडलिंग तकनीकों के मूल्यांकन में अभिकलन प्रदर्शन विचारों की अनुपस्थिति है। बूटस्ट्रैपिंग और क्रॉस-वेलिडेशन ऑन ट्यून / टेस्ट मॉडल के लिए इसके चरणों के साथ, एसएल …
10 apache-hadoop  r 

4
पुस्तकालयों का उपयोग करते समय दक्षता प्रदान करना कठिन क्यों है?
किसी भी छोटे डेटाबेस प्रसंस्करण को पायथन / पर्ल / ... लिपियों द्वारा आसानी से निपटा जा सकता है, जो भाषा से ही पुस्तकालयों और / या उपयोगिताओं का उपयोग करता है। हालाँकि, जब प्रदर्शन की बात आती है, तो लोग C / C ++ / निम्न-स्तरीय भाषाओं के लिए …

3
24,000 श्रेणियों के साथ एक वर्ग को कैसे एनकोड करना है?
मैं वर्तमान में जीनोमिक्स के लिए एक लॉजिस्टिक रिग्रेशन मॉडल पर काम कर रहा हूं। इनपुट क्षेत्रों में से एक मैं एक कोवरिएट के रूप में शामिल करना चाहता हूं genes। लगभग 24,000 ज्ञात जीन हैं। कम्प्यूटेशनल जीव विज्ञान में परिवर्तनशीलता के इस स्तर के साथ कई विशेषताएं हैं और …

2
Convolutional1D, Convolutional2D और Convolutional3D के बीच अंतर क्या हैं?
मैं कन्वर्सेशनल न्यूरल नेटवर्क्स के बारे में सीख रहा हूं। जब पर देख Kerasउदाहरण, मैं तीन अलग अलग तरीकों घुमाव के बारे में जाना। अर्थात्, 1 डी, 2 डी और 3 डी। इन तीन परतों के बीच अंतर क्या हैं? उनके उपयोग के मामले क्या हैं? क्या उनके उपयोग मामलों …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.