डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
असेम्बल इतना प्रभावी क्यों हैं
ऐसा प्रतीत होता है कि स्वयंसिद्ध हो गया है कि शिक्षार्थियों का एक पहनावा सर्वोत्तम संभव मॉडल परिणामों की ओर ले जाता है - और यह दूर तक दुर्लभ होता जा रहा है, उदाहरण के लिए, एकल मॉडलों के लिए जैसे कागेल जैसी प्रतियोगिताओं को जीतना। क्या इस बात के …

4
कैसे करें डाक का पता फ़ज़ी मैचिंग?
मैं यह जानना चाहूंगा कि डाक के पतों का मिलान कैसे किया जाए जब उनका प्रारूप अलग-अलग हो या जब उनमें से एक गलत लिखा हो। अब तक मैंने अलग-अलग समाधान पाए हैं लेकिन मुझे लगता है कि वे काफी पुराने हैं और बहुत कुशल नहीं हैं। मुझे यकीन है …

1
क्या टी-एसएनई विज़ुअलाइज़ेशन में निकट बिंदुओं को अधिक समान माना जा सकता है?
मैं हिंटन के पेपर से समझता हूं कि टी-एसएनई स्थानीय समानताओं को बनाए रखने में एक अच्छा काम करता है और वैश्विक संरचना (क्लस्टर) को संरक्षित करने में एक अच्छा काम करता है। हालाँकि मैं स्पष्ट नहीं हूँ कि एक 2D t-sne विज़ुअलाइज़ेशन में नज़दीकी दिखने वाले बिंदुओं को "अधिक-समान" …

4
निर्णय वृक्ष या लॉजिस्टिक प्रतिगमन?
मैं एक वर्गीकरण समस्या पर काम कर रहा हूं। मेरे पास एक डेटासेट है जिसमें समान संख्या में श्रेणीबद्ध चर और निरंतर चर हैं। मुझे कैसे पता चलेगा कि किस तकनीक का उपयोग करना है? एक निर्णय पेड़ और एक लॉजिस्टिक प्रतिगमन के बीच? क्या यह मान लेना सही है …

2
उपयोगकर्ता प्रोफाइल को वर्गीकृत / क्लस्टर करने के लिए विशेषताओं का उपयोग करना
मेरे पास एक वेबसाइट से उत्पादों को खरीदने वाले उपयोगकर्ताओं का डेटासेट है। मेरे पास उपयोगकर्ता की आईडी, क्षेत्र (राज्य), उत्पाद की श्रेणियां आईडी, उत्पाद की कीवर्ड आईडी, वेबसाइट की कीवर्ड आईडी, और उत्पाद की बिक्री की गई राशि की विशेषता है। लक्ष्य किसी उत्पाद और वेबसाइट की जानकारी का …

2
10 ^ 10 अंक के लिए एल्गोरिथ्म जैसे फास्ट के-साधन?
मैं 10-आयामी बिंदुओं के समूह पर k-mean clustering कर रहा हूं। पकड़: 10 ^ 10 अंक हैं । मैं सबसे बड़े समूहों के केंद्र और आकार की तलाश कर रहा हूं (मान लीजिए 10 से 100 क्लस्टर हैं); मुझे इस बात की परवाह नहीं है कि प्रत्येक बिंदु किस क्लस्टर …

1
रूबी के लिए मशीन लर्निंग लाइब्रेरी
क्या रूबी के लिए कोई मशीन लर्निंग लाइब्रेरी हैं जो अपेक्षाकृत पूर्ण हैं (पर्यवेक्षित और अप्रमाणित सीखने के लिए एल्गोरिदम की एक विस्तृत विविधता सहित), दृढ़ता से परीक्षण किया गया है, और अच्छी तरह से प्रलेखित है? मैं अपने अविश्वसनीय प्रलेखन के लिए पायथन के स्किटिट-लर्न से प्यार करता हूं …

4
अत्यधिक पक्षपाती डेटासेट के साथ ट्री एन्सेम्बल के प्रशिक्षण के लिए निहितार्थ क्या हैं?
मेरे पास अत्यधिक पक्षपाती द्विआधारी डेटासेट है - मेरे पास सकारात्मक वर्ग की तुलना में नकारात्मक वर्ग के 1000x अधिक उदाहरण हैं। मैं इस डेटा पर ट्री एनसेंबल (जैसे एक्स्ट्रा रैंडम ट्री या रैंडम फ़ॉरेस्ट) को प्रशिक्षित करना चाहूंगा, लेकिन प्रशिक्षण डेटासेट बनाना मुश्किल है जिसमें सकारात्मक वर्ग के पर्याप्त …

2
असंतुलित डेटा के लिए बाइनरी वर्गीकरण मॉडल
मेरे पास निम्नलिखित विशिष्टताओं वाला डेटासेट है: 2,321 सकारात्मक के साथ 193,176 नमूनों के साथ प्रशिक्षण डाटासेट 673 सकारात्मक के साथ 82,887 नमूनों के साथ टेस्ट डेटासैट 10 विशेषताएं हैं। मैं एक द्विआधारी वर्गीकरण (0 या 1) करना चाहता हूं। मैं जिस मुद्दे का सामना कर रहा हूं वह यह …

4
उदाहरण के लिए खोज बुनियादी ढांचे के ढेर / वर्कफ़्लोज़ / पाइपलाइन
मैं यह समझने की कोशिश कर रहा हूं कि सभी "बड़े डेटा" घटक एक वास्तविक दुनिया के उपयोग के मामले में एक साथ कैसे खेलते हैं, उदाहरण के लिए, हडूप, मोनोगोडब / नोसक्ल, तूफान, कफका, ... मुझे पता है कि यह उपकरण की एक विस्तृत श्रृंखला है। विभिन्न प्रकार, लेकिन …

1
क्या ग्रेडिएंट बूस्टेड पेड़ किसी भी फंक्शन में फिट हो सकते हैं?
तंत्रिका नेटवर्क के लिए हमारे पास सार्वभौमिक सन्निकटन प्रमेय है जो बताता है कि तंत्रिका नेटवर्क एक सबसेट उपसमुच्चय पर किसी भी निरंतर कार्य को अनुमानित कर सकते हैं ।आरnRnR^n क्या ग्रेडिएंट बूस्टेड पेड़ों के लिए समान परिणाम है? यह उचित लगता है क्योंकि आप अधिक शाखाएँ जोड़ सकते हैं, …

2
हमेशा ADAM ऑप्टिमाइज़ेशन तकनीक का उपयोग क्यों नहीं किया जाता है?
यह अनुकूली क्षण अनुमान (एडम) लगता है ऑप्टिमाइज़र लगभग हमेशा बेहतर काम करता है (तेजी से और अधिक मज़बूती से एक वैश्विक न्यूनतम तक पहुँच) जब प्रशिक्षण तंत्रिका जाल में लागत समारोह को कम करता है। हमेशा एडम का उपयोग क्यों नहीं किया जाता है? RMSProp या गति अनुकूलक का …

1
CNNs के इनपुट के रूप में साइड इमेज के साथ नॉन इमेज फीचर्स को कैसे जोड़ें
मैं कोहरे की स्थिति (3 वर्ग) पर छवियों को वर्गीकृत करने के लिए एक दृढ़ तंत्रिका नेटवर्क का प्रशिक्षण दे रहा हूं। हालाँकि, लगभग 150.000 छवियों में से प्रत्येक के लिए मेरे पास चार मौसम संबंधी चर उपलब्ध हैं जो छवियों के वर्गों की भविष्यवाणी करने में मदद कर सकते …

3
क्या ImageNet में एक व्यक्ति वर्ग है? क्या मनुष्य से संबंधित कोई वर्ग हैं?
यदि मैं इंटरनेट पर Imagenet वर्गों के लिए कई स्रोतों में से एक को देखता हूं तो मुझे मानव से संबंधित एक भी वर्ग नहीं मिल सकता है (और नहीं, कटनी करने वाला कोई ऐसा व्यक्ति नहीं है जो फसल काटता है, लेकिन यह वही है जिसे मैं डैडी लॉन्गलेग …

5
मशीन लर्निंग के लिए शुरुआती गणित की किताबें
मैं सांख्यिकी या उन्नत गणित में कोई पृष्ठभूमि नहीं के साथ एक कंप्यूटर विज्ञान इंजीनियर हूँ। मैं रसचका और मिरजिली द्वारा पाइथन मशीन लर्निंग की किताब का अध्ययन कर रहा हूं , लेकिन जब मैंने मशीन लर्निंग के गणित को समझने की कोशिश की, तो मैं उस महान पुस्तक को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.