data-mining पर टैग किए गए जवाब

डेटा माइनिंग पहले अज्ञात पैटर्न को खोजने के लिए डेटाबेस संदर्भ में कृत्रिम बुद्धिमत्ता से तरीकों का उपयोग करता है। इस प्रकार, विधियां आमतौर पर अनसुनी की जाती हैं। यह बारीकी से संबंधित है, लेकिन मशीन सीखने के समान नहीं है। डेटा-माइनिंग के प्रमुख कार्य हैं क्लस्टर विश्लेषण, बाह्य नियमों का पता लगाना और खनन करना।

5
K- साधनों की कमियों को कैसे समझें
K- साधन क्लस्टर विश्लेषण में एक व्यापक रूप से इस्तेमाल की जाने वाली विधि है। मेरी समझ में, इस विधि को किसी भी धारणा की आवश्यकता नहीं है, अर्थात, मुझे एक डेटासेट और पूर्व-निर्दिष्ट संख्या के क्लस्टर, k, और मैं अभी इस एल्गोरिथ्म को लागू करता हूं जो कि चुकता …

12
डाटा माइनिंग, स्टैटिस्टिक्स, मशीन लर्निंग और AI में क्या अंतर है?
डाटा माइनिंग, स्टैटिस्टिक्स, मशीन लर्निंग और AI में क्या अंतर है? क्या यह कहना सही होगा कि वे 4 क्षेत्र समान समस्याओं को हल करने का प्रयास कर रहे हैं लेकिन विभिन्न दृष्टिकोणों के साथ? वास्तव में उनके पास क्या है और वे कहाँ भिन्न हैं? यदि उनके बीच किसी …

4
सादे अंग्रेजी में कोहेन का कप्पा
मैं एक डेटा माइनिंग बुक पढ़ रहा हूं और इसने कापा स्टेटिस्टिक का उल्लेख क्लासिफायर के पूर्वानुमान प्रदर्शन के मूल्यांकन के लिए एक साधन के रूप में किया है। हालाँकि, मैं अभी यह नहीं समझ सकता। मैं भी विकिपीडिया की जाँच की, लेकिन यह बहुत मदद नहीं की: https://en.wikipedia.org/wiki/Cohen's_kappa । …

9
एक यादृच्छिक जंगल से ज्ञान प्राप्त करना
यादृच्छिक जंगलों को ब्लैक बॉक्स माना जाता है, लेकिन हाल ही में मैं सोच रहा था कि एक यादृच्छिक जंगल से क्या ज्ञान प्राप्त किया जा सकता है? सबसे स्पष्ट बात चरों का महत्व है, सबसे सरल रूप में यह सिर्फ चर की घटनाओं की संख्या की गणना करके किया …

11
पीएचडी के बिना डाटा-माइनिंग में नौकरी करना
मैं कुछ समय के लिए डेटा-माइनिंग और मशीन-लर्निंग में बहुत रुचि रखता हूं, आंशिक रूप से क्योंकि मैंने स्कूल में उस क्षेत्र में पढ़ाई की है, लेकिन यह भी क्योंकि मैं वास्तव में उन समस्याओं को हल करने के लिए अधिक उत्साहित हूं, जिन्हें सिर्फ प्रोग्रामिंग की तुलना में थोड़ा …

7
यूक्लिडियन दूरी आमतौर पर विरल डेटा के लिए अच्छा नहीं है?
मैंने कहीं देखा है कि जब हम बहुआयामी और विरल डेटा होते हैं तो शास्त्रीय दूरी (जैसे यूक्लिडियन दूरी) कमजोर रूप से भेदभावपूर्ण हो जाती है। क्यों? क्या आपके पास दो विरल डेटा वैक्टर का उदाहरण है जहां यूक्लिडियन दूरी अच्छा प्रदर्शन नहीं करती है? इस मामले में हमें किस …

8
मशीन सीखने वालों में खोजने के लिए कौशल कठिन?
ऐसा लगता है कि डेटा माइनिंग और मशीन लर्निंग इतनी लोकप्रिय हो गई है कि अब लगभग हर सीएस छात्र को क्लासिफायर, क्लस्टरिंग, स्टेटिस्टिकल एनएलपी ... आदि के बारे में पता है, इसलिए ऐसा लगता है कि आजकल डेटा माइनर्स ढूंढना कोई मुश्किल बात नहीं है। मेरा सवाल है: क्या …

8
मौजूदा चर के लिए एक परिभाषित सहसंबंध के साथ एक यादृच्छिक चर उत्पन्न करें
सिमुलेशन अध्ययन के लिए मुझे यादृच्छिक चर उत्पन्न करना होगा जो मौजूदा चर लिए पूर्वनिर्मित (जनसंख्या) सहसंबंध दिखाते हैं ।YYY मैंने Rपैकेजों पर ध्यान दिया copulaऔर CDVineजो एक दी गई निर्भरता संरचना के साथ यादृच्छिक बहुभिन्नरूपी वितरण का उत्पादन कर सकते हैं। हालाँकि, किसी मौजूदा चर के परिणामस्वरूप चर को …

2
केवल तीन विभाजन क्यों? (प्रशिक्षण, सत्यापन, परीक्षण)
जब आप एक बड़े डेटासेट के लिए मॉडल फिट करने की कोशिश कर रहे हैं, तो आम सलाह डेटा को तीन भागों में विभाजित करना है: प्रशिक्षण, सत्यापन और परीक्षण डेटासेट। ऐसा इसलिए है क्योंकि मॉडल में आमतौर पर मापदंडों के तीन "स्तर" होते हैं: पहला "पैरामीटर" मॉडल वर्ग (जैसे …

12
ग्राफ से डेटा को परिमार्जन करने के लिए आवश्यक सॉफ्टवेयर [बंद]
किसी को भी सॉफ़्टवेयर के साथ कोई भी अनुभव है (अधिमानतः मुक्त, अधिमानतः खुला स्रोत) जो कार्टेशियन निर्देशांक (एक मानक, रोजमर्रा की साजिश) पर प्लॉट किए गए डेटा की एक छवि लेगा और ग्राफ़ पर प्लॉट किए गए बिंदुओं के निर्देशांक को निकाल देगा? अनिवार्य रूप से, यह डेटा-माइनिंग समस्या …

8
क्या data बड़े डेटा ’के समय में नमूना लेना प्रासंगिक है?
या अधिक "तो यह होगा"? बिग डेटा आँकड़ों और प्रासंगिक ज्ञान को और अधिक महत्वपूर्ण बनाता है लेकिन नमूना थ्योरी को रेखांकित करता है। मैंने 'बिग डेटा' के आसपास यह प्रचार देखा है और आश्चर्यचकित नहीं कर सकता कि "क्यों" मैं हर चीज का विश्लेषण करना चाहता हूं ? क्या …

3
क्या हमें "अफ़सोस" की समस्या है?
मुझे पता है, यह लग सकता है जैसे यह ऑफ-टॉपिक है, लेकिन मुझे सुनें। स्टैक ओवरफ्लो में और यहां हमें पदों पर वोट मिलते हैं, यह सब एक सारणीबद्ध रूप में संग्रहीत होता है। उदाहरण के लिए: आईडी आईडी मतदाता आईडी वोट प्रकार डेटाइम ------- -------- --------- -------- 10 1 …

3
के-मीन्स और ईएम के साथ क्लस्टरिंग: वे कैसे संबंधित हैं?
मैंने क्लस्टरिंग डेटा (अप्राप्त शिक्षण) के लिए एल्गोरिदम का अध्ययन किया है: ईएम, और के-साधन। मैं निम्नलिखित पढ़ता हूं: k- साधन EM का एक प्रकार है, इस धारणा के साथ कि क्लस्टर गोलाकार हैं। क्या कोई उपरोक्त वाक्य की व्याख्या कर सकता है? मुझे समझ में नहीं आता है कि …

1
प्रदर्शन मेट्रिक्स अप्रकाशित शिक्षा का मूल्यांकन करने के लिए
अप्रशिक्षित अधिगम (जैसे क्लस्टरिंग) के संबंध में, क्या प्रदर्शन का मूल्यांकन करने के लिए कोई मैट्रिक्स हैं?

3
छिपे हुए मार्कोव मॉडल और तंत्रिका नेटवर्क के बीच अंतर क्या हैं?
मैं सिर्फ अपने पैरों को आंकड़ों में गीला कर रहा हूं इसलिए मुझे खेद है कि अगर यह सवाल समझ में नहीं आता है। मैंने खोज इंजन पर उपयोगकर्ताओं के क्लिक का अध्ययन करने के लिए छिपे हुए राज्यों (अनुचित कैसीनो, डाइस रोल, आदि) और तंत्रिका नेटवर्क की भविष्यवाणी करने …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.