data-mining पर टैग किए गए जवाब

डेटा माइनिंग पहले अज्ञात पैटर्न को खोजने के लिए डेटाबेस संदर्भ में कृत्रिम बुद्धिमत्ता से तरीकों का उपयोग करता है। इस प्रकार, विधियां आमतौर पर अनसुनी की जाती हैं। यह बारीकी से संबंधित है, लेकिन मशीन सीखने के समान नहीं है। डेटा-माइनिंग के प्रमुख कार्य हैं क्लस्टर विश्लेषण, बाह्य नियमों का पता लगाना और खनन करना।

2
पिछली घटनाओं के समय के आधार पर, अगली घटना होने पर कैसे भविष्यवाणी करें?
मैं एक हाई स्कूल का छात्र हूँ और मैं एक कंप्यूटर प्रोग्रामिंग प्रोजेक्ट पर काम कर रहा हूँ, लेकिन मुझे हाई स्कूल के आँकड़ों से परे आँकड़ों और मॉडलिंग के डेटा का बहुत अनुभव नहीं है इसलिए मैं थोड़े उलझन में हूँ। मूल रूप से, मेरे पास एक यथोचित बड़ी …

7
मशीन लर्निंग में बायस्ड डेटा
मैं डेटा के साथ मशीन लर्निंग प्रोजेक्ट पर काम कर रहा हूं जो डेटा चयन द्वारा पहले से ही (भारी) पक्षपाती है। मान लेते हैं कि आपके पास कठिन कूट नियमों का एक सेट है। आप इसे बदलने के लिए मशीन लर्निंग मॉडल का निर्माण कैसे करते हैं, जब इसका …

3
इंटरैक्टिव डेटा विज़ुअलाइज़ेशन का उपयोग कब उपयोगी है?
एक बात की तैयारी करते हुए, मैं जल्द ही दे दूंगा, मैंने हाल ही में इंटरेक्टिव डेटा विज़ुअलाइज़ेशन के लिए दो प्रमुख (फ्री) टूल्स में खुदाई शुरू की: जीजीबी और मॉन्ड्रियन - दोनों क्षमताओं की एक बड़ी रेंज पेश करते हैं (भले ही वे थोड़ी छोटी गाड़ी हों)। मैं आर्टिकुलेटिंग …

2
किन परिस्थितियों में ग्रेडिएंट बूस्टिंग मशीन आउटपरफॉर्म रैंडम फॉरेस्ट करती हैं?
क्या फ्रेडमैन की ग्रेडिंग बूस्टिंग मशीन ब्रेमेन के रैंडम फॉरेस्ट से बेहतर प्रदर्शन हासिल कर सकती है ? यदि हां, तो किन स्थितियों में या किस तरह का डेटा सेट gbm को बेहतर बना सकता है?

2
अत्यधिक असंतुलित डेटा सेट के लिए प्रशिक्षण दृष्टिकोण
मेरे पास अत्यधिक असंतुलित परीक्षण डेटा सेट है। सकारात्मक सेट में 100 मामले होते हैं जबकि नकारात्मक सेट में 1500 मामले होते हैं। प्रशिक्षण पक्ष में, मेरे पास एक बड़ा उम्मीदवार पूल है: सकारात्मक प्रशिक्षण सेट में 1200 मामले हैं और नकारात्मक प्रशिक्षण सेट में 12000 मामले हैं। इस तरह …

3
डेटा सम्मिश्रण क्या है?
यह शब्द अक्सर विधि-संबंधित थ्रेड्स में प्रकट होता है । है सम्मिश्रण डाटा माइनिंग और सांख्यिकीय सीखने में एक विशिष्ट विधि? मुझे Google से प्रासंगिक परिणाम नहीं मिल सकता है। ऐसा लगता है कि सम्मिश्रण कई मॉडलों के परिणामों को मिला रहा है और परिणामस्वरूप बेहतर परिणाम मिल रहा है। …

10
डेटा-माइनिंग सॉफ्टवेयर टूल का एक सर्वेक्षण
यद्यपि मुझे एक इंजीनियर के रूप में प्रशिक्षित किया गया था, लेकिन मुझे लगता है कि मैं डेटा खनन में अधिक दिलचस्पी ले रहा हूं। अभी मैं आगे क्षेत्र की जांच करने की कोशिश कर रहा हूं। विशेष रूप से, मैं सॉफ्टवेयर टूल्स की विभिन्न श्रेणियों को समझना चाहूंगा जो …

4
अव्यक्त सुविधाओं का अर्थ?
मैं अनुशंसाकर्ता प्रणालियों के लिए मैट्रिक्स फैक्टरलाइज़ेशन मॉडल को समझने की कोशिश कर रहा हूं और मैं हमेशा 'अव्यक्त विशेषताओं' को पढ़ता हूं, लेकिन इसका क्या मतलब है? मुझे पता है कि एक प्रशिक्षण डाटासेट के लिए एक सुविधा का क्या मतलब है लेकिन मैं अव्यक्त सुविधाओं के विचार को …

1
लॉजिस्टिक रिग्रेशन और सपोर्ट वेक्टर मशीनों के बीच अंतर?
मुझे पता है कि लॉजिस्टिक रिग्रेशन एक हाइपरप्लेन का पता लगाता है जो प्रशिक्षण के नमूनों को अलग करता है। मुझे यह भी पता है कि सपोर्ट वेक्टर मशीनें हाइपरप्लेन को अधिकतम मार्जिन के साथ ढूंढती हैं। मेरा प्रश्न: अंतर है तो लॉजिस्टिक रिग्रेशन (LR) और सपोर्ट वेक्टर मशीन (SVM) …

3
हम अन्य एल्गोरिदम के बजाय k- साधनों का उपयोग क्यों करते हैं?
मैंने k- साधनों के बारे में शोध किया और ये मुझे मिले: k-mean सबसे सरल एल्गोरिथ्म में से एक है जो ज्ञात क्लस्टरिंग समस्याओं को हल करने के लिए अप्रशिक्षित शिक्षण पद्धति का उपयोग करता है। यह बड़े डेटासेट के साथ वास्तव में अच्छी तरह से काम करता है। हालांकि, …

2
क्वांटाइल मॉडलिंग में मॉडल का प्रदर्शन
मैं मात्रात्मक प्रतिगमन का उपयोग कर रहा हूं (उदाहरण के लिए gbmया quantregआर के माध्यम से ) - मध्यिका पर ध्यान केंद्रित नहीं कर रहा है, बल्कि एक ऊपरी मात्रात्मक (जैसे 75%)। भविष्य कहनेवाला मॉडलिंग पृष्ठभूमि से आ रहा है, मैं मापना चाहता हूं कि मॉडल एक परीक्षण सेट पर …

3
फ्लोचार्ट उचित विश्लेषण तकनीक और परीक्षण का चयन करने में मदद करने के लिए
जैसा कि किसी को सांख्यिकीय ज्ञान की आवश्यकता है, लेकिन औपचारिक रूप से प्रशिक्षित सांख्यिकीविद् नहीं है, मुझे एक विशेष समस्या को हल करने के लिए सही दृष्टिकोण का चयन करने में मेरी मदद करने के लिए एक फ़्लोचार्ट (या किसी प्रकार का निर्णय वृक्ष) का उपयोग करना उपयोगी होगा। …

4
क्या कोई गैर-दूरी आधारित क्लस्टरिंग एल्गोरिदम हैं?
ऐसा लगता है कि K- साधन और अन्य संबंधित एल्गोरिदम के लिए, क्लस्टरिंग बिंदुओं के बीच की दूरी की गणना करने पर आधारित है। क्या कोई ऐसा है जो इसके बिना काम करता है?

3
फैक्टराइजेशन मशीनों और मैट्रिक्स फैक्टराइजेशन के बीच अंतर?
मैं सिफारिश प्रणाली में फैक्टराइजेशन मशीनें शब्द से आया था। मुझे पता है कि मैट्रिक्स फैक्टराइजेशन सिफारिश करने वाले सिस्टम के लिए है लेकिन फैक्टराइजेशन मशीनों के बारे में कभी नहीं सुना। तो क्या अंतर है?

2
वर्गीकरण और प्रतिगमन पेड़ों के पीछे गणित
क्या कोई CART में वर्गीकरण के पीछे के गणित को समझाने में मदद कर सकता है? मैं यह समझना चाहता हूं कि दो मुख्य चरण कैसे होते हैं। उदाहरण के लिए, मैंने एक डेटासेट पर एक कार्ट क्लास क्लासीफायर को प्रशिक्षित किया और अपने पूर्वानुमान के प्रदर्शन को चिह्नित करने …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.