data-mining पर टैग किए गए जवाब

डेटा माइनिंग पहले अज्ञात पैटर्न को खोजने के लिए डेटाबेस संदर्भ में कृत्रिम बुद्धिमत्ता से तरीकों का उपयोग करता है। इस प्रकार, विधियां आमतौर पर अनसुनी की जाती हैं। यह बारीकी से संबंधित है, लेकिन मशीन सीखने के समान नहीं है। डेटा-माइनिंग के प्रमुख कार्य हैं क्लस्टर विश्लेषण, बाह्य नियमों का पता लगाना और खनन करना।

2
"बड़े डेटा" से वैध निष्कर्ष कैसे निकालें?
"बिग डेटा" मीडिया में हर जगह है। हर कोई कहता है कि "बड़ा डेटा" 2012 के लिए बड़ी बात है, उदाहरण के लिए KDNuggets 2012 के लिए गर्म विषयों पर सर्वेक्षण । हालाँकि, मेरी यहाँ गहरी चिंताएँ हैं। बड़े डेटा के साथ, हर कोई बस कुछ भी पाने के लिए …

5
डेटा खनन में लिफ्ट उपाय
मैंने यह जानने के लिए कई वेबसाइटों को खोजा कि वास्तव में लिफ्ट क्या करेगी? मुझे जो परिणाम मिले, वे सभी अनुप्रयोगों में इसका उपयोग करने के बारे में थे, स्वयं नहीं। मुझे समर्थन और विश्वास समारोह के बारे में पता है। विकिपीडिया से, डाटा माइनिंग में, लिफ्ट एक मॉडल …

5
एक बायसी की तरह सोचें, एक अतिवादी की तरह जांच करें: इसका क्या मतलब है?
मैं एक डेटा विज्ञान पाठ्यक्रम पर कुछ व्याख्यान स्लाइड्स को देख रहा हूं जो यहां पाया जा सकता है: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf मैं, दुर्भाग्य से, इस व्याख्यान के लिए और स्लाइड पर एक बिंदु पर वीडियो नहीं देख सकता, प्रस्तुतकर्ता के पास निम्न पाठ है: कुछ प्रमुख सिद्धांत बायेसियन की तरह सोचें, …

3
मैन्युअल रूप से एक लॉजिस्टिक प्रतिगमन 95% आत्मविश्वास अंतराल की गणना करने और आर में कॉन्फिन () फ़ंक्शन का उपयोग करने के बीच अंतर क्यों है?
प्रिय हर कोई - मैंने कुछ अजीब देखा है जो मैं समझा नहीं सकता, क्या आप कर सकते हैं? सारांश में: लॉजिस्टिक रिग्रेशन मॉडल में एक आत्मविश्वास अंतराल की गणना करने के लिए मैनुअल दृष्टिकोण, और आर फ़ंक्शन confint()अलग-अलग परिणाम देते हैं। मैं होस्मेर और लेमेशो के एप्लाइड लॉजिस्टिक रिग्रेशन …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

6
डेटा माइनिंग: मुझे कार्यात्मक रूप खोजने के बारे में कैसे जाना चाहिए?
मैं repeatable प्रक्रियाओं समारोह के कार्यात्मक रूप की खोज के लिए इस्तेमाल किया जा सकता है कि के बारे में उत्सुक हूँ y = f(A, B, C) + error_termजहाँ मेरे ही इनपुट टिप्पणियों का एक सेट है ( y, A, Bऔर C)। कृपया ध्यान दें कि कार्यात्मक रूप fअज्ञात है। …

1
बूस्टिंग के लिए सापेक्ष चर महत्व
मैं इस बात की व्याख्या कर रहा हूं कि कैसे ग्रेडिएंट बूस्टेड पेड़ों में सापेक्ष परिवर्तनीय महत्व की गणना की जाती है जो सामान्य रूप से सामान्य / सरल नहीं है: उपायों को विभाजित करने के लिए चर का चयन करने की संख्या के आधार पर किया जाता है, प्रत्येक …

1
क्या "बाइबल संहिता" प्रकरण से सांख्यिकीय सबक हैं
यद्यपि यह प्रश्न कुछ व्यक्तिपरक है, मुझे उम्मीद है कि यह faq दिशानिर्देशों के अनुसार एक अच्छा व्यक्तिपरक प्रश्न है । यह एक प्रश्न पर आधारित है कि ओले हेगस्ट्रॉसम ने मुझसे एक साल पहले पूछा था और हालांकि मेरे पास इसके बारे में कुछ विचार हैं, मेरे पास निश्चित …

8
डेटा खनन और मशीन सीखने के लिए आप कौन से गणित विषय सुझाएंगे?
मैं डेटा माइनिंग और मशीन लर्निंग सीखने की तैयारी के लिए एक स्व-निर्देशित गणित पाठ्यक्रम को एक साथ रखने की कोशिश कर रहा हूं। यह कोर्टेरा पर एंड्रयू एनजी की मशीन सीखने की कक्षा शुरू करने और महसूस करने से प्रेरित है कि आगे बढ़ने से पहले मुझे अपने गणित …

2
एक चरणबद्ध चयन करने के बाद पी-वैल्यू भ्रामक क्यों हैं?
आइए उदाहरण के लिए एक रेखीय प्रतिगमन मॉडल पर विचार करें। मैंने सुना है कि, डेटा माइनिंग में, AIC मानदंड के आधार पर एक स्टेपवाइज़ सिलेक्शन करने के बाद, n की परिकल्पना का परीक्षण करने के लिए पी-वैल्यूज़ को देखना भ्रामक है कि प्रत्येक सच्चा प्रतिगमन गुणांक शून्य है। मैंने …

1
मानक और गोलाकार k- साधन एल्गोरिदम के बीच अंतर
मैं यह समझना चाहता हूं कि मानक और गोलाकार k- साधन क्लस्टरिंग एल्गोरिदम के बीच प्रमुख कार्यान्वयन अंतर क्या है। प्रत्येक चरण में, k- साधन तत्व वैक्टर और क्लस्टर सेंट्रोइड के बीच की दूरी की गणना करता है, और इस क्लस्टर में दस्तावेज़ को पुन: असाइन करता है, जिसका सेंट्रोइड …

9
सांख्यिकी और डेटा खनन सॉफ्टवेयर उपकरण बड़े डेटासेट से निपटने के लिए
वर्तमान में मुझे लगभग 20M रिकॉर्ड का विश्लेषण करना है और भविष्यवाणी मॉडल का निर्माण करना है। अब तक मैंने स्टैटिस्टिका, एसपीएसएस, रैपिडमाइनर और आर। की कोशिश की है। इनमें से स्टेटिस्टिका डेटा माइनिंग से निपटने के लिए सबसे उपयुक्त प्रतीत होती है और रैपिडमाइनर यूजर इंटरफेस भी बहुत काम …

7
मशीन सीखने वाले वैज्ञानिक की दैनिक नौकरी की दिनचर्या क्या है?
मैं एक जर्मन विश्वविद्यालय में मास्टर सीएस छात्र हूं जो अब मेरी थीसिस लिख रहा है। मुझे दो महीने में किया जाएगा मुझे बहुत कठिन निर्णय लेना है अगर मुझे पीएचडी जारी रखना चाहिए या उद्योग में नौकरी ढूंढनी चाहिए। पीएचडी करने के मेरे कारण: मैं बहुत जिज्ञासु व्यक्ति हूं …

3
एलएसए बनाम पीसीए (दस्तावेज़ क्लस्टरिंग)
मैं दस्तावेज़ क्लस्टरिंग में उपयोग की जाने वाली विभिन्न तकनीकों की जांच कर रहा हूं और मैं पीसीए (प्रमुख घटक विश्लेषण) और एलएसए (अव्यक्त अर्थ विश्लेषण) से संबंधित कुछ संदेह दूर करना चाहूंगा। पहली बात - उनके बीच क्या अंतर हैं? मुझे पता है कि पीसीए में, एसवीडी अपघटन टर्म-कोवरियन …

3
मल्टीलेबल डेटा की सटीकता के लिए क्या उपाय हैं?
एक परिदृश्य पर विचार करें, जहाँ आपको KnownLabel मैट्रिक्स और PredencedLabel मैट्रिक्स प्रदान किया गया है। मैं ज्ञात लॉबेल मैट्रिक्स के खिलाफ प्रेडिक्टेलबेल मैट्रिक्स की अच्छाई को मापना चाहता हूं। लेकिन यहां चुनौती यह है कि नाउनलैबेल मैट्रिक्स की कुछ पंक्तियाँ केवल एक 1 है और दूसरी कुछ पंक्तियों में …

2
हानि फ़ंक्शन और निर्णय फ़ंक्शन के बीच अंतर क्या है?
मैं देखता हूं कि दोनों फ़ंक्शन डेटा माइनिंग विधियों जैसे कि ग्रेडिएंट बूस्टिंग रेजिस्टर्स का हिस्सा हैं। मैं देखता हूं कि वे अलग-अलग वस्तुएं भी हैं। दोनों का रिश्ता सामान्य रूप से कैसा है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.