सांख्यिकी और बिग डेटा data-mining

2

मैं सामान्य विषयों द्वारा कैसे तार कर सकता हूं?

मैं समूह का प्रयास कर रहा हूं, उदाहरण के लिए, प्रोग्रामिंग के बारे में अन्य तार के साथ प्रोग्रामिंग के बारे में तार, भौतिकी के बारे में अन्य तार के साथ भौतिकी के बारे में, आदि विषयों की एक विस्तृत श्रृंखला के लिए। समस्या के भयावह सैद्धांतिक भाषाई पहलू के …

10 natural-language data-mining

3

डेटासेट पर पहली त्वरित नज़र

कृपया मेरी अज्ञानता को क्षमा करें, लेकिन ... मैं खुद को एक स्थिति में पाता रहता हूं, जहां मुझे नए डेटा का एक गुच्छा मिला है, जिसे मैं खोजने में कामयाब रहा। यह डेटा आमतौर पर कुछ इस तरह दिखता है: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog …

10 data-visualization correlation data-mining eda

1

मैं क्रैश और सिस्टम वातावरण के बीच सहसंबंध कैसे पा सकता हूं?

अपने खाली समय में, मैं एक छोटी वेब आधारित प्रणाली पर काम कर रहा हूं, जो डेल्फी विंडोज अनुप्रयोगों से भेजे गए क्रैश रिपोर्ट (लेकिन अन्य नहीं, गैर-क्रैश बग रिपोर्ट) एकत्र करता है। समस्या निवारण के लिए, उपयोगकर्ताओं को हार्डवेयर या ऑपरेटिंग सिस्टम संस्करणों और विशिष्ट बग और / या …

10 data-mining

1

अर्थमितीय विधियों के सफल वास्तविक दुनिया अनुप्रयोगों के प्रलेखित / प्रतिलिपि प्रस्तुत करने योग्य उदाहरण?

यह सवाल बहुत व्यापक लग सकता है, लेकिन यहां वह है जिसकी मुझे तलाश है। मुझे पता है कि अर्थमितीय विधियों के बारे में कई उत्कृष्ट किताबें हैं, और अर्थमितीय तकनीकों के बारे में कई उत्कृष्ट लेख हैं। इस क्रॉसविलेस्ड प्रश्न में वर्णित अर्थमिति के उत्कृष्ट प्रतिलिपि प्रस्तुत करने योग्य …

10 r machine-learning forecasting data-mining econometrics

2

कार्यात्मक डेटा विश्लेषण और उच्च आयामी डेटा विश्लेषण के बीच अंतर क्या है

सांख्यिकीय साहित्य में " कार्यात्मक डेटा " (यानी डेटा जो घटता है), और समानांतर में, " उच्च आयामी डेटा " (यानी जब डेटा उच्च आयामी वैक्टर हैं) में बहुत सारे संदर्भ हैं। मेरा प्रश्न दो प्रकार के डेटा के बीच अंतर के बारे में है। जब केस 1 में लागू …

10 data-mining signal-processing curve-fitting wavelet

6

एक प्रवृत्ति की पहचान करने के लिए सिग्नल प्रोसेसिंग सिद्धांतों का संदिग्ध उपयोग

मैं कुछ बहुत शोर दीर्घकालिक डेटा में एक प्रवृत्ति खोजने और प्रयास करने का प्रस्ताव कर रहा हूं। डेटा मूल रूप से किसी चीज़ का साप्ताहिक माप है जो लगभग 8 महीने की अवधि में 5 मिमी से अधिक हो गया है। डेटा 1 मिमी सटीकता के लिए है और …

10 time-series data-mining signal-processing trend

1

K- साधन: व्यावहारिक स्थितियों में कितने पुनरावृत्तियों?

मेरे पास डेटा माइनिंग या बड़े डेटा में उद्योग का अनुभव नहीं है इसलिए आपको कुछ अनुभव साझा करने के लिए सुनना अच्छा लगेगा। क्या वास्तव में बड़े डेटासेट पर लोग k- साधन, PAM, CLARA आदि चलाते हैं? या वे सिर्फ बेतरतीब ढंग से इसका एक नमूना निकालते हैं? यदि …

10 clustering data-mining k-means convergence large-data

2

अधिकतम और बंद अक्सर - उत्तर शामिल हैं

मy घएक टी एक रों ई टी :My dataset:My \ \ dataset: 1 : ए , बी , सी, ई1:A,B,C,E1: A,B,C,E 2 : ए , सी, डी , ई2:A,C,D,E2:A,C,D,E 3 : बी , सी , ई3: B,C,E3:\ \ \ \ \ B,C,E 4 : ए , सी, डी , ई4:A,C,D,E4:A,C,D,E …

10 data-mining dataset association-rules

1

रेखीय प्रतिगमन श्रेणीगत चर "छिपा हुआ" मान

यह सिर्फ एक उदाहरण है कि मैं कई बार आया हूं, इसलिए मेरे पास कोई नमूना डेटा नहीं है। R में एक रैखिक प्रतिगमन मॉडल चलाना: a.lm = lm(Y ~ x1 + x2) x1एक सतत चर है। x2श्रेणीबद्ध है और इसके तीन मान हैं "उदा", "मध्यम" और "उच्च"। हालाँकि R …

10 r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

5

डेटा खनन के बारे में वीडियो व्याख्यान?

मैं डाटा माइनिंग सीखना चाहता हूं। क्या कोई मुफ्त वीडियो व्याख्यान हैं जो डेटा खनन की प्रक्रिया को गहराई से समझाते हैं?

10 references data-mining

2

बूस्ट आउट करने के लिए बैग त्रुटि का अनुमान?

रैंडम फ़ॉरेस्ट में, प्रत्येक पेड़ को डेटा के एक अद्वितीय बूस्टर नमूना के समानांतर में उगाया जाता है। क्योंकि प्रत्येक बूस्टअप सैंपल में लगभग 63% अनोखी टिप्पणियों के होने की उम्मीद है, यह लगभग 37% टिप्पणियों को छोड़ देता है, जिसका उपयोग पेड़ के परीक्षण के लिए किया जा सकता …

9 machine-learning cross-validation data-mining random-forest boosting

2

क्या CART के पेड़ भविष्यवक्ताओं के बीच बातचीत पर कब्जा करते हैं?

यह पेपर दावा करता है कि CART में, क्योंकि प्रत्येक चरण पर एक एकल कोवरिएट पर एक बाइनरी विभाजन किया जाता है, सभी विभाजन ऑर्थोगोनल होते हैं और इसलिए कोवरिएट्स के बीच बातचीत को नहीं माना जाता है। हालांकि, बहुत गंभीर संदर्भों का दावा है, इसके विपरीत, कि पेड़ की …

9 machine-learning classification data-mining cart

1

स्थानीय आउटलेयर फैक्टर (एलओएफ) का पता लगाने के विश्लेषण के लिए के-मूल्य चुनना

मेरे पास तीन-आयामी डेटा का एक सेट है, और मैं सबसे अनोखे या अजीब मूल्यों की पहचान करने के लिए स्थानीय बाहरी कारक विश्लेषण का उपयोग करने की कोशिश कर रहा हूं। LOF विश्लेषण में उपयोग करने के लिए कोई k- मूल्य कैसे तय करता है? मैं समझता हूं कि …

9 data-mining outliers

1

अर्थमिति के लिए टेक्स्ट माइनिंग / प्राकृतिक भाषा प्रसंस्करण टूल का उपयोग करना

मुझे यकीन नहीं है कि यह प्रश्न यहां पूरी तरह से उचित है, यदि नहीं, तो कृपया हटाएं। मैं अर्थशास्त्र में एक स्नातक छात्र हूं। एक प्रोजेक्ट के लिए जो सामाजिक बीमा में मुद्दों की जांच करता है, मेरे पास बड़ी संख्या में प्रशासनिक मामले की रिपोर्ट (> 200k) तक …

9 machine-learning data-mining econometrics text-mining natural-language

5

क्या बेहतर भविष्यवाणी करने वाले मॉडल के निर्माण में मदद करना पसंद है?

मंथन के कार्य के लिए मैं विचार कर रहा था: डेटा के लिए k समूहों की गणना करें प्रत्येक क्लस्टर के लिए k मॉडल व्यक्तिगत रूप से बनाएं। इसके लिए तर्क यह है कि यह साबित करने के लिए कुछ भी नहीं है कि उप-जनसंख्या की आबादी समरूप है, इसलिए …

9 machine-learning clustering data-mining predictive-models

data-mining पर टैग किए गए जवाब