सांख्यिकी और बिग डेटा unsupervised-learning

1

दूर की निगरानी: पर्यवेक्षण, अर्ध-पर्यवेक्षण, या दोनों?

"दूर का पर्यवेक्षण" एक सीखने की योजना है जिसमें एक क्लासिफायरियर को एक कमजोर लेबल प्रशिक्षण सेट दिया जाता है (प्रशिक्षण डेटा स्वचालित रूप से हेयूरिस्टिक्स / नियमों के आधार पर लेबल किया जाता है)। मुझे लगता है कि दोनों पर्यवेक्षित शिक्षण, और अर्ध-पर्यवेक्षित शिक्षण में ऐसे "दूर के पर्यवेक्षण" …

20 machine-learning data-mining dataset references unsupervised-learning

1

K- साधन क्लस्टरिंग में समूहों की संख्या को कैसे परिभाषित करें?

क्या इष्टतम क्लस्टर संख्या निर्धारित करने का कोई तरीका है या क्या मुझे विभिन्न मूल्यों की कोशिश करनी चाहिए और सर्वोत्तम मूल्य तय करने के लिए त्रुटि दर की जांच करनी चाहिए?

19 clustering unsupervised-learning

4

पदानुक्रमिक क्लस्टरिंग की कमियों को कैसे समझें?

क्या कोई व्यक्ति पदानुक्रमिक क्लस्टरिंग के पेशेवरों और विपक्षों की व्याख्या कर सकता है? क्या Hierarchical Clustering में K का मतलब समान है? K साधनों पर पदानुक्रमिक क्लस्टरिंग के क्या लाभ हैं? कब हमें Hierarchical Clustering & विपरीत पर K का उपयोग करना चाहिए? इस पोस्ट के उत्तर में कश्मीर …

19 clustering k-means unsupervised-learning hierarchical-clustering

3

गैर-नकारात्मक मैट्रिक्स कारक में अव्यक्त कारकों की एक इष्टतम संख्या कैसे चुनें?

एक मैट्रिक्स को देखते हुए Vm×nVm×n\mathbf V^{m \times n}, गैर-नकारात्मक मैट्रिक्स फैक्टराइजेशन (NMF) दो गैर-नकारात्मक मैट्रिक्स Wm×kWm×k\mathbf W^{m \times k} और Hk×nHk×n\mathbf H^{k \times n} (सभी तत्वों ≥0≥0\ge 0 ) को अपघटित मैट्रिक्स के रूप में दर्शाता है: V≈WH,V≈WH,\mathbf V \approx \mathbf W\mathbf H, कि गैर नकारात्मक की आवश्यकता द्वारा …

16 cross-validation unsupervised-learning latent-variable matrix-decomposition nnmf

4

जैसे-जैसे पुनरावृत्तियों की संख्या बढ़ती है, धीरे-धीरे बूस्टिंग मशीन की सटीकता कम होती जाती है

मैं caretआर में पैकेज के माध्यम से ढाल बूस्टिंग मशीन एल्गोरिदम का प्रयोग कर रहा हूं । एक छोटे से कॉलेज प्रवेश डेटासेट का उपयोग करते हुए, मैंने निम्नलिखित कोड चलाया: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

4

क्या "अप्रतिबंधित प्रतिगमन" है?

अगर मैं सही हूं, तो "असुरक्षित वर्गीकरण" क्लस्टरिंग के समान है। फिर क्या "अनियंत्रित प्रतिगमन" है? धन्यवाद!

15 regression unsupervised-learning

3

डेटा सम्मिश्रण क्या है?

यह शब्द अक्सर विधि-संबंधित थ्रेड्स में प्रकट होता है । है सम्मिश्रण डाटा माइनिंग और सांख्यिकीय सीखने में एक विशिष्ट विधि? मुझे Google से प्रासंगिक परिणाम नहीं मिल सकता है। ऐसा लगता है कि सम्मिश्रण कई मॉडलों के परिणामों को मिला रहा है और परिणामस्वरूप बेहतर परिणाम मिल रहा है। …

15 machine-learning data-mining unsupervised-learning statistical-learning

4

क्या * एक कृत्रिम तंत्रिका नेटवर्क है?

जैसा कि हम तंत्रिका नेटवर्क साहित्य में तल्लीन करते हैं , हमें न्यूरोमॉर्फिक टोपोलॉजी ("न्यूरल-नेटवर्क"-समान आर्किटेक्चर) के साथ अन्य तरीकों की पहचान करने के लिए मिलता है। और मैं यूनिवर्सल अपीयरेंस प्रमेय के बारे में बात नहीं कर रहा हूं । उदाहरण नीचे दिए गए हैं। फिर, यह मुझे आश्चर्यचकित …

15 machine-learning neural-networks deep-learning unsupervised-learning supervised-learning

4

क्लस्टर के आकार को कैसे मापें?

मुझे पता है कि इस सवाल को अच्छी तरह से परिभाषित नहीं किया गया है, लेकिन कुछ समूहों में अण्डाकार होते हैं या निचले आयामी स्थान पर झूठ होते हैं, जबकि दूसरे में अरेखीय आकार (2 डी या 3 डी उदाहरणों में) होते हैं। क्या गुच्छों की गैर-शुद्धता (या "आकृति") …

14 unsupervised-learning clustering

3

वर्गीकरण के लिए टी-एसएनई का उपयोग करके हाइपरपामेटर्स का चयन करना

मैं (एक प्रतियोगिता) के साथ काम करने वाली विशिष्ट समस्या के रूप में मेरे पास follwoing सेटिंग है: 21 विशेषताएं ([0,1] पर संख्यात्मक) और एक बाइनरी आउटपुट। मेरे पास लगभग 100 K पंक्तियाँ हैं। सेटिंग बहुत शोर करने लगती है। मैं और अन्य प्रतिभागी कुछ समय के लिए फ़ीचर जेनरेशन …

13 machine-learning dimensionality-reduction unsupervised-learning tsne

4

डेटासेट के यादृच्छिक उपसमूह के माध्यम से K- साधन केंद्रों की शुरुआत?

अगर मेरे पास एक निश्चित डेटासेट है, तो उस डेटासेट के यादृच्छिक नमूनों के माध्यम से क्लस्टर केंद्रों को शुरू करना कितना स्मार्ट होगा? उदाहरण के लिए, मान लीजिए कि मुझे चाहिए 5 clusters। मैं मूल डेटासेट के बारे 5 random samplesमें कहता हूं size=20%। फिर मैं इन 5 यादृच्छिक …

13 clustering k-means unsupervised-learning

1

क्या दूर की देखरेख, स्व-प्रशिक्षण, स्व-पर्यवेक्षण सीखने और कमजोर पर्यवेक्षण के बीच कोई अंतर है?

मैंने जो पढ़ा है: दूर की निगरानी : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data and …

12 machine-learning terminology unsupervised-learning semi-supervised

4

क्या आप क्रॉस-वेलिडेशन द्वारा कोई जमीनी सच्चाई वाले डेटासेट पर विभिन्न क्लस्टरिंग विधियों की तुलना कर सकते हैं?

वर्तमान में, मैं एक टेक्स्ट डॉक्यूमेंट डेटासेट का विश्लेषण करने की कोशिश कर रहा हूँ जिसमें कोई जमीनी सच्चाई नहीं है। मुझे बताया गया था कि आप अलग-अलग क्लस्टरिंग विधियों की तुलना करने के लिए k-fold क्रॉस सत्यापन का उपयोग कर सकते हैं। हालाँकि, मैंने पिछले दिनों जो उदाहरण देखे …

12 machine-learning clustering cross-validation unsupervised-learning

2

DDoS फ़िल्टरिंग के लिए मशीन लर्निंग लागू करना

में स्टैनफोर्ड मशीन लर्निंग पाठ्यक्रम एंड्रयू एनजी आईटी में एमएल लागू करने का उल्लेख किया। कुछ समय बाद जब मुझे हमारी साइट पर मध्यम आकार (लगभग 20k बॉट) DDoS मिला, तो मैंने सरल न्यूरल नेटवर्क क्लासिफायर का उपयोग करके इसके खिलाफ लड़ने का फैसला किया। मैंने लगभग 30 मिनट में …

12 classification neural-networks unsupervised-learning

5

नाममात्र / परिपत्र चर के लिए SOM क्लस्टरिंग

बस सोच रहा था कि कोई भी नाममात्र इनपुट क्लस्टरिंग से परिचित है। मैं एसओएम को एक समाधान के रूप में देख रहा हूं लेकिन जाहिर तौर पर यह केवल संख्यात्मक विशेषताओं के साथ काम करता है। क्या श्रेणीबद्ध विशेषताओं के लिए कोई एक्सटेंशन हैं? विशेष रूप से मैं संभावित …

11 clustering unsupervised-learning self-organizing-maps

unsupervised-learning पर टैग किए गए जवाब