सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
लॉजिस्टिक रिग्रेशन की तुलना में कॉक्स आनुपातिक खतरे वाले मॉडल में पी-वैल्यू अक्सर अधिक क्यों होते हैं?
मैं कॉक्स आनुपातिक खतरे मॉडल के बारे में सीख रहा हूं। मेरे पास लॉजिस्टिक रिग्रेशन मॉडल का अनुभव करने के लिए बहुत सारे अनुभव हैं, और इसलिए अंतर्ज्ञान का निर्माण करने के लिए मैं उन मॉडल की तुलना कर रहा हूं coxphजो आर "अस्तित्व" से फिट होने वाले लॉजिस्टिक रिग्रेशन …

3
यूनिट सर्कल और यूनिट स्क्वायर के बीच कुशलता से अंक उत्पन्न करें
मैं यहाँ परिभाषित नीले क्षेत्र से नमूने उत्पन्न करना चाहता हूँ: भोली समाधान इकाई वर्ग में अस्वीकृति नमूने का उपयोग करना है, लेकिन यह केवल 1−π/41−π/41-\pi/4 (~ 21.4%) दक्षता प्रदान करता है। क्या कोई तरीका है जिससे मैं और अधिक कुशलता से नमूना ले सकता हूं?

4
सरल शब्दों में ड्रॉपआउट नियमितीकरण की व्याख्या कैसे करें?
यदि आपके पास ड्रॉपआउट की व्याख्या करने के लिए आधा पृष्ठ है , तो आप कैसे आगे बढ़ेंगे? इस तकनीक के पीछे तर्क क्या है?

6
वहाँ एक उदाहरण है जहाँ MLE मतलब का एक पक्षपाती अनुमान पैदा करता है?
क्या आप इस बात का एक MLE अनुमानक का उदाहरण प्रदान कर सकते हैं कि पक्षपाती है? मैं एक उदाहरण की तलाश नहीं कर रहा हूं जो नियमित परिस्थितियों का उल्लंघन करके सामान्य रूप से MLE अनुमानकों को तोड़ता है। सभी उदाहरण जो मैं इंटरनेट पर देख सकता हूं, वह …

1
निर्णय वृक्ष का कुलपति आयाम क्या है?
दो आयामों में k स्प्लिट्स के साथ एक निर्णय वृक्ष का VC आयाम क्या है ? बता दें कि मॉडल CART है और केवल अनुमत विभाजन कुल्हाड़ियों के समानांतर हैं। इसलिए एक विभाजन के लिए हम एक त्रिभुज में 3 बिंदुओं को ऑर्डर कर सकते हैं और फिर किसी भी …

1
किसी दिए गए MLE के साथ यादृच्छिक नमूनों का अनुकरण करना
यह क्रॉस वैलिडेटेड प्रश्न जो एक निश्चित राशि पर एक नमूना सशर्त का अनुकरण करने के बारे में पूछ रहा है, ने मुझे जॉर्ज कैसला द्वारा मेरे लिए निर्धारित एक समस्या की याद दिला दी । एक पैरामीट्रिक मॉडल f(x|θ)f(x|θ)f(x|\theta) , और इस मॉडल से एक iid नमूना, , MLE …

3
डिफ़ॉल्ट मैट्रिक्स मान वर्णक्रमीय मानदंड क्यों नहीं फ्रोबेनियस मानदंड है?
वेक्टर मानक के लिए, L2 मानदंड या "यूक्लिडियन दूरी" व्यापक रूप से उपयोग और सहज परिभाषा है। लेकिन मैट्रिक्स के लिए "सबसे अधिक इस्तेमाल किया" या "डिफ़ॉल्ट" मानक परिभाषा वर्णक्रमीय मानदंड क्यों नहीं है , लेकिन फ्रोबेनियस मानदंड (जो वैक्टर के लिए L2 मानदंड के समान है) नहीं? क्या पुनरावृत्त …

4
क्या "आयामीता का अभिशाप" वास्तव में वास्तविक डेटा में मौजूद है?
मैं समझता हूं कि "आयामीता का अभिशाप" क्या है, और मैंने कुछ उच्च आयामी अनुकूलन समस्याओं को किया है और घातीय संभावनाओं की चुनौती को जाना है। हालांकि, मुझे संदेह है कि "आयामीता का अभिशाप" सबसे वास्तविक दुनिया डेटा में मौजूद है (अच्छी तरह से छवियों या वीडियो को एक …

1
LASSO में श्रेणीबद्ध भविष्यवाणियों का इलाज कैसे करें
मैं एक LASSO चला रहा हूं जिसमें कुछ श्रेणीबद्ध चर भविष्यवाणियां हैं और कुछ निरंतर हैं। मेरे पास श्रेणीबद्ध चर के बारे में एक प्रश्न है। पहला चरण जो मैं समझता हूं कि उनमें से प्रत्येक को डमी में तोड़ना है, उन्हें उचित दंड के लिए मानकीकृत करना है, और …

1
क्या BIC एक सच्चे मॉडल को खोजने की कोशिश करता है?
यह प्रश्न एक विषय I और कई अन्य के संबंध में संभावित भ्रम को दूर करने का एक अनुवर्ती या प्रयास है, जो AIC और BIC के बीच के अंतर के बारे में थोड़ा कठिन है। इस विषय (पर @Dave Kellen द्वारा एक बहुत अच्छा जवाब में /stats//a/767/30589 ) हम …

5
यह समझना कि लॉजिस्टिक रिग्रेशन के लिए कौन सी विशेषताएँ सबसे महत्वपूर्ण थीं
मैंने एक लॉजिस्टिक रिग्रेशन क्लासिफ़ायर बनाया है जो मेरे डेटा पर बहुत सटीक है। अब मैं बेहतर तरीके से समझना चाहता हूं कि यह इतना अच्छा क्यों काम कर रहा है। विशेष रूप से, मैं रैंक करना चाहूंगा कि कौन सी सुविधाएँ सबसे बड़ा योगदान दे रही हैं (जो सुविधाएँ …

1
मैट्रिक्स में एक नई पंक्ति जोड़ने के बाद SVD अपघटन को अद्यतन करना
मान लीजिए कि मैं एक घने मैट्रिक्स है के SVD अपघटन के साथ, आकारमें मैं SVD गणना कर सकते हैं इस प्रकार है: ।AA \textbf{A}m×nm×nm \times nA=USV⊤.A=USV⊤.\mathbf{A}=\mathbf{USV}^\top.Rsvd(A) यदि एक नई -th पंक्ति को जोड़ा जाता है , तो क्या कोई पुराने के आधार पर नए SVD अपघटन की गणना कर …

3
R में glm function में किस ऑप्टिमाइज़ेशन एल्गोरिथम का उपयोग किया जाता है?
इस तरह के कोड का उपयोग करके आर में एक लॉगिट रिग्रेशन कर सकता है: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 ऐसा लगता है कि अनुकूलन एल्गोरिथ्म में परिवर्तित हो गया है - फिशर स्कोरिंग एल्गोरिदम …

2
एक असंभव अनुमान समस्या?
सवाल एक नकारात्मक द्विपद (NB) वितरण का विचरण हमेशा अपने मतलब से अधिक होता है। जब किसी नमूने का माध्य उसके विचरण से अधिक होता है, तो अधिकतम संभावना के साथ या पल के आकलन के साथ NB के मापदंडों को फिट करने की कोशिश विफल हो जाएगी (परिमित मापदंडों …

2
LOESS और LOWESS में अंतर
LOESS और LOWESS में क्या अंतर है? से विकिपीडिया मैं केवल देख सकते हैं कि लेस LOWESS का सामान्यीकरण है। क्या उनके पास कुछ अलग पैरामीटर हैं?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.