सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
Dirichlet वितरण में वास्तव में अल्फा क्या है?
मैं बायेसियन आंकड़ों के लिए काफी नया हूं और मैं एक सही सहसंबंध उपाय, स्पारसीसी पर आया हूं , जो कि एल्गोरिथ्म के बैकएंड में डिरिक्लेट प्रक्रिया का उपयोग करता है। मैं एल्गोरिथ्म चरण-दर-चरण के माध्यम से जाने की कोशिश कर रहा हूं कि वास्तव में क्या हो रहा है, …

5
क्या संभावना सिद्धांत गैर-नकारात्मक कार्यों का अध्ययन है जो एक को एकीकृत / योग करता है?
यह संभवतः एक मूर्खतापूर्ण प्रश्न है, लेकिन क्या संभाव्यता सिद्धांत उन कार्यों के अध्ययन को एकीकृत करता है जो एक को एकीकृत / योग करते हैं? संपादित करें। मैं गैर-नकारात्मकता भूल गया। तो क्या संभावना सिद्धांत गैर-नकारात्मक कार्यों का अध्ययन है जो एक को एकीकृत / योग करता है?

6
ROC AUC और F1 स्कोर के बीच चयन कैसे करें?
मैंने हाल ही में एक कागज़ प्रतियोगिता पूरी की जिसमें प्रतियोगिता की आवश्यकता के अनुसार आरयूसी स्कोर का उपयोग किया गया था। इस परियोजना से पहले, मैं आमतौर पर मॉडल प्रदर्शन को मापने के लिए मीट्रिक के रूप में f1 स्कोर का उपयोग करता था। आगे बढ़ते हुए, मुझे आश्चर्य …

3
आर कैरेट और एनए
मैं इसके पैरामीटर ट्यूनिंग क्षमता और एकसमान इंटरफ़ेस के लिए बहुत अधिक पसंद करता हूं, लेकिन मैंने देखा है कि इसे हमेशा पूर्ण डेटासेट की आवश्यकता होती है (यानी NA के बिना) भले ही "नग्न" मॉडल NAs की अनुमति देता हो। यह बहुत ही कष्टप्रद है, इस बारे में कि …

1
पीसीए के साथ प्राप्त निम्न-रैंक सन्निकटन मैट्रिक्स द्वारा पुनर्निर्माण त्रुटि का क्या मानदंड न्यूनतम है?
मैट्रिक्स के पीसीए (या SVD) सन्निकटन को देखते हुए के साथ एक मैट्रिक्स , हम जानते हैं कि का सबसे अच्छा कम रैंक अनुमान होता है ।एक्स एक्स एक्सXXXX^X^\hat XX^X^\hat XXXX क्या यह प्रेरित मानदंड∥⋅∥2∥⋅∥2\parallel \cdot \parallel_2 (यानी सबसे बड़ा स्वदेशी मानदंड) के अनुसार या फ्रोबेनियस मानदंड के अनुसार है?∥⋅∥F∥⋅∥F\parallel …

5
वितरण में अभिसरण और संभाव्यता में अभिसरण की सहज व्याख्या
वितरण में परिवर्तित होने वाले एक यादृच्छिक चर में एक यादृच्छिक चर के बीच सहज अंतर क्या है ? मैंने कई परिभाषाएँ और गणितीय समीकरण पढ़े हैं, लेकिन यह वास्तव में मदद नहीं करता है। (कृपया ध्यान रखें, मैं अर्थमिति का अध्ययन करने वाला स्नातक छात्र हूं।) एक यादृच्छिक चर …

7
वितरण परिकल्पना परीक्षण - यदि आप अपनी अशक्त परिकल्पना को "स्वीकार" नहीं कर सकते हैं तो यह करने का क्या मतलब है?
विभिन्न परिकल्पना परीक्षण, जैसे कि GOF परीक्षण, कोलमोगोरोव-स्मिरनोव, एंडरसन-डार्लिंग, आदि इस मूल प्रारूप का पालन करते हैं:χ2χ2\chi^{2} एच0एच0H_0 : डेटा दिए गए वितरण का अनुसरण करता है। एच1एच1H_1 : डेटा दिए गए वितरण का पालन नहीं करता है। आमतौर पर, कोई यह दावा करता है कि कुछ दिए गए डेटा …

1
वैरिएबल बे और ईएम के बीच संबंध
मैंने कहीं पढ़ा है कि वेरिएशन बेयस पद्धति ईएम एल्गोरिदम का एक सामान्यीकरण है। दरअसल, एल्गोरिदम के पुनरावृत्त भाग बहुत समान हैं। यह जांचने के लिए कि क्या EM एल्गोरिथ्म वैरिएशनल बे का एक विशेष संस्करण है, मैंने निम्नलिखित की कोशिश की: एक्स Θ पी ( एक्स , Θ | …

1
एक-बनाम-सब और एक-बनाम-एक svm में?
एक-बनाम-सभी और एक-बनाम-एक एसवीएम क्लासिफायरियर के बीच अंतर क्या है? क्या नई छवि के सभी प्रकार / श्रेणियों को वर्गीकृत करने के लिए वन-बनाम-ऑल का मतलब एक क्लासिफायर है और एक-बनाम-एक का मतलब है प्रत्येक प्रकार / नई छवि की श्रेणी विभिन्न क्लासिफायरियर के साथ वर्गीकृत होती है (प्रत्येक श्रेणी …

5
इन कथनों का माध्य के लिए 95% CI से तार्किक रूप से अनुसरण क्यों नहीं किया जाता है?
मैं "आत्मविश्वास अंतराल के मजबूत गलत अर्थ" पर होकेस्ट्रा एट अल 2014 का पेपर पढ़ रहा हूं, जिसे मैंने वागेनमेकर्स की वेबसाइट से डाउनलोड किया है । पृष्ठ के पृष्ठ पर निम्न छवि दिखाई देती है। लेखकों के अनुसार, गलत इन सभी कथनों का सही उत्तर है। मुझे बहुत यकीन …

2
अशक्त परिकल्पना के तहत रेखीय प्रतिगमन में का वितरण क्या है ? जब है तो इसका मोड शून्य पर क्यों नहीं है ?
परिकल्पना तहत रैखिक अविभाजित एकाधिक प्रतिगमन में निर्धारण, या R वर्ग, के गुणांक का वितरण क्या है ?आर 2 एच 0 : β = 0R2R^2H0:β=0H_0:\beta=0 यह भविष्यवाणियों की संख्या और नमूनों की संख्या पर कैसे निर्भर करता है ? क्या इस वितरण की विधा के लिए एक बंद-रूप अभिव्यक्ति है?k …

2
पाइथन का स्किट-लर्न एलडीए सही ढंग से काम क्यों नहीं कर रहा है और यह एसवीडी के माध्यम से एलडीए की गणना कैसे करता है?
मैं scikit-learnमशीन लर्निंग लाइब्रेरी (Python) से रैखिक डिस्क्रिमिनेटर एनालिसिस (LDA) का उपयोग आयामी कमी के लिए कर रहा था और परिणामों के बारे में थोड़ा उत्सुक था। मैं अब सोच रहा हूं कि एलडीए क्या scikit-learnकर रहा है ताकि परिणाम अलग दिखें, उदाहरण के लिए, आर में किया गया एक …


2
विभेदक विश्लेषण के तीन संस्करण: मतभेद और उनका उपयोग कैसे करें
क्या कोई मतभेदों की व्याख्या कर सकता है और विशिष्ट उदाहरण दे सकता है कि इन तीन विश्लेषणों का उपयोग कैसे करें? LDA - रेखीय विभेदक विश्लेषण एफडीए - फिशर के भेदभावपूर्ण विश्लेषण QDA - द्विघात विवेचन विश्लेषण मैंने हर जगह खोज की, लेकिन वास्तविक मूल्यों के साथ वास्तविक उदाहरणों …

3
माध्य को खोजने से सेंट्रोइड कैसे अलग है?
पदानुक्रमित क्लस्टरिंग करते समय, कोई भी क्लस्टर के बीच की दूरी को मापने के लिए कई मैट्रिक्स का उपयोग कर सकता है। इस तरह के दो मैट्रिक्स समूहों में डेटा बिंदुओं के केंद्रक और साधनों की गणना करते हैं। माध्य और केन्द्रक के बीच अंतर क्या है? क्या ये क्लस्टर …
26 clustering  mean 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.