सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए


5
क्या बायेसियन आँकड़े मेटा-विश्लेषण को अप्रचलित बनाते हैं?
मैं बस सोच रहा था कि क्या बायेसियन आँकड़े पहले अध्ययन से अंतिम तक लागू होंगे यदि यह मेटा-विश्लेषण को अप्रचलित बनाता है। उदाहरण के लिए, मान लें कि 20 अध्ययन जो विभिन्न समय बिंदुओं पर किए गए हैं। अनुमान या प्रथम अध्ययन के वितरण एक साथ किया गया था …

5
सांख्यिकीविदों ने यादृच्छिक मेट्रिसेस को क्यों परिभाषित किया?
मैंने एक दशक पहले गणित का अध्ययन किया था, इसलिए मेरे पास एक गणित और सांख्यिकी पृष्ठभूमि है, लेकिन यह प्रश्न मुझे मार रहा है। यह सवाल अभी भी मेरे लिए थोड़ा दार्शनिक है। यादृच्छिक मेट्रिसेस के साथ काम करने के लिए सांख्यिकीविदों ने सभी प्रकार की तकनीकों का विकास …

1
सामान्य रूप से ओवरएम्पलिंग के बारे में राय और विशेष रूप से SMOTE एल्गोरिथ्म [बंद]
बंद हो गया । यह सवाल राय आधारित है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं?प्रश्न को अपडेट करें ताकि इस पोस्ट को संपादित करके तथ्यों और उद्धरणों के साथ उत्तर दिया जा सके । 2 साल पहले बंद हुआ । …

3
क्या तंत्रिका नेटवर्क एक nonlinear वर्गीकरण मॉडल बनाता है?
मैं गैर-रैखिक वर्गीकरण मॉडल के गणितीय अर्थ को समझने की कोशिश कर रहा हूँ: मैंने अभी एक लेख पढ़ा है जिसमें तंत्रिका जाल के बारे में बात की जा रही है जो एक गैर-रैखिक वर्गीकरण मॉडल है। लेकिन मुझे लगता है कि: पहली परत: ज1= एक्स1∗ वएक्स 1 एच 1+ …

4
क्या विचलन मानक विचलन की तुलना में अधिक मौलिक अवधारणा है?
पर इस psychometrics वेबसाइट मुझे लगता है कि पढ़ने के लिए [ए] टा गहरे स्तर का विचलन मानक विचलन की तुलना में अधिक मौलिक अवधारणा है। साइट वास्तव में आगे यह नहीं बताती है कि विचलन मानक विचलन से अधिक मौलिक क्यों है, लेकिन इसने मुझे याद दिलाया कि मैंने …

4
ऑर्डिनरी लिस्ट स्क्वायर क्यों पोइसन रिग्रेशन से बेहतर प्रदर्शन कर रहा है?
मैं एक शहर के प्रत्येक जिले में समलैंगिकों की संख्या को समझाने के लिए एक प्रतिगमन फिट करने की कोशिश कर रहा हूं। हालांकि मुझे पता है कि मेरा डेटा एक पॉइसन वितरण के बाद है, मैंने इस तरह एक ओएलएस फिट करने की कोशिश की: log(y+1)=α+βX+ϵlog(y+1)=α+βX+ϵlog(y+1) = \alpha + …

4
आंकड़ों में, मुझे लगता है चाहिए
मैं आँकड़ों का अध्ययन कर रहा हूँ और अक्सर सूत्रों से युक्त logहोता हूँ और मैं हमेशा उलझन में रहता हूँ अगर मुझे यह व्याख्या करनी चाहिए कि मानक अर्थ के रूप में log, अर्थात आधार 10, या यदि आँकड़ों में प्रतीक log को आमतौर पर प्राकृतिक लॉग माना जाता …

1
क्या हम वास्तव में * मिलियन * गुणांक / स्वतंत्र चर के साथ बहुभिन्नरूपी प्रतिगमन विश्लेषण करते हैं?
मैं कुछ समय सीखने की मशीन सीखने में व्यतीत कर रहा हूँ (पुनरावृत्ति के लिए खेद है :) और मैं मल्टीग्रेट लीनियर प्रतिगमन के मामले में कंप्यूटिंग रिग्रेशन गुणांक के लिए सीधे समीकरण हल करने पर ग्रेडिएंट डिसेंट को चुनने के अंगूठे के नियम के द्वारा साज़िश करने में मदद …

4
ची-स्क्वायर दूरी का उपयोग करके दो हिस्टोग्राम की तुलना करना
मैं चेहरों की दो छवियों की तुलना करना चाहता हूं। मैंने उनके एलबीपी-हिस्टोग्राम की गणना की। तो अब मुझे इन दोनों हिस्टोग्रामों की तुलना करने और कुछ ऐसा प्राप्त करने की आवश्यकता है जो बताएगा कि ये हिस्टोग्राम कितने समान हैं (0 - 100%)। इस कार्य को हल करने के …


5
प्रभाव आकार क्या है ... और यह क्यों उपयोगी है?
मेरे पास एक परिचयात्मक-स्नातक स्तर की सांख्यिकी पृष्ठभूमि है (मान लें कि मैं स्नातक स्तर पर गणितीय आंकड़े और संभावना जानता हूं (उदाहरण के लिए, वैकरली एट अल।, रॉस 'प्रोबेबिलिटी), और माप सिद्धांत का कुछ ज्ञान है)। मैंने हाल ही में शिक्षा सांख्यिकी में प्रयोगात्मक डिजाइन और सांख्यिकीय रिपोर्टिंग करने …

1
दूसरी पल विधि, ब्राउनियन गति?
चलो BtBtB_t एक मानक ब्राउनियन गति हो। चलो Ej,nEj,nE_{j, n} निरूपित घटना {Bt=0 for some j−12n≤t≤j2n},{Bt=0 for some j−12n≤t≤j2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},और जानेKn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = \sum_{j = 2^n + 1}^{2^{2n}} 1_{E_{j,n}},जहां111को दर्शाता सूचक समारोह। वहाँ मौजूद हैρ>0ρ>0\rho > 0ऐसी है कि के लिएP{Kn≥ρ2n}≥ρP{Kn≥ρ2n}≥ρ\mathbb{P}\{K_n \ge …

3
अच्छा उदाहरण जहां एक यूनिट रूट के बिना एक श्रृंखला गैर स्थिर है?
मैंने कई बार देखा है कि लोग संवर्धित डिकी-फुलर परीक्षण में अशक्तता को अस्वीकार करते हैं , और फिर दावा करते हैं कि यह दिखाता है कि उनकी श्रृंखला स्थिर है (दुर्भाग्य से, मैं इन दावों के स्रोत नहीं दिखा सकता, लेकिन मुझे लगता है कि इसी तरह के दावे …

2
PCA, LASSO, लोचदार नेट की गति, कम्प्यूटेशनल व्यय
मैं हस्ती एट अल में प्रतिष्ठित के रूप में रैखिक प्रतिगमन के लिए तरीकों के तीन समूहों की कम्प्यूटेशनल जटिलता / आकलन की गति की तुलना करने की कोशिश कर रहा हूं। "सांख्यिकीय शिक्षा के तत्व" (दूसरा संस्करण), अध्याय 3: सबसेट का चयन संकोचन विधियाँ व्युत्पन्न इनपुट दिशाओं (पीसीआर, पीएलएस) …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.