सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

10
समूहों की सही संख्या का निर्णय कैसे करें?
हम क्लस्टर केंद्रों को ढूंढते हैं और k- साधनों के क्लस्टरिंग में अलग - अलग क्लस्टर बिन्स को अंक प्रदान करते हैं जो कि एक बहुत अच्छी तरह से ज्ञात एल्गोरिथ्म है और नेट पर लगभग हर मशीन लर्निंग पैकेज में पाया जाता है। लेकिन मेरी राय में लापता और …

8
क्या data बड़े डेटा ’के समय में नमूना लेना प्रासंगिक है?
या अधिक "तो यह होगा"? बिग डेटा आँकड़ों और प्रासंगिक ज्ञान को और अधिक महत्वपूर्ण बनाता है लेकिन नमूना थ्योरी को रेखांकित करता है। मैंने 'बिग डेटा' के आसपास यह प्रचार देखा है और आश्चर्यचकित नहीं कर सकता कि "क्यों" मैं हर चीज का विश्लेषण करना चाहता हूं ? क्या …

5
नमूना मध्यस्थों के लिए केंद्रीय सीमा प्रमेय
यदि मैं समान वितरण से प्राप्त पर्याप्त संख्या में टिप्पणियों के मध्यिका की गणना करता हूं, तो क्या केंद्रीय सीमा प्रमेय बताती है कि मध्यस्थों का वितरण सामान्य वितरण को अनुमानित करेगा? मेरी समझ यह है कि यह बड़ी संख्या में नमूनों के माध्यम से सच है, लेकिन क्या यह …

9
रेखीय बीजगणित के लिए संदर्भ पुस्तक आंकड़ों पर लागू होती है?
मैं थोड़ी देर के लिए आर में काम कर रहा हूं और पीसीए, एसवीडी, क्यूआर डिकम्पोजिशन और इस तरह के कई रैखिक बीजगणित परिणामों (जब भारित रजिस्टरों और इस तरह के आकलन का निरीक्षण कर रहा हूं) जैसी चीजों का सामना किया गया है, तो मैं जानना चाहता था कि …

2
क्या हमें पोस्ट हॉक परीक्षणों से पहले एक वैश्विक परीक्षण की आवश्यकता है?
मैं अक्सर सुनता हूं कि एक एनोवा के बाद पोस्ट हॉक टेस्ट केवल तभी इस्तेमाल किया जा सकता है जब एनोवा खुद महत्वपूर्ण था। हालांकि, पोस्ट हॉक टेस्ट वैल्यूज़ को वैश्विक प्रकार I त्रुटि दर को 5% पर रखने के लिए समायोजित करते हैं, क्या वे नहीं?ppp तो हमें पहले …


5
क्या कई तुलनाओं के लिए एक बहु प्रतिगमन में p-मानों को समायोजित करना एक अच्छा विचार है?
मान लेते हैं कि आप एक सामाजिक विज्ञान शोधकर्ता / अर्थशास्त्री हैं जो किसी सेवा की माँग के प्रासंगिक भविष्यवाणियों को खोजने की कोशिश कर रहे हैं। आपके पास मांग का वर्णन करने वाले 2 परिणाम / आश्रित चर हैं (सेवा हाँ / नहीं, और अवसरों की संख्या का उपयोग …

6
गणितज्ञों के लिए आँकड़ों का परिचय
एक गणितज्ञ के लिए आंकड़ों का एक अच्छा परिचय क्या है जो पहले से ही संभावना में अच्छी तरह से वाकिफ है? मेरे पास पूछने के लिए दो अलग-अलग प्रेरणाएँ हैं, जो अलग-अलग सुझाव दे सकते हैं: मैं संभाव्यतावादियों द्वारा समझी गई कई समस्याओं के पीछे आँकड़ों की प्रेरणा को …
54 references 

7
बड़ी संख्या में सुविधाओं के लिए सर्वश्रेष्ठ पीसीए एल्गोरिथ्म (> 10K)?
मैंने पहले स्टैकऑवरफ्लो पर यह पूछा था, लेकिन ऐसा लगता है कि यह यहां अधिक उपयुक्त हो सकता है, यह देखते हुए कि इसे एसओ पर कोई जवाब नहीं मिला। यह आँकड़ों और प्रोग्रामिंग के बीच चौराहे की तरह है। पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस) करने के लिए मुझे कुछ कोड …

19
गणितीय सांख्यिकी वीडियो
एक सवाल पहले गणितीय आंकड़ों पर पाठ्यपुस्तकों के लिए सिफारिशें मांगी गई थी क्या किसी को गणितीय आँकड़ों पर किसी भी अच्छे ऑनलाइन वीडियो व्याख्यान का पता है ? निकटतम मैंने पाया है: मशीन लर्निंग अर्थमिति अद्यतन: नीचे दिए गए सुझावों में से कई अच्छे आंकड़े -१० प्रकार के वीडियो …

3
बहुभिन्नरूपी रैखिक प्रतिगमन बनाम तंत्रिका नेटवर्क?
ऐसा लगता है कि कुछ मामलों में एक बहुभिन्नरूपी रेखीय प्रतिगमन के साथ तंत्रिका नेटवर्क के समान परिणाम प्राप्त करना संभव है, और बहुभिन्नरूपी रेखीय प्रतिगमन सुपर फास्ट और आसान है। तंत्रिका नेटवर्क किन परिस्थितियों में बहुभिन्नरूपी रैखिक प्रतिगमन की तुलना में बेहतर परिणाम दे सकता है?

5
पीसीए एक ज्यामितीय समस्या (दूरियों के साथ) से रैखिक बीजगणित की समस्या (आइगेनट्रैक्टर्स के साथ) में कैसे बदल जाता है, इसके लिए एक सहज व्याख्या क्या है?
मैंने पीसीए के बारे में बहुत कुछ पढ़ा है, जिसमें विभिन्न ट्यूटोरियल और प्रश्न शामिल हैं (जैसे कि यह एक , यह एक , यह एक और यह एक )। पीसीए अनुकूलन करने की कोशिश कर रही ज्यामितीय समस्या मेरे लिए स्पष्ट है: पीसीए पुनर्निर्माण (प्रक्षेपण) त्रुटि को कम करके …

10
होल्ड-आउट सत्यापन बनाम क्रॉस-सत्यापन
मेरे लिए, ऐसा लगता है कि होल्ड-आउट सत्यापन बेकार है। यही है, मूल डेटासेट को दो-भागों (प्रशिक्षण और परीक्षण) में विभाजित करना और परीक्षण स्कोर का सामान्यीकरण उपाय के रूप में उपयोग करना, कुछ हद तक बेकार है। K- गुना क्रॉस-वैधीकरण सामान्यीकरण के बेहतर सन्निकटन देता है (क्योंकि यह हर …

4
सहसंयोजक और स्वतंत्रता?
मैंने अपनी पाठ्यपुस्तक से पढ़ा कि गारंटी नहीं देता कि X और Y स्वतंत्र हैं। लेकिन अगर वे स्वतंत्र होते हैं, तो उनका सहसंयोजन 0. होना चाहिए। मैं अभी तक किसी भी उचित उदाहरण के बारे में नहीं सोच सकता था; क्या कोई प्रदान कर सकता है?कोव ( एक्स), वाई) …

5
सांख्यिकीय शिक्षा में iid धारणा के महत्व पर
सांख्यिकीय सीखने में, परोक्ष या स्पष्ट रूप से, एक हमेशा मानता है कि प्रशिक्षण सेट D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} से बना है NNN इनपुट / प्रतिक्रिया tuples (Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) कि कर रहे हैं स्वतंत्र रूप से एक ही संयुक्त वितरण से तैयार P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) साथ p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.