सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
समय श्रृंखला के साथ पियर्सन सहसंबंध का सही उपयोग कैसे करें
मेरे पास 2 टाइम-सीरीज़ (दोनों चिकनी) हैं जो मैं यह देखना चाहता हूं कि वे कितने सहसंबद्ध हैं। मैं पियर्सन सहसंबंध गुणांक का उपयोग करने का इरादा रखता हूं। क्या यह उचित है? मेरा दूसरा सवाल यह है कि मैं 2 टाइम-सीरीज़ के साथ-साथ मुझे पसंद करने के लिए नमूना …

3
नैवे बे को समझना
से StatSoft, इंक (2013), इलेक्ट्रॉनिक सांख्यिकी पाठ्यपुस्तक , "अनुभवहीन Bayes वर्गीकरणकर्ता" : Naïve Bayes वर्गीकरण की अवधारणा को प्रदर्शित करने के लिए, ऊपर दिए गए चित्रण में प्रदर्शित उदाहरण पर विचार करें। जैसा कि संकेत दिया गया है, वस्तुओं को या तो GREEN या RED के रूप में वर्गीकृत किया …

5
यदि दो समूहों के लिए टी-टेस्ट और एनोवा समान हैं, तो उनकी धारणाएं समान क्यों नहीं हैं?
मुझे यकीन है कि मैंने अपने सिर को पूरी तरह से लपेट लिया है, लेकिन मैं अभी इसका पता नहीं लगा सकता। टी-परीक्षण जेड वितरण का उपयोग करके दो सामान्य वितरणों की तुलना करता है। यही कारण है कि डेटा में सामान्यता की धारणा है। ANOVA डमी चर के साथ …

5
जब नमूना "जनसंख्या" सांख्यिकीय अनुमान है
कल्पना कीजिए कि आपको उन उम्मीदवारों की संख्या पर रिपोर्टिंग करनी होगी जो वार्षिक रूप से दिए गए टेस्ट को लेते हैं। उदाहरण के लिए, लक्ष्य आबादी की विशिष्टता के कारण व्यापक आबादी पर, सफलता के%% का अनुमान लगाना मुश्किल है। तो आप विचार कर सकते हैं कि ये डेटा …

10
एक विशाल रीड-एक बार डेटा सेट के मध्य का अनुमान लगाने के लिए एक अच्छा एल्गोरिथ्म क्या है?
मैं एक अच्छे एल्गोरिथ्म (न्यूनतम संगणना, न्यूनतम भंडारण आवश्यकताओं का अर्थ) की तलाश कर रहा हूं ताकि किसी डेटा सेट के मध्य का अनुमान लगाया जा सके, जो स्टोर करने के लिए बहुत बड़ा है, जैसे कि प्रत्येक मूल्य को केवल एक बार पढ़ा जा सकता है (जब तक कि …

4
हम नकारात्मक संभावना को कम क्यों करते हैं अगर यह संभावना के अधिकतमकरण के बराबर है?
इस सवाल ने मुझे लंबे समय तक हैरान किया। मैं संभावना को अधिकतम करने में 'लॉग' के उपयोग को समझता हूं इसलिए मैं 'लॉग' के बारे में नहीं पूछ रहा हूं। मेरा सवाल यह है कि चूंकि लॉग लाइबिलिटी को अधिकतम करना "नेगेटिव लॉग लाइबिलिटी" (एनएलएल) को कम करने के …

2
क्यों वर्गीकृत करने के लिए संवादी तंत्रिका नेटवर्क एक सपोर्ट वेक्टर मशीन का उपयोग नहीं करते हैं?
हाल के वर्षों में, कंप्यूटर दृष्टि में वस्तु मान्यता के लिए संवादी तंत्रिका नेटवर्क (CNNs) अत्याधुनिक हो गए हैं। आमतौर पर, एक सीएनएन में कई दृढ़ परतें होती हैं, इसके बाद दो पूरी तरह से जुड़ी हुई परतें होती हैं। इसके पीछे एक अंतर्ज्ञान यह है कि दृढ़ परतें इनपुट …

6
अवशिष्ट "अनुमानित माइनस वास्तविक" या "वास्तविक माइनस की भविष्यवाणी" हैं
मैंने "अवशिष्ट" को विभिन्न रूप से परिभाषित किया है जैसा कि "अनुमानित माइनस वास्तविक मूल्यों" या "वास्तविक माइनस प्रेड्यूस्ड वैल्यूज़" के रूप में परिभाषित किया गया है। चित्रण प्रयोजनों के लिए, यह दिखाने के लिए कि दोनों सूत्र व्यापक रूप से उपयोग किए जाते हैं, निम्न वेब खोजों की तुलना …

2
एक बेयसियन को अवशेषों को देखने की अनुमति क्यों नहीं है?
लेख में "चर्चा: पारिस्थितिकीविदों को बायसायन बनना चाहिए?" ब्रायन डेनिस बेयसियन आंकड़ों का आश्चर्यजनक रूप से संतुलित और सकारात्मक दृष्टिकोण देता है जब उसका उद्देश्य लोगों को इसके बारे में चेतावनी देना प्रतीत होता है। हालांकि, एक पैराग्राफ में, बिना किसी उद्धरण या औचित्य के, वह कहता है: बायसी, आप …

2
बार-बार होने वाली परिकल्पना परीक्षण पर्याप्त बड़े नमूनों के साथ अशक्त परिकल्पना को खारिज करने के पक्षपाती क्यों हो जाते हैं?
जब मैं इस मार्ग पर ठोकर खाई तो मैं पूरी तरह से असंबंधित समस्या के लिए बेयस कारक पर इस लेख को पढ़ रहा था बेयस कारकों के साथ परिकल्पना परीक्षण लगातार परिकल्पना परीक्षण की तुलना में अधिक मजबूत है, क्योंकि बायेसियन रूप मॉडल चयन पूर्वाग्रह से बचता है, अशक्त …

2
डेटा के बारे में सहसंयोजक मैट्रिक्स का उलटा क्या कहता है? (Intuitively)
मैं के स्वभाव के बारे में उत्सुक हूँ । Can किसी को भी बताई कुछ सहज ज्ञान युक्त के बारे में "क्या करता है Σ - 1 डेटा के बारे में कहते हैं?"Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} संपादित करें: उत्तर के लिए धन्यवाद कुछ बेहतरीन पाठ्यक्रम लेने के बाद, मैं कुछ बिंदु जोड़ना चाहूंगा: …

7
"सांख्यिकीय रूप से महत्वपूर्ण" पर्याप्त क्यों नहीं है?
मैंने अपना डेटा विश्लेषण पूरा कर लिया है और "सांख्यिकीय महत्वपूर्ण परिणाम" प्राप्त किया है जो मेरी परिकल्पना के अनुरूप है। हालांकि, आंकड़ों में एक छात्र ने मुझे बताया कि यह एक समय से पहले निष्कर्ष है। क्यों? क्या मेरी रिपोर्ट में शामिल होने के लिए कुछ और आवश्यक है?

3
लॉग-ट्रांसफ़ॉर्म प्रतिक्रिया के साथ रैखिक मॉडल बनाम लॉग लिंक के साथ सामान्यीकृत रैखिक मॉडल
में इस पत्र शीर्षक "के बीच सामान्यीकृत रैखिक मॉडल लागू मेडिकल डाटा का चयन" लेखकों लिखें: सामान्यीकृत रैखिक मॉडल में, लिंक को फ़ंक्शन द्वारा, प्रतिक्रिया को बदलने के बजाय, मतलब बदल दिया जाता है। परिवर्तन के दो तरीकों से काफी भिन्न परिणाम हो सकते हैं; उदाहरण के लिए, लॉग-ट्रांसफ़ॉर्मेड प्रतिक्रियाओं …

3
क्या यादृच्छिक वन में पेड़ों की इष्टतम संख्या भविष्यवक्ताओं की संख्या पर निर्भर करती है?
क्या कोई समझा सकता है कि जब भविष्यवक्ताओं की संख्या बड़ी है तो हमें यादृच्छिक वन में बड़ी संख्या में पेड़ों की आवश्यकता क्यों है? हम पेड़ों की इष्टतम संख्या कैसे निर्धारित कर सकते हैं?

3
सशर्त गाऊसी वितरण के पीछे अंतर्ज्ञान क्या है?
मान लीजिए कि । फिर के सशर्त वितरण को हुए कि सामान्य रूप से बहुभिन्नरूपी वितरित किया जाता है:एक्स ∼ एन2( μ , Σ )X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma})एक्स1X1X_1एक्स2= एक्स2X2=x2X_2 = x_2 इ[ पी( एक्स)1| एक्स2= एक्स2) ] = μ1+ σ12σ22( x)2- μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) और …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.