सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
मेट्रोपोलिस हेस्टिंग्स, गिब्स, महत्व और अस्वीकृति के नमूने में क्या अंतर है?
मैं MCMC विधियों को सीखने की कोशिश कर रहा हूं और मेट्रोपोलिस हेस्टिंग्स, गिब्स, इंपोर्टेंस और रिजेक्शन सैंपलिंग में आया हूं। जबकि इनमें से कुछ अंतर स्पष्ट हैं, अर्थात, कैसे गिब्स मेट्रोपोलिस हेस्टिंग्स का एक विशेष मामला है जब हमारे पास पूर्ण सशर्त हैं, तो अन्य कम स्पष्ट हैं, जैसे …

4
कंप्यूटर विज़न और कनफ्यूज़नल न्यूरल नेटवर्क में ट्रांसलेशन अदर्शन क्या है?
मेरे पास कंप्यूटर विज़न बैकग्राउंड नहीं है, फिर भी जब मैंने कुछ इमेज प्रोसेसिंग और कन्वेन्शनल न्यूरल नेटवर्क से संबंधित आर्टिकल और पेपर पढ़े, तो मुझे लगातार टर्म translation invariance, या translation invariant। या मैं एक बहुत पढ़ा है कि दृढ़ संकल्प ऑपरेशन प्रदान करता है translation invariance!! इसका क्या …

6
वैज्ञानिकों ने सामान्य वितरण संभावना घनत्व फ़ंक्शन के आकार का कैसे पता लगाया?
यह शायद एक शौकिया सवाल है, लेकिन मुझे इस बात में दिलचस्पी है कि वैज्ञानिकों ने सामान्य वितरण संभावना घनत्व समारोह के आकार के साथ कैसे किया? मूल रूप से मुझे जो कीड़े हैं, किसी के लिए यह शायद अधिक सहज होगा कि सामान्य रूप से वितरित डेटा की संभावना …

1
जब नेस्टेड क्रॉस-मान्यता वास्तव में आवश्यक है और व्यावहारिक अंतर बना सकती है?
मॉडल चयन करने के लिए क्रॉस-वैलिनेशन का उपयोग करते समय (जैसे कि हाइपरपरमेटर ट्यूनिंग) और सबसे अच्छे मॉडल के प्रदर्शन का आकलन करने के लिए, किसी को नेस्टेड क्रॉस-वैलेडेशन का उपयोग करना चाहिए । बाहरी लूप मॉडल के प्रदर्शन का आकलन करने के लिए है, और आंतरिक लूप सर्वश्रेष्ठ मॉडल …

10
अस्तित्व के समय को तेजी से वितरित करने के लिए क्यों माना जाता है?
मैं UCLA IDRE पर इस पोस्ट से उत्तरजीविता विश्लेषण सीख रहा हूं और 1.2.1 सेक्शन में फंसा हुआ हूं । ट्यूटोरियल कहता है: ... यदि अस्तित्व के समय को तेजी से वितरित करने के लिए जाना जाता था , तो अस्तित्व के समय का अवलोकन करने की संभावना ... अस्तित्व …

6
एन -1 के बजाए कोविरसी अनुमानक का भाजक n-2 क्यों नहीं होना चाहिए?
(निष्पक्ष) भिन्नता अनुमानक का भाजक n−1n−1n-1 क्योंकि nnn अवलोकन हैं और केवल एक पैरामीटर का अनुमान लगाया जा रहा है। V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} एक ही टोकन से मुझे आश्चर्य है कि दो मापदंडों का अनुमान लगाए जाने पर सहसंयोजक के क्यों नहीं होना चाहिए n−2n−2n-2? Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

5
क्या पी-मूल्य अनिवार्य रूप से बेकार और उपयोग करने के लिए खतरनाक है?
NY टाइम्स का यह लेख " द ओड्स, कंटीन्यूअसली अपडेटेड" मेरा ध्यान आकर्षित करने के लिए हुआ। संक्षेप में, यह कहा गया है कि [Bayesian आँकड़े] जटिल समस्याओं से निपटने में विशेष रूप से उपयोगी साबित हो रहे हैं, जिसमें 2013 में इस्तेमाल किए गए एक कोस्ट गार्ड जैसे लापता …

2
प्रभाव पैकेज के माध्यम से लैमर ऑब्जेक्ट्स के लिए विश्वास अंतराल कितने विश्वसनीय हैं?
Effectsपैकेज के लिए एक बहुत तेज और सुविधाजनक तरीका प्रदान मिश्रित प्रभाव मॉडल परिणाम रैखिक साजिश रचने के माध्यम से प्राप्त lme4पैकेज । effectसमारोह गणना विश्वास के अंतराल (सीआईएस) बहुत जल्दी है, लेकिन कैसे भरोसेमंद इन विश्वास के अंतराल कर रहे हैं? उदाहरण के लिए: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 …

2
मुझे कैसे पता चलेगा कि क्रॉस सत्यापन का कौन सा तरीका सबसे अच्छा है?
मैं यह पता लगाने की कोशिश कर रहा हूं कि मेरी स्थिति के लिए कौन सी क्रॉस सत्यापन विधि सबसे अच्छी है। निम्नलिखित डेटा समस्या (आर) के माध्यम से काम करने के लिए सिर्फ एक उदाहरण है, लेकिन मेरे वास्तविक Xडेटा ( xmat) एक दूसरे के साथ सहसंबंधित हैं और …

2
लॉजिस्टिक रिग्रेशन बनाम एलडीए दो-स्तरीय क्लासिफायर के रूप में
मैं रैखिक विभेदक विश्लेषण और लॉजिस्टिक प्रतिगमन के बीच सांख्यिकीय अंतर के चारों ओर अपना सिर लपेटने की कोशिश कर रहा हूं । क्या मेरी समझ सही है कि, एक दो वर्ग वर्गीकरण समस्या के लिए, LDA दो सामान्य घनत्व कार्यों (प्रत्येक वर्ग के लिए एक) की भविष्यवाणी करता है …

4
एक बहुपद मॉडल फिट से गुणांक की व्याख्या कैसे करें?
मैं कुछ डेटा मेरे पास एक दूसरे क्रम बहुपद फिट बनाने की कोशिश कर रहा हूँ। मान लें कि मैं इस फिट के साथ साजिश करता हूं ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) मुझे मिला: इसलिए, एक दूसरा क्रम फिट काफी अच्छा काम करता है। मैं …

5
एफडीआर नियंत्रण के लिए सामान्य विधि का उपयोग करने के लिए एक शर्त के रूप में "सकारात्मक निर्भरता" का अर्थ है
बेनजामिनी और होचबर्ग ने झूठी खोज दर (एफडीआर) को नियंत्रित करने के लिए पहला (और अभी भी सबसे व्यापक रूप से इस्तेमाल किया जाता है, मुझे लगता है) विधि विकसित की है। मैं पी मानों के एक समूह के साथ शुरू करना चाहता हूं, प्रत्येक एक अलग तुलना के लिए, …

6
मैं कैसे विश्लेषणात्मक रूप से साबित कर सकता हूं कि एक राशि के परिणाम को बेतरतीब ढंग से विभाजित करने से एक घातीय वितरण (जैसे आय और धन)?
विज्ञान में इस वर्तमान लेख में निम्नलिखित का प्रस्ताव किया जा रहा है: मान लीजिए कि आप 10,000 लोगों के बीच आय में बेतरतीब ढंग से 500 मिलियन विभाजित करते हैं। सभी को बराबर, 50,000 शेयर देने का केवल एक ही तरीका है। इसलिए अगर आप बेतरतीब ढंग से कमाई …

1
विषम डेटा के लिए एक तरफ़ा एनोवा के विकल्प
मेरे पास शैवाल बायोमास ( , , ) के 3 समूहों के डेटा हैं जिनमें असमान नमूना आकार ( , , ) हैं और मैं तुलना करना चाहूंगा कि क्या ये समूह एक ही आबादी के हैं।बी सी एन ए = 15 एन बी = 13 एन सी = 12AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 …

2
0 या 1 के द्विपद अनुमान के आसपास आत्मविश्वास अंतराल
एक द्विपद प्रयोग के विश्वास अंतराल की गणना करने के लिए सबसे अच्छी तकनीक क्या है, यदि आपका अनुमान है कि (या इसी तरह ) और नमूना आकार अपेक्षाकृत छोटा है, उदाहरण के लिए ?p=0p=0p=0p=1p=1p=1n=25n=25n=25

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.