सांख्यिकी और बिग डेटा

3

क्या पीसीए बूलियन (बाइनरी) डेटा प्रकारों के लिए काम करेगा?

मैं उच्च आदेश प्रणालियों की गतिशीलता को कम करना चाहता हूं और अधिकांश कोवरियन को अधिमानतः 2 आयामी या 1 आयामी क्षेत्र पर कब्जा करना चाहता हूं। मैं समझता हूं कि यह प्रमुख घटक विश्लेषण के माध्यम से किया जा सकता है, और मैंने कई परिदृश्यों में पीसीए का उपयोग …

38 pca data-visualization binary-data dimensionality-reduction correspondence-analysis

3

डीप लर्निंग में हाइपरपैरामीटर का चयन करने के लिए दिशानिर्देश

मैं एक ऐसे कागज की तलाश कर रहा हूँ, जो स्टैक्ड ऑटो-एनकोडर्स या डीप विश्वास नेटवर्क की तरह एक गहरे आर्किटेक्चर के हाइपरपैरमीटर को चुनने के बारे में दिशानिर्देश देने में मदद कर सके। बहुत सारे हाइपरपैरामीटर हैं और मैं बहुत उलझन में हूं कि उन्हें कैसे चुना जाए। इसके …

38 machine-learning deep-learning deep-belief-networks hyperparameter

1

दो गॉसियन के भारित मिश्रण का प्रसरण क्या है?

मान लें कि मेरे पास दो सामान्य वितरण हैं A और B का अर्थ है और \ mu_B और variances \ sigma_A और \ sigma_B । मैं इन दो वितरणों का भार भार पी और क्यू का उपयोग करके लेना चाहता हूं, जहां 0 \ ली पी \ ली 1 …

38 normal-distribution mixture

1

मैन्युअल रूप से गणना की गई

मैं जानता हूँ कि यह एक काफी विशिष्ट है Rसवाल है, लेकिन मैं अनुपात विचरण के बारे में सोच सकते बताया गया है, , गलत तरीके से। यहाँ जाता हैं।R2R2R^2 मैं Rपैकेज का उपयोग करने की कोशिश कर रहा हूं randomForest। मेरे पास कुछ प्रशिक्षण डेटा और परीक्षण डेटा है। …

38 r correlation predictive-models random-forest r-squared

3

ऑनलाइन बनाम ऑफ़लाइन सीखने?

ऑफ़लाइन और ऑनलाइन सीखने के बीच अंतर क्या है ? क्या यह पूरे डेटासेट (ऑफ़लाइन) बनाम अधिगम (एक समय में एक उदाहरण) सीखने की बात है? दोनों में इस्तेमाल किए गए एल्गोरिदम के उदाहरण क्या हैं?

38 machine-learning online

3

फीचर वेक्टर पाने के लिए, पूरे दस्तावेज़ में शब्द एम्बेडिंग लागू करें

मैं पर्यवेक्षित सीखने के साथ उपयोग के लिए उपयुक्त एक फीचर वेक्टर में दस्तावेज़ को मैप करने के लिए एम्बेडिंग शब्द का उपयोग कैसे करूं? एक शब्द प्रत्येक शब्द को एक वेक्टर v , R d में मैप करता है , जहां d कुछ नॉट -बहुत-बड़ी संख्या (जैसे, 500) है। …

38 classification natural-language supervised-learning word2vec word-embeddings

2

ए / बी परीक्षण: जेड-टेस्ट बनाम टी-टेस्ट बनाम ची स्क्वायर बनाम फिशर सटीक परीक्षण

मैं एक साधारण ए / बी टेस्ट से निपटने के दौरान एक विशिष्ट परीक्षण दृष्टिकोण का चयन करके तर्क को समझने की कोशिश कर रहा हूं - (बाइनरी रिस्पॉन्स (परिवर्तित या नहीं) के साथ दो बदलाव / समूह। उदाहरण के रूप में मैं नीचे दिए गए डेटा का उपयोग करूंगा। …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

1

PCA और पत्राचार Biplot के संबंध में उनके विश्लेषण

Biplot का उपयोग अक्सर मुख्य घटक विश्लेषण (और संबंधित तकनीकों) के परिणामों को प्रदर्शित करने के लिए किया जाता है । यह एक दोहरी या ओवरले स्कैप्लेट है जो एक साथ घटक लोडिंग और घटक स्कोर दिखा रहा है । मैं @amoeba आज द्वारा सूचित किया गया था कि वह …

38 pca multivariate-analysis svd correspondence-analysis biplot

2

द्विपद प्रतिगमन के लिए आर के आउटपुट की व्याख्या

मैं द्विपद डेटा परीक्षणों के साथ इस पर काफी नया हूं, लेकिन एक करने की जरूरत है और अब मुझे यकीन नहीं है कि परिणाम की व्याख्या कैसे करें। वाई-चर, प्रतिक्रिया चर, द्विपद है और व्याख्यात्मक कारक निरंतर हैं। परिणाम का सारांश देते समय मुझे यही मिला है: glm(formula = …

38 r regression logistic binomial interpretation

1

क्या मुझे उपयोग करने से पहले word2vec के शब्द वैक्टर को सामान्य करना चाहिए?

शब्द 2vec के साथ शब्द वैक्टर को प्रशिक्षित करने के बाद, कुछ डाउनस्ट्रीम अनुप्रयोगों के लिए उपयोग करने से पहले उन्हें सामान्य करना बेहतर है? यानी उन्हें सामान्य बनाने के पक्ष / विपक्ष क्या हैं?

38 natural-language word2vec word-embeddings

8

सांख्यिकीय रूप से महत्वपूर्ण नहीं होने के बावजूद किसी प्रतिगमन में एक चर को कब शामिल करना चाहिए?

मैं अर्थमिति और आर के साथ कुछ अनुभव के साथ एक अर्थशास्त्र का छात्र हूं। मैं जानना चाहूंगा कि क्या कभी ऐसी स्थिति है, जहां हमें एक प्रतिगमन में एक चर को शामिल करना चाहिए, इसके बावजूद सांख्यिकीय रूप से महत्वपूर्ण नहीं है?

37 statistical-significance feature-selection

3

का प्रसरण

TL, DR: ऐसा प्रतीत होता है कि, बार-बार की गई सलाह के विपरीत, लीव-वन-आउट क्रॉस वैरिडेशन (LOO-CV) - यानीकश्मीरकश्मीरK साथ Fold CVकश्मीरकश्मीरK(एनएनN की संख्या केबराबर)प्रशिक्षण टिप्पणियों का) - सामान्यीकरण त्रुटि का अनुमान लगाता है जोकिसी भी K के लिएसबसे कम परिवर्तनशील है, न कि सबसे अधिक चर,मॉडल / एल्गोरिथ्म, डेटासेट, …

37 regression machine-learning variance cross-validation predictive-models

5

क्या यह तथ्य कि मेरा इतालवी बेटा एक प्राथमिक विद्यालय में भाग लेने जा रहा है, अपनी कक्षा में उपस्थित होने के लिए इतालवी बच्चों की अपेक्षित संख्या को बदल देगा?

यह एक वास्तविक जीवन की स्थिति से उपजा सवाल है, जिसके जवाब के लिए मैं वास्तव में हैरान हूं। मेरा बेटा लंदन में प्राइमरी स्कूल शुरू करने की वजह से है। जैसा कि हम इतालवी हैं, मैं यह जानने के लिए उत्सुक था कि कितने इतालवी बच्चे पहले से ही …

37 probability self-study average

2

आर में लमर () मिश्रित प्रभाव मॉडल के लिए भविष्यवाणी अंतराल

मैं एक lmer () मॉडल से एक भविष्यवाणी के आसपास एक भविष्यवाणी अंतराल प्राप्त करना चाहता हूं। मुझे इस बारे में कुछ चर्चा मिली है: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq लेकिन वे यादृच्छिक प्रभावों की अनिश्चितता को ध्यान में नहीं रखते हैं। यहाँ एक विशिष्ट उदाहरण है। मैं सोने की मछली की दौड़ …

37 r mixed-model prediction prediction-interval lme4-nlme

2

क्या ARIMA को बेहतर बनाने के लिए MEAN के लिए यह असामान्य है?

मैंने हाल ही में कई पूर्वानुमान विधियों (MEAN, RWF, ETS, ARIMA और MLPs) को लागू किया और पाया कि MEAN ने आश्चर्यजनक रूप से अच्छा किया। (MEAN: जहां भविष्य की सभी भविष्यवाणियों का अवलोकन प्रेक्षित मानों के अंकगणितीय माध्य के बराबर किया गया है।) MEAN ने मेरे द्वारा उपयोग की …

37 forecasting arima