सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

3
क्या पीसीए बूलियन (बाइनरी) डेटा प्रकारों के लिए काम करेगा?
मैं उच्च आदेश प्रणालियों की गतिशीलता को कम करना चाहता हूं और अधिकांश कोवरियन को अधिमानतः 2 आयामी या 1 आयामी क्षेत्र पर कब्जा करना चाहता हूं। मैं समझता हूं कि यह प्रमुख घटक विश्लेषण के माध्यम से किया जा सकता है, और मैंने कई परिदृश्यों में पीसीए का उपयोग …

3
डीप लर्निंग में हाइपरपैरामीटर का चयन करने के लिए दिशानिर्देश
मैं एक ऐसे कागज की तलाश कर रहा हूँ, जो स्टैक्ड ऑटो-एनकोडर्स या डीप विश्वास नेटवर्क की तरह एक गहरे आर्किटेक्चर के हाइपरपैरमीटर को चुनने के बारे में दिशानिर्देश देने में मदद कर सके। बहुत सारे हाइपरपैरामीटर हैं और मैं बहुत उलझन में हूं कि उन्हें कैसे चुना जाए। इसके …

1
दो गॉसियन के भारित मिश्रण का प्रसरण क्या है?
मान लें कि मेरे पास दो सामान्य वितरण हैं A और B का अर्थ है और \ mu_B और variances \ sigma_A और \ sigma_B । मैं इन दो वितरणों का भार भार पी और क्यू का उपयोग करके लेना चाहता हूं, जहां 0 \ ली पी \ ली 1 …

1
मैन्युअल रूप से गणना की गई
मैं जानता हूँ कि यह एक काफी विशिष्ट है Rसवाल है, लेकिन मैं अनुपात विचरण के बारे में सोच सकते बताया गया है, , गलत तरीके से। यहाँ जाता हैं।R2R2R^2 मैं Rपैकेज का उपयोग करने की कोशिश कर रहा हूं randomForest। मेरे पास कुछ प्रशिक्षण डेटा और परीक्षण डेटा है। …

3
ऑनलाइन बनाम ऑफ़लाइन सीखने?
ऑफ़लाइन और ऑनलाइन सीखने के बीच अंतर क्या है ? क्या यह पूरे डेटासेट (ऑफ़लाइन) बनाम अधिगम (एक समय में एक उदाहरण) सीखने की बात है? दोनों में इस्तेमाल किए गए एल्गोरिदम के उदाहरण क्या हैं?

3
फीचर वेक्टर पाने के लिए, पूरे दस्तावेज़ में शब्द एम्बेडिंग लागू करें
मैं पर्यवेक्षित सीखने के साथ उपयोग के लिए उपयुक्त एक फीचर वेक्टर में दस्तावेज़ को मैप करने के लिए एम्बेडिंग शब्द का उपयोग कैसे करूं? एक शब्द प्रत्येक शब्द को एक वेक्टर v , R d में मैप करता है , जहां d कुछ नॉट -बहुत-बड़ी संख्या (जैसे, 500) है। …

2
ए / बी परीक्षण: जेड-टेस्ट बनाम टी-टेस्ट बनाम ची स्क्वायर बनाम फिशर सटीक परीक्षण
मैं एक साधारण ए / बी टेस्ट से निपटने के दौरान एक विशिष्ट परीक्षण दृष्टिकोण का चयन करके तर्क को समझने की कोशिश कर रहा हूं - (बाइनरी रिस्पॉन्स (परिवर्तित या नहीं) के साथ दो बदलाव / समूह। उदाहरण के रूप में मैं नीचे दिए गए डेटा का उपयोग करूंगा। …

1
PCA और पत्राचार Biplot के संबंध में उनके विश्लेषण
Biplot का उपयोग अक्सर मुख्य घटक विश्लेषण (और संबंधित तकनीकों) के परिणामों को प्रदर्शित करने के लिए किया जाता है । यह एक दोहरी या ओवरले स्कैप्लेट है जो एक साथ घटक लोडिंग और घटक स्कोर दिखा रहा है । मैं @amoeba आज द्वारा सूचित किया गया था कि वह …

2
द्विपद प्रतिगमन के लिए आर के आउटपुट की व्याख्या
मैं द्विपद डेटा परीक्षणों के साथ इस पर काफी नया हूं, लेकिन एक करने की जरूरत है और अब मुझे यकीन नहीं है कि परिणाम की व्याख्या कैसे करें। वाई-चर, प्रतिक्रिया चर, द्विपद है और व्याख्यात्मक कारक निरंतर हैं। परिणाम का सारांश देते समय मुझे यही मिला है: glm(formula = …

1
क्या मुझे उपयोग करने से पहले word2vec के शब्द वैक्टर को सामान्य करना चाहिए?
शब्द 2vec के साथ शब्द वैक्टर को प्रशिक्षित करने के बाद, कुछ डाउनस्ट्रीम अनुप्रयोगों के लिए उपयोग करने से पहले उन्हें सामान्य करना बेहतर है? यानी उन्हें सामान्य बनाने के पक्ष / विपक्ष क्या हैं?

8
सांख्यिकीय रूप से महत्वपूर्ण नहीं होने के बावजूद किसी प्रतिगमन में एक चर को कब शामिल करना चाहिए?
मैं अर्थमिति और आर के साथ कुछ अनुभव के साथ एक अर्थशास्त्र का छात्र हूं। मैं जानना चाहूंगा कि क्या कभी ऐसी स्थिति है, जहां हमें एक प्रतिगमन में एक चर को शामिल करना चाहिए, इसके बावजूद सांख्यिकीय रूप से महत्वपूर्ण नहीं है?

3
का प्रसरण
TL, DR: ऐसा प्रतीत होता है कि, बार-बार की गई सलाह के विपरीत, लीव-वन-आउट क्रॉस वैरिडेशन (LOO-CV) - यानीकश्मीरकश्मीरK साथ Fold CVकश्मीरकश्मीरK(एनएनN की संख्या केबराबर)प्रशिक्षण टिप्पणियों का) - सामान्यीकरण त्रुटि का अनुमान लगाता है जोकिसी भी K के लिएसबसे कम परिवर्तनशील है, न कि सबसे अधिक चर,मॉडल / एल्गोरिथ्म, डेटासेट, …

5
क्या यह तथ्य कि मेरा इतालवी बेटा एक प्राथमिक विद्यालय में भाग लेने जा रहा है, अपनी कक्षा में उपस्थित होने के लिए इतालवी बच्चों की अपेक्षित संख्या को बदल देगा?
यह एक वास्तविक जीवन की स्थिति से उपजा सवाल है, जिसके जवाब के लिए मैं वास्तव में हैरान हूं। मेरा बेटा लंदन में प्राइमरी स्कूल शुरू करने की वजह से है। जैसा कि हम इतालवी हैं, मैं यह जानने के लिए उत्सुक था कि कितने इतालवी बच्चे पहले से ही …

2
आर में लमर () मिश्रित प्रभाव मॉडल के लिए भविष्यवाणी अंतराल
मैं एक lmer () मॉडल से एक भविष्यवाणी के आसपास एक भविष्यवाणी अंतराल प्राप्त करना चाहता हूं। मुझे इस बारे में कुछ चर्चा मिली है: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq लेकिन वे यादृच्छिक प्रभावों की अनिश्चितता को ध्यान में नहीं रखते हैं। यहाँ एक विशिष्ट उदाहरण है। मैं सोने की मछली की दौड़ …

2
क्या ARIMA को बेहतर बनाने के लिए MEAN के लिए यह असामान्य है?
मैंने हाल ही में कई पूर्वानुमान विधियों (MEAN, RWF, ETS, ARIMA और MLPs) को लागू किया और पाया कि MEAN ने आश्चर्यजनक रूप से अच्छा किया। (MEAN: जहां भविष्य की सभी भविष्यवाणियों का अवलोकन प्रेक्षित मानों के अंकगणितीय माध्य के बराबर किया गया है।) MEAN ने मेरे द्वारा उपयोग की …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.