सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

9
लोग दिए गए मॉडल की संभावना की कंप्यूटिंग के बजाय पी-वैल्यू का उपयोग क्यों करते हैं?
मोटे तौर पर एक पी-मूल्य बोलने से एक परिकल्पना (मॉडल) दिए गए प्रयोग के देखे गए परिणाम की संभावना मिलती है। इस संभावना (पी-वैल्यू) के बाद हम अपनी परिकल्पना (यह कितनी संभावना है) का न्याय करना चाहते हैं। लेकिन क्या यह अधिक स्वाभाविक नहीं होगा कि परिकल्पित परिकल्पना की संभावना …

3
सुदृढीकरण सीखने में छूट कारक की भूमिका को समझना
मैं खुद को सुदृढीकरण सीखने के बारे में सिखा रहा हूं, और रियायती इनाम की अवधारणा को समझने की कोशिश कर रहा हूं। तो इनाम यह बताने के लिए आवश्यक है कि कौन सा सिस्टम राज्य-एक्शन जोड़े अच्छा है, और कौन सा बुरा है। लेकिन मुझे समझ में नहीं आता …

3
Iterated Expectations के कानून का एक सामान्यीकरण
मैं हाल ही में इस पहचान में आया: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] मैं निश्चित रूप से उस नियम के सरल संस्करण से परिचित हूं, अर्थात् लेकिन मैं इसके लिए औचित्य नहीं ढूंढ पा रहा था इसका सामान्यीकरण।E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E …

3
क्या बायेसियन दृष्टिकोण से बूटस्ट्रैप की व्याख्या करना संभव है?
ठीक है, यह एक सवाल है जो मुझे रात में रखता है। क्या बूटस्ट्रैप प्रक्रिया की व्याख्या कुछ बायेसियन प्रक्रिया (बायेसियन बूटस्ट्रैप को छोड़कर) के रूप में की जा सकती है? मुझे वास्तव में बायेसियन की व्याख्या "पसंद है" जो मुझे अच्छी तरह से सुसंगत और समझने में आसान लगती …

2
एमए (क्यू) समय श्रृंखला के मॉडल को "चलती औसत" क्यों कहा जाता है?
जब मैं टाइम सीरीज़ के संबंध में "मूविंग एवरेज" पढ़ता हूं, तो मुझे लगता है कि , या शायद एक भारित औसत जैसे । (मुझे लगता है कि ये वास्तव में एआर (3) मॉडल हैं, लेकिन ये वही हैं जो मेरा मस्तिष्क कूदता है।) एमए (क्यू) त्रुटि शब्दों के मॉडल …

4
असंतुलित डेटा के खिलाफ निर्णय वृक्ष का प्रशिक्षण
मैं डेटा माइनिंग के लिए नया हूं और मैं एक डेटा सेट के खिलाफ एक निर्णय पेड़ को प्रशिक्षित करने की कोशिश कर रहा हूं जो अत्यधिक असंतुलित है। हालाँकि, मुझे खराब भविष्यवाणियाँ सटीकता के साथ समस्या हो रही हैं। डेटा में पाठ्यक्रम का अध्ययन करने वाले छात्र होते हैं, …

3
लॉजिस्टिक रिग्रेशन के लिए नियमितीकरण के तरीके
रेखीय प्रतिगमन के लिए रिज, लास्सो, इलास्टिकनेट जैसे तरीकों का उपयोग करते हुए नियमितीकरण काफी सामान्य है। मैं निम्नलिखित जानना चाहता था: क्या ये तरीके लॉजिस्टिक प्रतिगमन के लिए लागू हैं? यदि हां, तो क्या लॉजिस्टिक रिग्रेशन के लिए उनका उपयोग करने के तरीके में कोई अंतर है? यदि ये …

2
अधिकतम संभावना विधि बनाम कम से कम वर्ग विधि
अधिकतम संभावना अनुमान (MLE) बनाम कम से कम वर्गों के अनुमानों (LSE) के बीच मुख्य अंतर क्या है? हम रैखिक प्रतिगमन और इसके विपरीत में मूल्यों की भविष्यवाणी के लिए MLE का उपयोग क्यों नहीं कर सकते हैं?yyy इस विषय पर किसी भी मदद की बहुत सराहना की जाएगी।

2
तंत्रिका नेटवर्क में अधिकतम क्या है?
क्या कोई समझा सकता है कि तंत्रिका नेटवर्क में अधिकतम यूनिट क्या करती हैं? वे कैसे प्रदर्शन करते हैं और पारंपरिक इकाइयों से अलग कैसे होते हैं? मैंने गुडफेलो एट अल द्वारा 2013 के "मैक्सआउट नेटवर्क" पेपर को पढ़ने की कोशिश की । (प्रोफेसर योशुआ बेंगियो के समूह से), लेकिन …

9
सांख्यिकी सिखाते समय, "सामान्य" या "गाऊसी" का उपयोग करें?
मैं अपनी पुस्तक में ज्यादातर "गॉसियन वितरण" का उपयोग करता हूं, लेकिन किसी ने सुझाव दिया कि मैं "सामान्य वितरण" पर स्विच कर दूं। शुरुआती के लिए किस शब्द का उपयोग करने पर कोई सहमति? बेशक दो शब्द पर्यायवाची हैं , इसलिए यह पदार्थ के बारे में सवाल नहीं है, …

7
भविष्यवाणियों में रैंडम फ़ॉरेस्ट गुम मानों को संभालता क्यों नहीं है?
लापता मूल्यों को संभालने के लिए सैद्धांतिक कारण क्या हैं? ग्रेडिंग बूस्टिंग मशीन, रिग्रेशन ट्री लापता मूल्यों को संभालते हैं। रैंडम फ़ॉरेस्ट ऐसा क्यों नहीं करता है?

3
फिट किए गए कई प्रतिगमन मॉडल की कल्पना कैसे करें?
मैं वर्तमान में कई एकाधिक प्रतिगमन विश्लेषणों के साथ एक पेपर लिख रहा हूं। जबकि बिखरे हुए भूखंडों के माध्यम से एकतरफा रैखिक प्रतिगमन की कल्पना करना आसान है, मैं सोच रहा था कि क्या कई रैखिक रजिस्टरों की कल्पना करने का कोई अच्छा तरीका है? मैं वर्तमान में केवल …

5
औसतन प्रत्येक बूटस्ट्रैप नमूने में लगभग दो तिहाई अवलोकनों का समावेश क्यों होता है?
मैं दावे के पार चला गया है कि प्रत्येक बूटस्ट्रैप नमूना (या जीता पेड़) औसतन लगभग शामिल होंगे 2/32/32/3 टिप्पणियों की। मैं समझता हूँ कि नहीं की संभावना से किसी में चयनित होने nnn से ड्रॉ nnn नमूने के साथ प्रतिस्थापन है (1−1/n)n(1−1/n)n(1- 1/n)^n है, जो लगभग करने के लिए …
42 bootstrap 

4
GARCH और ARMA में क्या अंतर है?
मैं उलझन में हूं। मैं एक ARMA और एक GARCH प्रक्रिया के अंतर को नहीं समझता .. मेरे लिए वही हैं जो नहीं हैं? यहाँ (G) ARCH (p, q) प्रक्रिया है σ2t=α0+∑i=1qαir2t−iARCH+∑i=1pβiσ2t−iGARCHσt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} _{GARCH} और यहाँ ARMA ( ) है:p,qp,qp, q …
42 arima  garch  finance 

4
टेलर श्रृंखला (विशेष रूप से शेष) की उम्मीद रखना
मेरा सवाल है कि एक व्यापक रूप से इस्तेमाल की जाने वाली विधि को उचित ठहराने की कोशिश की जा रही है, जिसका अर्थ है टेलर श्रृंखला का अपेक्षित मूल्य लेना। मान लें कि हमारे पास सकारात्मक माध्य और विचरण साथ एक यादृच्छिक चर । इसके अतिरिक्त, हमारे पास एक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.