सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
स्टेप वाइज एआईसी - क्या इस विषय को लेकर कोई विवाद है?
मैंने इस साइट पर अनगिनत पोस्ट पढ़ी हैं जो अविश्वसनीय रूप से किसी भी प्रकार के मानदंड का उपयोग करके चर के चयन के खिलाफ हैं चाहे वह पी-मान आधारित हो, एआईसी, बीआईसी, आदि। मैं समझता हूं कि ये प्रक्रियाएं सामान्य क्यों हैं, चर के चयन के लिए काफी खराब …

2
क्यू-क्यू सीखने में अक्षर क्यू चुना गया था?
क्यू-क्यू के नाम पर अक्षर Q को क्यों चुना गया? अधिकांश पत्रों को एक संक्षिप्त नाम के रूप में चुना जाता है, जैसे कि नीति के लिए खड़ा होता है और मूल्य के लिए खड़ा होता है। लेकिन मुझे नहीं लगता कि Q किसी शब्द का संक्षिप्त नाम है।वीππ\pivvv

2
Bayesian दृष्टिकोण से LASSO और रिज: ट्यूनिंग पैरामीटर के बारे में क्या?
LASSO और रिज जैसे दंडित प्रतिगमन अनुमानकों को कुछ पुजारियों के साथ बायेसियन अनुमानकों के अनुरूप कहा जाता है। मुझे लगता है (जैसा कि मैं बायेसियन आंकड़ों के बारे में पर्याप्त नहीं जानता हूं) कि एक निश्चित ट्यूनिंग पैरामीटर के लिए, पहले से एक ठोस मौजूद है। अब एक व्यक्तिवादी …

11
क्या आप तानाशाह खेल के इस उदाहरण में सहसंबंध से कार्य-कारण का अनुमान लगा सकते हैं?
मैंने अभी-अभी परीक्षा दी थी जहाँ हमें दो चर के साथ प्रस्तुत किया गया था। तानाशाह के खेल में जहां एक तानाशाह को 100 USD दिए जाते हैं, और यह चुन सकता है कि अपने लिए कितना भेजना या रखना है, उम्र के बीच सकारात्मक संबंध था और प्रतिभागियों ने …

3
जब उत्पादन और भविष्यवक्ताओं के बीच कोई पर्याप्त संबंध नहीं होता है तो एक अच्छा रैखिक प्रतिगमन मॉडल प्राप्त करना कैसे संभव है?
मैंने एक रैखिक प्रतिगमन मॉडल को प्रशिक्षित किया है, जिसमें चर / सुविधाओं का एक सेट है। और मॉडल का अच्छा प्रदर्शन है। हालांकि, मैंने महसूस किया है कि अनुमानित चर के साथ एक अच्छा संबंध नहीं है। यह कैसे संभव है?

3
"सांख्यिकीय प्रयोग" और "सांख्यिकीय मॉडल" में क्या अंतर है?
मैं AW वैन डेर वार्ट, एसिम्प्टोटिक आँकड़े (1998) का अनुसरण कर रहा हूं। वह सांख्यिकीय प्रयोगों की बात करता है, यह दावा करता है कि वे एक सांख्यिकीय मॉडल से अलग हैं, लेकिन वह न तो परिभाषित करता है। मेरा प्रश्न: क्या है (1) एक सांख्यिकीय प्रयोग, (2) एक सांख्यिकीय …

3
साधारण वर्ग के गुणांक खोजने के लिए "सामान्य समीकरणों" का उपयोग क्यों नहीं किया जाता है?
मैंने इस सूची को यहाँ देखा और विश्वास नहीं कर सकता था कि कम से कम वर्गों को हल करने के बहुत सारे तरीके थे। "सामान्य समीकरण" पर विकिपीडिया एक काफी सीधे आगे रास्ता लग रहा α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle {\begin{aligned}{\hat {\alpha }}&={\bar {y}}-{\hat {\beta }}\,{\bar {x}},\\{\hat {\beta }}&={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar …

7
क्या "सामान्य वितरण" का मतलब = मध्य = मोड होना चाहिए?
मैं "सामान्य वितरण" के बारे में अपने स्नातक-स्तरीय सांख्यिकी प्रोफेसर के साथ एक बहस में रहा हूं। मेरा तर्क है कि वास्तव में एक सामान्य वितरण प्राप्त करने के लिए एक का मतलब होना चाहिए = माध्य = मोड, सभी डेटा को घंटी वक्र के नीचे और पूरी तरह सममित …

1
प्रश्नोत्तरी: अपनी निर्णय सीमा द्वारा वर्गीकरण को बताएं
नीचे 6 निर्णय सीमाएँ दी गई हैं। निर्णय सीमा वायलेट लाइनों है। डॉट्स और क्रॉस दो अलग-अलग डेटा सेट हैं। हमें तय करना है कि कौन सा एक है: रैखिक एसवीएम कर्नेलयुक्त SVM (बहुपद कर्नेल ऑफ़ ऑर्डर 2) perceptron रसद प्रतिगमन तंत्रिका नेटवर्क (10 सुधारा हुआ रैखिक इकाइयों के साथ …

1
अधिकतम संभावनाएं और क्षणों की विधि समान अनुमानक कब उत्पन्न करती हैं?
मुझे दूसरे दिन यह सवाल पूछा गया था और पहले कभी इस पर विचार नहीं किया था। मेरा अंतर्ज्ञान प्रत्येक अनुमानक के फायदे से आता है। अधिकतम संभावना तब होती है जब हम डेटा जनरेट करने की प्रक्रिया में आश्वस्त होते हैं क्योंकि, क्षणों की विधि के विपरीत, यह संपूर्ण …

2
प्रतिक्रिया चर में 0s और 1s के साथ बीटा रिग्रेशन डील वास्तव में क्यों नहीं हो सकती है?
बीटा प्रतिगमन (यानी बीटा वितरण के साथ GLM और आमतौर पर लॉगिट लिंक फ़ंक्शन) को अक्सर 0 और 1 के बीच मान लेने वाले प्रतिक्रिया उर्फ ​​आश्रित चर से निपटने के लिए अनुशंसित किया जाता है, जैसे अंश, अनुपात, या संभावनाएं: परिणाम के लिए प्रतिगमन (अनुपात या अंश) 0 और …

6
यदि नमूना आकार छोटा है, तो क्या मुझे टी-टेस्ट के महत्वपूर्ण परिणाम पर भरोसा कर सकता हूं?
यदि मेरा एक तरफा टी-परीक्षण परिणाम महत्वपूर्ण है, लेकिन नमूना आकार छोटा है (उदाहरण के लिए 20 या उससे नीचे), तो क्या मैं अभी भी इस परिणाम पर भरोसा कर सकता हूं? यदि नहीं, तो मुझे इस परिणाम का सौदा और / या व्याख्या कैसे करनी चाहिए?

4
बॉक्स और व्हिस्कर प्लॉट की रूपरेखा क्या है?
एक बॉक्स और व्हिस्कर प्लॉट के लिए एक की मानक परिभाषा की सीमा के बाहर के बिंदु हैं , जहां और पहला चतुर्थक और डेटा की तीसरी चतुर्थांश है।{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 इस परिभाषा का आधार क्या है? बड़ी संख्या में अंकों के साथ, यहां तक ​​कि एक पूरी तरह से सामान्य …

2
दो स्वतंत्र बर्नौली आबादी से नमूना वितरण
मान लेते हैं कि हमारे पास दो स्वतंत्र बर्नौली यादृच्छिक चर, और ।Ber(θ1)Ber(θ1)\mathrm{Ber}(\theta_1)बी ई आर ( θ)2)बीइआर(θ2)\mathrm{Ber}(\theta_2) हम कैसे साबित करते हैं कि ?( एक्स)¯1- एक्स¯2) - ( θ1- θ2)θ1( 1 - θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1) मान लें कि ।n1≠n2n1≠n2n_1\neq n_2

3
N सफलताओं तक मैं कैसे फ़्लिप कर सकता हूँ?
आप और मैं एक खेल खेलने का फैसला करते हैं जहाँ हम एक सिक्का उछालते हैं। कुल में 10 सिर फ्लिप करने वाला पहला खिलाड़ी खेल जीतता है। स्वाभाविक रूप से, इस बारे में एक तर्क है कि पहले किसे जाना चाहिए। इस खेल के सिमुलेशन से पता चलता है …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.