सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

2
svyglm बनाम glm में वजन का उपयोग
मैं जानना चाहूंगा कि वज़न का उपचार किस प्रकार svyglmऔर किसके बीच भिन्न होता हैglm मैं twangआर स्कोरिंग पैकेज का उपयोग कर रहा हूँ ताकि वे फिर से वज़न के रूप में उपयोग कर सकें, इस प्रकार से (यह कोड twangप्रलेखन से आता है ): library(twang) library(survey) set.seed(1) data(lalonde) ps.lalonde …
18 r  survey 

1
असतत समय अस्तित्व विश्लेषण के बारे में बुनियादी सवाल
मैं एक लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करके असतत समय उत्तरजीविता विश्लेषण करने का प्रयास कर रहा हूं, और मुझे यकीन नहीं है कि मैं पूरी तरह से प्रक्रिया को समझता हूं। मैं कुछ बुनियादी सवालों के साथ सहायता की बहुत सराहना करूंगा। यहाँ सेट है: मैं एक समूह में …

4
क्रॉस सत्यापन और पैरामीटर ट्यूनिंग
क्या कोई मुझे बता सकता है कि परिणाम के रूप में वास्तव में क्रॉस-सत्यापन विश्लेषण क्या देता है? क्या यह सिर्फ औसत सटीकता है या यह किसी भी मॉडल को दिए गए मापदंडों के साथ देता है? क्योंकि, मैंने कहीं सुना है कि पैरामीटर-ट्यूनिंग के लिए क्रॉस-वैलिडेशन का उपयोग किया …

4
हम महत्वपूर्ण अंकों का उपयोग क्यों नहीं करते?
कोई भी विचार क्यों हम आँकड़ों में महत्वपूर्ण अंकों का उपयोग नहीं करते हैं? हम जिस रेखा के साथ कुछ अनुमान लगा रहे हैं, उसमें शुद्धता के बारे में नियम लागू नहीं होते?)
18 reporting 

1
रैखिक प्रतिगमन में श्रेणीबद्ध चर के लिए सांख्यिकीय महत्व का परीक्षण कैसे करें?
यदि एक रेखीय प्रतिगमन में मेरे पास श्रेणीगत चर है ... तो मैं कैसे श्रेणीगत चर के स्थिर संकेत को जान सकता हूं? मान लीजिए कि कारक के 10 स्तर हैं ... एक कारक चर की छतरी के नीचे 10 विभिन्न परिणामी टी-मान ...X1X1X_1X1X1X_1 ऐसा लगता है कि सांख्यिकीय चर …

3
क्या एक बहु-स्तरीय क्लासिफायरियर कई बाइनरी वाले की तुलना में बेहतर है?
मुझे URL को श्रेणियों में वर्गीकृत करना होगा। कहो कि मेरे पास 15 श्रेणियां हैं जिन्हें मैं हर URL को शून्य करने की योजना बना रहा हूं। क्या 15-रास्ता क्लासिफायर बेहतर है? जहां मेरे पास 15 लेबल हैं और प्रत्येक डेटा बिंदु के लिए सुविधाएं उत्पन्न करता है। या 15 …

1
क्या रेखीय प्रतिगमन गुणांक के लिए आत्मविश्वास अंतराल सामान्य या
चलो कुछ रैखिक मॉडल हैं, उदाहरण के लिए सिर्फ सरल एनोवा: # data generation set.seed(1.234) Ng <- c(41, 37, 42) data <- rnorm(sum(Ng), mean = rep(c(-1, 0, 1), Ng), sd = 1) fact <- as.factor(rep(LETTERS[1:3], Ng)) m1 = lm(data ~ 0 + fact) summary(m1) परिणाम इस प्रकार है: Call: lm(formula …

1
बहुभिन्नरूपी सामान्य पीछे
यह एक बहुत ही सरल प्रश्न है, लेकिन मैं इंटरनेट या किसी पुस्तक में कहीं भी व्युत्पत्ति नहीं पा सकता हूं। मैं यह देखना चाहता हूं कि कैसे एक बायेसियन एक बहुभिन्नरूपी सामान्य वितरण को अपडेट करता है। उदाहरण के लिए: कल्पना कीजिए P(x|μ,Σ)P(μ)==N(μ,Σ)N(μ0,Σ0).P(x|μ,Σ)=N(μ,Σ)P(μ)=N(μ0,Σ0). \begin{array}{rcl} \mathbb{P}({\bf x}|{\bf μ},{\bf Σ}) & …

1
MLE बनाम कम से कम वर्गों में फिटिंग की संभावना वितरण
कई पेपरों, पुस्तकों और मेरे द्वारा पढ़े गए लेखों के आधार पर मुझे जो धारणा मिली, वह यह है कि डेटा के एक सेट पर प्रायिकता वितरण को फिट करने का अनुशंसित तरीका अधिकतम संभावना अनुमान (MLE) का उपयोग करके है। हालांकि, एक भौतिक विज्ञानी के रूप में, एक अधिक …


4
मूविंग-औसत मॉडल त्रुटि शर्तें
यह बॉक्स-जेनकिंस एमए मॉडल पर एक बुनियादी सवाल है। मैं समझता हूँ के रूप में, एमए मॉडल मूल रूप से समय श्रृंखला की एक रेखीय प्रतिगमन है महत्व देता YYY पिछले त्रुटि शर्तों के खिलाफ et,...,et−net,...,et−ne_t,..., e_{t-n} । अर्थात्, अवलोकन YYY को पहले इसके पिछले मूल्यों विरुद्ध पुन: प्राप्त किया …

1
पियर्सन का ची स्क्वैयर टेस्ट कैसे काम करता है
हाल ही के एक डाउन वोट के बाद मैं पियर्सन ची स्क्वेरड टेस्ट की अपनी समझ को जांचने की कोशिश कर रहा हूं। मैं आमतौर पर ची स्क्वेरड स्टैटिस्टिक (या ची स्क्वैड स्टैटिस्टिक) का उपयोग फिटिंग या परिणामी जांच के लिए करता हूं। इस मामले में विचरण आमतौर पर किसी …

2
मल्टीस्कल्स एसवीएम प्रदर्शन करने का सबसे अच्छा तरीका
मुझे पता है कि एसवीएम एक बाइनरी क्लासिफायरियर है। मैं इसे मल्टी-क्लास एसवीएम तक विस्तारित करना चाहूंगा। जो सबसे अच्छा है, और शायद सबसे आसान, इसे करने का तरीका? कोड: MATLAB में u=unique(TrainLabel); N=length(u); if(N>2) itr=1; classes=0; while((classes~=1)&&(itr<=length(u))) c1=(TrainLabel==u(itr)); newClass=double(c1); tst = double((TestLabel == itr)); model = svmtrain(newClass, TrainVec, '-c …

2
एक लॉजिस्टिक प्रतिगमन से गुणांक की व्याख्या कैसे करें?
मैं निम्नलिखित संभावना समारोह है: प्रोब = १1 + ई- zसमस्या=11+इ-z\text{Prob} = \frac{1}{1 + e^{-z}} कहाँ पे z= बी0+ बी1एक्स1+ ⋯ + बीnएक्सn।z=बी0+बी1एक्स1+⋯+बीnएक्सn।z = B_0 + B_1X_1 + \dots + B_nX_n. मेरा मॉडल जैसा दिखता है पीआर ( वाई= 1 ) = 11 + ऍक्स्प( - [ - 3.92 + …

2
क्या रैखिक प्रतिगमन में पूर्वाग्रह-विचरण व्यापार का चित्रमय प्रतिनिधित्व है?
मैं एक अंधकार से पीड़ित हूं। मुझे रेखीय प्रतिगमन के संदर्भ में पूर्वाग्रह-विचरण व्यापार का प्रदर्शन करने के लिए निम्नलिखित चित्र प्रस्तुत किया गया था: मैं देख सकता हूं कि दोनों में से कोई भी मॉडल एक अच्छा फिट नहीं है - "सरल" एक्सवाई संबंध की जटिलता की सराहना नहीं …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.