सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

4
पॉसों यादृच्छिक चर के औसत के नीचे गोल वितरण क्या है?
अगर मेरे पास यादृच्छिक चर हैं कि Poisson को पैरामीटर के साथ वितरित किए जाते हैं, तो का वितरण क्या है (यानी औसत का पूर्णांक तल)?एक्स1, एक्स2, ... , एक्सnएक्स1,एक्स2,...,एक्सnX_1,X_2,\ldots,X_nλ1, λ2, … , Λnλ1,λ2,...,λn\lambda_1, \lambda_2,\ldots, \lambda_nY= ⌊ Σnमैं = १एक्समैंn⌋Y=⌊Σमैं=1nएक्समैंn⌋Y=\left\lfloor\frac{\sum_{i=1}^n X_i}{n}\right\rfloor पॉसों का एक योग भी पॉइसन है, लेकिन मुझे …

2
एक लॉजिस्टिक प्रतिगमन से अनुमानित संभावनाओं के लिए आत्मविश्वास अंतराल को प्लॉट करना
ठीक है, मेरे पास एक लॉजिस्टिक रिग्रेशन है और predict()अपने अनुमानों के आधार पर प्रायिकता वक्र विकसित करने के लिए फ़ंक्शन का उपयोग किया है । ## LOGIT MODEL: library(car) mod1 = glm(factor(won) ~ as.numeric(bid), data=mydat, family=binomial(link="logit")) ## PROBABILITY CURVE: all.x <- expand.grid(won=unique(won), bid=unique(bid)) y.hat.new <- predict(mod1, newdata=all.x, type="response") plot(bid<-000:1000,predict(mod1,newdata=data.frame(bid<-c(000:1000)),type="response"), …

1
R में क्यूक्लाइन () द्वारा निर्मित लाइन का उपयोग क्या है?
qqnorm()आर समारोह एक सामान्य QQ-भूखंड पैदा करता है और qqline()एक लाइन जो पहले और तीसरे चतुर्थकों से होकर गुजरता है कहते हैं। इस रेखा की उत्पत्ति क्या है? क्या यह सामान्यता की जाँच में सहायक है? यह शास्त्रीय रेखा नहीं है (विकर्ण संभवतः रेखीय स्केलिंग के बाद)।y= एक्सy=एक्सy=x यहाँ एक …

2
रैखिक मिश्रित-प्रभाव मॉडलिंग के एक विशेष मामले के रूप में युग्मित टी-परीक्षण
हम जानते हैं कि एक युग्मित t -est केवल एक तरफ़ा दोहराया-माप (या भीतर-विषय) ANOVA के साथ-साथ रैखिक मिश्रित-प्रभाव मॉडल का एक विशेष मामला है, जिसे lme के साथ प्रदर्शित किया जा सकता है () आर में nlme पैकेज का कार्य करता है जैसा की नीचे दिखाया गया। #response data …

3
क्या गैर-रेखीय सहसंबंधों का पता लगाने के लिए एमआईसी एल्गोरिदम को सहज रूप से समझाया जा सकता है?
अभी हाल ही में, मैंने दो लेख पढ़े। पहला सहसंबंध के इतिहास के बारे में है और दूसरा नई विधि के बारे में है जिसे मैक्सिमल इन्फ़ॉर्मेशन कोएफ़िशिएंसी (एमआईसी) कहा जाता है। चर के बीच गैर-रेखीय सहसंबंधों का अनुमान लगाने के लिए एमआईसी पद्धति को समझने के लिए मुझे आपकी …

3
डमी कोडिंग बनाम ANCOVA के साथ एक से अधिक प्रतिगमन का उपयोग कब करना चाहिए?
मैंने हाल ही में एक प्रयोग का विश्लेषण किया जिसमें 2 श्रेणीबद्ध चर और एक निरंतर चर का उपयोग ANCOVA का हेरफेर किया। हालांकि, एक समीक्षक ने सुझाव दिया कि डमी चर के रूप में वर्गीकृत वैचारिक चर के साथ कई प्रतिगमन दोनों श्रेणीबद्ध और निरंतर चर के साथ प्रयोगों …


2
एनोवा में चर का क्रम मायने रखता है, है ना?
क्या मैं यह समझने के लिए सही हूं कि एक बहुक्रियाशील ANOVA में चर को जिस क्रम में निर्दिष्ट किया गया है, उससे कुछ फर्क पड़ता है लेकिन यह कि कई रेखीय प्रतिगमन करते समय यह क्रम मायने नहीं रखता है? तो एक परिणाम मानकर जैसे कि रक्त की हानि …

2
प्रतिशत बनाम अनुपात के लिए एक रैखिक मॉडल का निर्माण?
मान लीजिए कि मैं किसी प्रकार के अनुपात या प्रतिशत की भविष्यवाणी करने के लिए एक मॉडल बनाना चाहता हूं। उदाहरण के लिए, मान लें कि मैं उन लड़कों बनाम लड़कियों की संख्या की भविष्यवाणी करना चाहता हूं जो एक पार्टी में भाग लेंगे, और पार्टी की जिन विशेषताओं का …

1
जीनोम-वाइड एसोसिएशन अध्ययनों में, प्रमुख घटक क्या हैं?
में जीनोम चौड़ा संघ के अध्ययन (GWAS): प्रमुख घटक क्या हैं? उनका उपयोग क्यों किया जाता है? उनकी गणना कैसे की जाती है? क्या पीसीए का उपयोग किए बिना जीनोम-वाइड एसोसिएशन अध्ययन किया जा सकता है?
20 pca  genetics  gwas 

4
उत्तरजीविता विश्लेषण: निरंतर बनाम असतत समय
मैं असमंजस में हूं कि कैसे तय किया जाए कि जीवित रहने के विश्लेषण में समय को निरंतर या असतत माना जाए। विशेष रूप से, मैं बच्चे और घरेलू स्तर के चर की पहचान करने के लिए उत्तरजीविता विश्लेषण का उपयोग करना चाहता हूं जो लड़कों की लड़कियों के अस्तित्व …
20 survival  ties 

7
एक बॉक्सप्लॉट के कुछ विकल्प क्या हैं?
मैं एक वेबसाइट बनाने पर काम कर रहा हूं, जो एक चयनित उपयोगकर्ता के लिए जनगणना के आंकड़ों को प्रदर्शित करता है और विभिन्न मापदंडों (एक पैरा प्रति पैरामीटर) के वितरण को रेखांकन दिखाना चाहेगा। डेटा में आमतौर पर निम्नलिखित गुण होते हैं: नमूना आकार बड़ा हो (लगभग 10,000 डेटा …

9
एक समय श्रृंखला के Ljung-Box परीक्षण में कितने लैग का उपयोग करना है?
ARMA मॉडल एक समय श्रृंखला में फिट होने के बाद, Ljung-Box portmanteau परीक्षण (अन्य परीक्षणों के बीच) के माध्यम से अवशेषों की जांच करना आम है। Ljung-Box परीक्षण एप वैल्यू देता है। इसका एक पैरामीटर है, एच , जो परीक्षण किए जाने वाले लैग्स की संख्या है। कुछ ग्रंथ h …

3
एक वितरण के क्षण - आंशिक या उच्च क्षणों के लिए कोई उपयोग?
कुछ गुणों का वर्णन करने के लिए वितरण के दूसरे, तीसरे और चौथे क्षणों का उपयोग करना सामान्य है। क्या चौथे से अधिक आंशिक क्षण या क्षण किसी वितरण के उपयोगी गुणों का वर्णन करते हैं?

6
हमेशा रोबस्ट (व्हाइट) स्टैंडर्ड एरर्स की रिपोर्ट करें?
एंग्रीस्ट और पिस्चके द्वारा यह सुझाव दिया गया है कि रोबस्ट (यानी विषमलैंगिकता या असमान रूपांतरों के लिए मजबूत) मानक त्रुटियों को इसके लिए परीक्षण के बजाय पाठ्यक्रम के रूप में रिपोर्ट किया जाता है। दो सवाल: होमोसकेडिसिटी होने पर ऐसा करने की मानक त्रुटियों पर क्या प्रभाव पड़ता है? …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.