सांख्यिकी और बिग डेटा

Q & A में सांख्यिकी, मशीन लर्निंग, डेटा विश्लेषण, डेटा माइनिंग और डेटा विज़ुअलाइज़ेशन में रुचि रखने वाले लोगों के लिए

1
एक लैमर मॉडल से प्रभावों की पुनरावृत्ति की गणना
मैं सिर्फ इस पेपर में आया था , जो बताता है कि मिश्रित प्रभाव मॉडलिंग के माध्यम से माप की पुनरावृत्ति (उर्फ विश्वसनीयता, उर्फ ​​इंट्राक्लास सहसंबंध) की गणना कैसे की जाती है। आर कोड होगा: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
MCMC एल्गोरिदम में त्रुटियों के उदाहरण
मैं मार्कोव चेन मोंटे कार्लो के तरीकों की स्वचालित जाँच के लिए एक विधि की जाँच कर रहा हूँ, और मैं कुछ ऐसे उदाहरणों को पसंद करूँगा जो ऐसे एल्गोरिदम का निर्माण या कार्यान्वित करते समय हो सकते हैं। प्रकाशित अंक में गलत पद्धति का उपयोग किए जाने पर बोनस …
28 mcmc 

5
विभिन्न "सर्वश्रेष्ठ" मॉडलों में से सर्वश्रेष्ठ मॉडल चुनना
आप विभिन्न तरीकों द्वारा चुने गए विभिन्न मॉडलों में से एक मॉडल का चयन कैसे करते हैं (जैसे पीछे या आगे का चयन)? यह भी एक आदर्श मॉडल क्या है?

4
समानता के उपाय या दो सहसंयोजक मैट्रिक्स के बीच की दूरी
क्या दो सममित कोवरियस मैट्रिस (दोनों समान आयाम वाले) के बीच समानता या दूरी के कोई उपाय हैं? मैं केएल के विचलन के लिए एनालॉग्स के बारे में सोच रहा हूँ दो संभावना वितरण या वैक्टर के बीच यूक्लिडियन दूरी को छोड़कर मैट्रिस पर लागू होता है। मुझे लगता है …

1
Google पूर्वानुमान API के पीछे क्या है?
Google प्रेडिक्शन एपीआई एक क्लाउड सेवा है जहां उपयोगकर्ता कुछ रहस्यमयी क्लासिफायरफायर को प्रशिक्षित करने के लिए कुछ प्रशिक्षण डेटा जमा कर सकता है और बाद में आने वाले डेटा को वर्गीकृत करने के लिए कह सकता है, उदाहरण के लिए स्पैम फ़िल्टर लागू करना या उपयोगकर्ता की प्राथमिकताओं की …

3
अनुभवजन्य संभावना के कुछ उदाहरण अनुप्रयोग क्या हैं?
मैंने ओवेन के अनुभवजन्य संभावना के बारे में सुना है, लेकिन हाल ही में जब तक मैंने ब्याज के एक कागज में इसे पार नहीं किया, तब तक कोई ध्यान नहीं दिया ( मेसर्सन एट अल। 2012 )। यह समझने के लिए मेरे प्रयासों में, मैं gleaned है कि मनाया …

4
जीएलएम के लिए छद्म आर चुकता सूत्र
मुझे किताब में छद्म लिए एक सूत्र मिला , विस्तार में द लाइनियर मॉडल विद आर, जूलियन जे। फाइववे (पृष्ठ 59)।R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} । क्या यह GLM के लिए छद्म एक सामान्य सूत्र है ?R2R2R^2

7
मनमाने ढंग से असतत वितरण के आधार पर संख्या कैसे उत्पन्न करें?
मैं मनमाने ढंग से असतत वितरण के आधार पर संख्याएँ कैसे उत्पन्न करूँ? उदाहरण के लिए, मेरे पास संख्याओं का एक समूह है जिसे मैं उत्पन्न करना चाहता हूं। कहते हैं कि उन्हें 1-3 के रूप में लेबल किया गया है। 1: 4%, 2: 50%, 3: 46% मूल रूप से, …

6
कुछ दिलचस्प और अच्छी तरह से लिखे गए आँकड़े के कागजात क्या हैं?
आंकड़ों के अनुप्रयोगों का वर्णन करने वाले कुछ अच्छे पेपर क्या हैं जो पढ़ने में मजेदार और जानकारीपूर्ण होंगे? बस स्पष्ट होने के लिए, मैं वास्तव में नए सांख्यिकीय तरीकों (उदाहरण के लिए, कम से कम कोण प्रतिगमन पर एक कागज) का वर्णन करने वाले कागजात की तलाश नहीं कर …

3
आर के साथ बूटस्ट्रैप का उपयोग करते हुए पी-मूल्य की गणना करना
मैं एक अनुमानित 2-पक्षीय बूटस्ट्रैप किए गए पी-मान की गणना करने के लिए "बूट" पैकेज का उपयोग करता हूं लेकिन परिणाम t.test का उपयोग करने के पी-मूल्य से बहुत दूर है। मैं यह पता नहीं लगा सकता कि मैंने अपने आर कोड में क्या गलत किया है। क्या कोई मुझे …

3
डेटा विश्लेषण में सर्वोत्तम अभ्यास के बारे में जानने के लिए गितुब पर किसका अनुसरण करना चाहिए?
विशेषज्ञों के डेटा विश्लेषण कोड का अध्ययन करना सहायक है। मैं हाल ही में जीथब को मना कर रहा हूं और वहां कई लोग डेटा विश्लेषण कोड साझा कर रहे हैं। इसमें कुछ आर पैकेज शामिल हैं (जो निश्चित रूप से सीधे सीआरएएन से उपलब्ध हैं), लेकिन प्रजनन अनुसंधान के …

6
पाई चार्ट के साथ समस्याएं
पाई चार्ट के बारे में चर्चा बढ़ती जा रही है। इसके खिलाफ मुख्य तर्क दिए गए हैं: क्षेत्र को लंबाई से कम शक्ति के साथ माना जाता है। पाई चार्ट में बहुत कम डेटा-पॉइंट-टू-पिक्सेल अनुपात है हालांकि, मुझे लगता है कि अनुपातों को चित्रित करते समय वे किसी तरह उपयोगी …



3
आर के साथ समय श्रृंखला के बारे में अलग हो रही है
यदि आप वापस सोचते हैं, जब आपने पहली बार समय श्रृंखला विश्लेषण के साथ शुरू किया था। क्या उपकरण, आर संकुल और इंटरनेट संसाधन आप चाहते हैं कि आप इसके बारे में जानते थे? जो मैं पूछने की कोशिश कर रहा हूं, वह कहां से शुरू होनी चाहिए? विशेष रूप …
28 r  time-series 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.