सांख्यिकी और बिग डेटा

1

एक लैमर मॉडल से प्रभावों की पुनरावृत्ति की गणना

मैं सिर्फ इस पेपर में आया था , जो बताता है कि मिश्रित प्रभाव मॉडलिंग के माध्यम से माप की पुनरावृत्ति (उर्फ विश्वसनीयता, उर्फ इंट्राक्लास सहसंबंध) की गणना कैसे की जाती है। आर कोड होगा: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

3

MCMC एल्गोरिदम में त्रुटियों के उदाहरण

मैं मार्कोव चेन मोंटे कार्लो के तरीकों की स्वचालित जाँच के लिए एक विधि की जाँच कर रहा हूँ, और मैं कुछ ऐसे उदाहरणों को पसंद करूँगा जो ऐसे एल्गोरिदम का निर्माण या कार्यान्वित करते समय हो सकते हैं। प्रकाशित अंक में गलत पद्धति का उपयोग किए जाने पर बोनस …

28 mcmc

5

विभिन्न "सर्वश्रेष्ठ" मॉडलों में से सर्वश्रेष्ठ मॉडल चुनना

आप विभिन्न तरीकों द्वारा चुने गए विभिन्न मॉडलों में से एक मॉडल का चयन कैसे करते हैं (जैसे पीछे या आगे का चयन)? यह भी एक आदर्श मॉडल क्या है?

28 regression model-selection

4

समानता के उपाय या दो सहसंयोजक मैट्रिक्स के बीच की दूरी

क्या दो सममित कोवरियस मैट्रिस (दोनों समान आयाम वाले) के बीच समानता या दूरी के कोई उपाय हैं? मैं केएल के विचलन के लिए एनालॉग्स के बारे में सोच रहा हूँ दो संभावना वितरण या वैक्टर के बीच यूक्लिडियन दूरी को छोड़कर मैट्रिस पर लागू होता है। मुझे लगता है …

28 distributions hypothesis-testing covariance-matrix kullback-leibler information-theory

1

Google पूर्वानुमान API के पीछे क्या है?

Google प्रेडिक्शन एपीआई एक क्लाउड सेवा है जहां उपयोगकर्ता कुछ रहस्यमयी क्लासिफायरफायर को प्रशिक्षित करने के लिए कुछ प्रशिक्षण डेटा जमा कर सकता है और बाद में आने वाले डेटा को वर्गीकृत करने के लिए कह सकता है, उदाहरण के लिए स्पैम फ़िल्टर लागू करना या उपयोगकर्ता की प्राथमिकताओं की …

28 machine-learning

3

अनुभवजन्य संभावना के कुछ उदाहरण अनुप्रयोग क्या हैं?

मैंने ओवेन के अनुभवजन्य संभावना के बारे में सुना है, लेकिन हाल ही में जब तक मैंने ब्याज के एक कागज में इसे पार नहीं किया, तब तक कोई ध्यान नहीं दिया ( मेसर्सन एट अल। 2012 )। यह समझने के लिए मेरे प्रयासों में, मैं gleaned है कि मनाया …

28 bayesian maximum-likelihood nonparametric likelihood empirical-likelihood

4

जीएलएम के लिए छद्म आर चुकता सूत्र

मुझे किताब में छद्म लिए एक सूत्र मिला , विस्तार में द लाइनियर मॉडल विद आर, जूलियन जे। फाइववे (पृष्ठ 59)।R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} । क्या यह GLM के लिए छद्म एक सामान्य सूत्र है ?R2R2R^2

28 r regression generalized-linear-model r-squared

7

मनमाने ढंग से असतत वितरण के आधार पर संख्या कैसे उत्पन्न करें?

मैं मनमाने ढंग से असतत वितरण के आधार पर संख्याएँ कैसे उत्पन्न करूँ? उदाहरण के लिए, मेरे पास संख्याओं का एक समूह है जिसे मैं उत्पन्न करना चाहता हूं। कहते हैं कि उन्हें 1-3 के रूप में लेबल किया गया है। 1: 4%, 2: 50%, 3: 46% मूल रूप से, …

28 distributions

6

कुछ दिलचस्प और अच्छी तरह से लिखे गए आँकड़े के कागजात क्या हैं?

आंकड़ों के अनुप्रयोगों का वर्णन करने वाले कुछ अच्छे पेपर क्या हैं जो पढ़ने में मजेदार और जानकारीपूर्ण होंगे? बस स्पष्ट होने के लिए, मैं वास्तव में नए सांख्यिकीय तरीकों (उदाहरण के लिए, कम से कम कोण प्रतिगमन पर एक कागज) का वर्णन करने वाले कागजात की तलाश नहीं कर …

28 references application

3

आर के साथ बूटस्ट्रैप का उपयोग करते हुए पी-मूल्य की गणना करना

मैं एक अनुमानित 2-पक्षीय बूटस्ट्रैप किए गए पी-मान की गणना करने के लिए "बूट" पैकेज का उपयोग करता हूं लेकिन परिणाम t.test का उपयोग करने के पी-मूल्य से बहुत दूर है। मैं यह पता नहीं लगा सकता कि मैंने अपने आर कोड में क्या गलत किया है। क्या कोई मुझे …

28 r hypothesis-testing p-value bootstrap permutation-test

3

डेटा विश्लेषण में सर्वोत्तम अभ्यास के बारे में जानने के लिए गितुब पर किसका अनुसरण करना चाहिए?

विशेषज्ञों के डेटा विश्लेषण कोड का अध्ययन करना सहायक है। मैं हाल ही में जीथब को मना कर रहा हूं और वहां कई लोग डेटा विश्लेषण कोड साझा कर रहे हैं। इसमें कुछ आर पैकेज शामिल हैं (जो निश्चित रूप से सीधे सीआरएएन से उपलब्ध हैं), लेकिन प्रजनन अनुसंधान के …

28 r reproducible-research

6

पाई चार्ट के साथ समस्याएं

पाई चार्ट के बारे में चर्चा बढ़ती जा रही है। इसके खिलाफ मुख्य तर्क दिए गए हैं: क्षेत्र को लंबाई से कम शक्ति के साथ माना जाता है। पाई चार्ट में बहुत कम डेटा-पॉइंट-टू-पिक्सेल अनुपात है हालांकि, मुझे लगता है कि अनुपातों को चित्रित करते समय वे किसी तरह उपयोगी …

28 data-visualization many-categories pie-chart

7

मार्कोव चेन मोंटे कार्लो (MCMC) सीखने के लिए अच्छे स्रोत

MCMC तरीके सीखने के लिए एक अच्छे स्रोत के लिए कोई सुझाव?

28 references mcmc

4

MCMC में अभिसरण की जाँच के लिए सबसे अच्छी विधि क्या है?

बायोसियन अनुमान के लिए मार्कोव चेन मोंटे कार्लो का उपयोग करते समय अभिसरण के लिए जाँच करने का आपका पसंदीदा तरीका क्या है और क्यों?

28 bayesian mcmc

3

आर के साथ समय श्रृंखला के बारे में अलग हो रही है

यदि आप वापस सोचते हैं, जब आपने पहली बार समय श्रृंखला विश्लेषण के साथ शुरू किया था। क्या उपकरण, आर संकुल और इंटरनेट संसाधन आप चाहते हैं कि आप इसके बारे में जानते थे? जो मैं पूछने की कोशिश कर रहा हूं, वह कहां से शुरू होनी चाहिए? विशेष रूप …

28 r time-series