resampling पर टैग किए गए जवाब

रेज़मैम्पलिंग एक नमूने से एक नमूना ले रहा है। सामान्य उपयोग जैकनाइफिंग (एक सबमिशन, उदाहरण के लिए सभी मूल्य लेकिन 1) और बूटस्ट्रैपिंग (नमूना w / प्रतिस्थापन) ले रहे हैं। ये तकनीक एक नमूना वितरण का एक मजबूत अनुमान प्रदान कर सकती है जब विश्लेषणात्मक रूप से प्राप्त करना मुश्किल या असंभव होगा।

5
बहुत बड़ी संख्या में डेटा बिंदुओं में मानों की प्रतिरूपण कैसे करें?
मेरे पास एक बहुत बड़ा डेटासेट है और लगभग 5% यादृच्छिक मूल्य गायब हैं। ये चर एक दूसरे के साथ सहसंबद्ध हैं। निम्नलिखित उदाहरण R डाटासेट केवल एक खिलौना उदाहरण है जिसमें डमी सहसंबद्ध डेटा है। set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
क्या इस निरंतर डेटा के लिए बूटस्ट्रैपिंग उचित है?
मैं एक पूरी नौसिखिया हूँ :) मैं लगभग 745,000 की आबादी से 10,000 के नमूने के आकार के साथ एक अध्ययन कर रहा हूं। प्रत्येक नमूना "प्रतिशत समानता" का प्रतिनिधित्व करता है। नमूनों में से अधिकांश 97% -98% के आसपास हैं, लेकिन कुछ 60% और 90% के बीच हैं, यानी …

1
बूटस्ट्रैप पद्धति। क्यों यादृच्छिक प्रतिस्थापन के बजाय "प्रतिस्थापन के साथ" फिर से तैयार करें?
बूटस्ट्रैप विधि ने पिछले वर्षों में एक महान प्रसार देखा है, मैं इसका उपयोग भी बहुत करता हूं, विशेष रूप से क्योंकि पीछे तर्क काफी सहज है। लेकिन यह एक बात है जो मुझे समझ नहीं आ रही है। Efron ने एकल टिप्पणियों को छोड़कर या बेतरतीब ढंग से हटाने …

1
गनी गुणांक और त्रुटि सीमा
मेरे पास प्रत्येक समय बिंदु पर एन = 14 गणनाओं के साथ डेटा की एक समय श्रृंखला है, और मैं प्रत्येक समय बिंदु पर इस अनुमान के लिए गनी गुणांक और एक मानक त्रुटि की गणना करना चाहता हूं। चूँकि मेरे पास प्रत्येक समय बिंदु पर केवल N = 14 …

4
फिर से तैयार किए गए डेटासेट पर परिकल्पना परीक्षण क्यों नल को अक्सर अस्वीकार करते हैं?
tl; dr: null के तहत जनरेट किए गए डेटासेट के साथ शुरू करके, मैंने मामलों को प्रतिस्थापन के साथ बदल दिया और प्रत्येक resamped डाटासेट पर एक परिकल्पना परीक्षण किया। ये परिकल्पना परीक्षण समय के 5% से अधिक को अस्वीकार करते हैं। नीचे, बहुत सरल सिमुलेशन में, मैं साथ डेटासेट …

2
क्या मुझे क्लस्टर स्तर या व्यक्तिगत स्तर पर बूटस्ट्रैप करना चाहिए?
मेरे पास अस्पतालों में निहित रोगियों के साथ एक अस्तित्व मॉडल है जिसमें अस्पतालों के लिए यादृच्छिक-प्रभाव शामिल है। यादृच्छिक प्रभाव गामा-वितरित है, और मैं इस शब्द की 'प्रासंगिकता' को उस पैमाने पर रिपोर्ट करने की कोशिश कर रहा हूं जो आसानी से समझ में आता है। मुझे निम्नलिखित संदर्भ …

2
पुनर्लेखन के लिए अच्छा पाठ?
क्या समूह लागू रेज़म्पलिंग तकनीकों के लिए एक अच्छा परिचय पाठ / संसाधन सुझा सकता है? विशेष रूप से, मैं समूहों की तुलना करने के लिए शास्त्रीय पैरामीट्रिक परीक्षणों (जैसे टी परीक्षण, एनोवा, एएनसीओवीए) के विकल्पों में दिलचस्पी रखता हूं, जब सामान्यता जैसी धारणाओं का स्पष्ट रूप से उल्लंघन होता …

1
कौन सा गहन शिक्षण मॉडल उन श्रेणियों को वर्गीकृत कर सकता है जो पारस्परिक रूप से अनन्य नहीं हैं
उदाहरण: मेरे पास नौकरी के विवरण में एक वाक्य है: "यूके में जावा वरिष्ठ इंजीनियर"। मैं इसे 2 श्रेणियों के रूप में भविष्यवाणी करने के लिए एक गहरे शिक्षण मॉडल का उपयोग करना चाहता हूं: English और IT jobs। यदि मैं पारंपरिक वर्गीकरण मॉडल का उपयोग करता हूं, तो यह …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
बूटस्ट्रैप नमूनों का आकार
मैं एक नमूना सांख्यिकीय के विचरण का अनुमान लगाने के साधन के रूप में बूटस्ट्रैपिंग के बारे में सीख रहा हूं। मुझे एक बुनियादी संदेह है। Http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf से उद्धरण : • हमें कितनी टिप्पणियों को फिर से भरना चाहिए? एक अच्छा सुझाव मूल नमूना आकार है। मूल नमूने में हम …

1
श्रेणीबद्ध चर के साथ ओवरलैपिंग
मैं अपने डेटासेट को दो समूहों में विभाजित लगभग 4000 ग्राहकों के साथ संतुलित करने के लिए ओवरसमलिंग और अंडरस्मीपलिंग के संयोजन का प्रदर्शन करना चाहूंगा, जहां समूहों में से एक का अनुपात लगभग 15% है। मैंने SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) और ROSE ( http://cran.r-project.org/web/packages/ROSE/ ) में देखा है ROSE.pdf …

1
क्या किसी डेटासेट के विचरण के लिए एक विश्वास अंतराल की गणना करने के लिए बूटस्ट्रैप का उपयोग किया जा सकता है?
मुझे पता है कि यदि आप कई बार सेट किए गए डेटा से पुनः नमूना लेते हैं और प्रत्येक बार माध्य की गणना करते हैं, तो ये साधन एक सामान्य वितरण (सीएलटी द्वारा) का पालन करेंगे। इस प्रकार, आप डेटा सेट की संभाव्यता वितरण पर कोई अनुमान लगाए बिना डेटा …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.