sampling पर टैग किए गए जवाब

एक संभावित वितरण और / या एक निर्दिष्ट वितरण से यादृच्छिक संख्या का उपयोग करके अच्छी तरह से निर्दिष्ट आबादी से नमूने बनाना। जैसा कि यह टैग अस्पष्ट है, कृपया पूर्व के लिए [सर्वेक्षण-नमूनाकरण] और बाद के लिए [मोंटे-कार्लो] या [सिमुलेशन] पर विचार करें। ज्ञात वितरण से यादृच्छिक नमूने बनाने के बारे में प्रश्नों के लिए, कृपया [यादृच्छिक-पीढ़ी] टैग का उपयोग करने पर विचार करें।

3
क्लस्टर बिग डेटा आर में और नमूना प्रासंगिक है?
मैं डेटा साइंस में नया हूं और 200,000 पंक्तियों और 50 कॉलमों वाले डेटा सेट में क्लस्टर खोजने में समस्या है। चूँकि डेटा में संख्यात्मक और नाममात्र दोनों चर होते हैं, इसलिए K-Mean जैसे तरीके जो यूक्लिडियन दूरी माप का उपयोग करते हैं, एक उपयुक्त विकल्प नहीं लगता है। इसलिए …

3
पुनरावलोकन टिप्पणियों की संख्या द्वारा नमूना की जा रही जनसंख्या के आकार का अनुमान लगाएं
कहो कि मेरे पास 50 मिलियन अद्वितीय चीजें हैं, और मैं 10 मिलियन नमूने लेता हूं (प्रतिस्थापन के साथ) ... मैंने जो पहला ग्राफ संलग्न किया है वह दिखाता है कि मैं कितनी बार उसी "नमूना" का नमूना लेता हूं, जो अपेक्षाकृत दुर्लभ है जनसंख्या मेरे नमूने से बड़ी है। …

1
हैलट अनुक्रम बनाम सोबोल अनुक्रम?
पिछले प्रश्न में एक उत्तर से , मुझे वैराग्य अनुक्रम की ओर निर्देशित किया गया था, वैक्टर का एक सेट बनाने के लिए जिसने समान रूप से एक समान नमूना स्थान को कवर किया। लेकिन विकिपीडिया पृष्ठ में उल्लेख किया गया है कि उच्चतर प्राइमर विशेष रूप से श्रृंखला में …

5
यह क्यों दावा किया जाता है कि एक नमूना अक्सर एक जनगणना की तुलना में अधिक सटीक होता है?
नमूना लेने के दौरान, मैं निम्नलिखित दो कथनों को पूरा करता हूं: 1) नमूनाकरण त्रुटि ज्यादातर परिवर्तनशीलता की ओर ले जाती है, nonsampling त्रुटियां पूर्वाग्रह की ओर ले जाती हैं। 2) nonsampling त्रुटि के कारण, एक नमूना अक्सर CENSUS की तुलना में अधिक सटीक होता है। मैं नहीं जानता कि …

4
व्यावहारिक अनुप्रयोग में प्रतिस्थापन के बिना नमूने पर विचार क्यों करें?
प्रतिस्थापन के साथ नमूने के नमूने पर प्रतिस्थापन के बिना दो फायदे हैं जैसे कि मैं इसे देखता हूं: 1) आपको परिमित जनसंख्या सुधार के बारे में चिंता करने की आवश्यकता नहीं है। 2) एक मौका है कि आबादी से तत्वों को कई बार खींचा जाता है - फिर आप …

3
क्रमपरिवर्तन दोहराए बिना आर में कैसे फिर से भरना है?
आर में, यदि मैं सेट करता हूं (), और फिर किसी सूची को यादृच्छिक बनाने के लिए नमूना फ़ंक्शन का उपयोग करता हूं, तो क्या मैं गारंटी दे सकता हूं कि मैं एक ही क्रमपरिवर्तन उत्पन्न नहीं करूंगा? अर्थात... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) …

3
क्यों कई (यदि सभी नहीं) पैरामीट्रिक परिकल्पना परीक्षण यादृच्छिक नमूने मान लेते हैं?
Z, t, और कई अन्य जैसे टेस्ट यह मानते हैं कि डेटा यादृच्छिक नमूने पर आधारित है। क्यों? मान लीजिए कि मैं प्रायोगिक अनुसंधान कर रहा हूं, जहां मैं बाहरी की तुलना में आंतरिक वैधता के लिए बहुत अधिक देखभाल करता हूं। इसलिए, अगर मेरा नमूना थोड़ा सा पक्षपाती हो …

2
यदि हमारे रैंडम वैरिएबल के मानों की सीमा तो हम रूप में एक सामान्य वितरण कैसे प्राप्त कर सकते हैं ?
चलो कहते हैं कि हम से घिरा मानों की एक श्रेणी के साथ एक यादृच्छिक चर है और , जहां न्यूनतम मूल्य और है अधिकतम मूल्य।b a baaabbbaaabbb मुझे बताया गया था कि , जहाँ हमारा नमूना आकार है, हमारे नमूना साधनों का नमूना वितरण एक सामान्य वितरण है। यही …

3
निर्धारित करें कि यदि एक भारी पूंछ वितरित प्रक्रिया में काफी सुधार हुआ है
मैं यह जानने के लिए कि परिवर्तन से पहले प्रक्रिया में सुधार हुआ है या नहीं, किसी प्रक्रिया के प्रसंस्करण समय का निरीक्षण करें। यदि प्रसंस्करण समय कम हो जाता है, तो प्रक्रिया में सुधार हुआ है। प्रसंस्करण समय का वितरण वसा युक्त है, इसलिए औसत के आधार पर तुलना …

1
PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में
नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
एक्स (एक्स) ~ गामा अगर एक्स का जल्दी से नमूना कैसे लें?
मेरे पास एक साधारण नमूना समस्या है, जहां मेरा आंतरिक लूप दिखता है: v = sample_gamma(k, a) जहां sample_gammaगामा वितरण से नमूने एक डिरिचलेट नमूना बनाने के लिए। यह अच्छी तरह से काम करता है, लेकिन k / a के कुछ मूल्यों के लिए, बहाव के कुछ संगणना को कम …

1
केंद्रीय सीमा प्रमेय एक नमूने के साथ क्यों काम करता है?
मुझे हमेशा सिखाया गया है कि सीएलटी काम करता है जब आपने नमूना दोहराया है, प्रत्येक नमूना काफी बड़ा है। उदाहरण के लिए, कल्पना कीजिए कि मेरे पास 1,000,000 नागरिकों का देश है। सीएलटी के बारे में मेरी समझ यह है कि भले ही उनकी ऊंचाइयों का वितरण सामान्य नहीं …

2
MCMC तरीके - जलते हुए नमूने?
में एमसीएमसी के तरीकों, मैं के बारे में पढ़ते रहते burn-inसमय या करने के लिए नमूनों की संख्या "burn"। यह वास्तव में क्या है, और इसकी आवश्यकता क्यों है? अपडेट करें: एक बार MCMC स्थिर हो जाने के बाद क्या यह स्थिर रहता है? burn-inमिश्रण समय से संबंधित समय की …
12 sampling  mcmc 

1
महत्व के नमूने के सहज उदाहरण
मेरा बैकग्राउंड कंप्यूटर साइंस है। मैं मोंटे कार्लो नमूना लेने के तरीकों में काफी नया हूं और यद्यपि मैं गणित को समझता हूं, मेरे पास महत्वपूर्ण नमूनाकरण के लिए सहज ज्ञान युक्त उदाहरण हैं। अधिक सटीक रूप से, कोई इसका उदाहरण प्रदान कर सकता है: एक मूल वितरण से एक …

1
सशर्त वितरण का उपयोग करके सीमांत वितरण से नमूनाकरण?
मैं एक univariate घनत्व से नमूना लेना चाहता लेकिन मैं केवल संबंध जानता हूं:चएक्सfXf_X चएक्स( x ) = ∫चएक्स| Y( x | y) चY( y) dy।fX(x)=∫fX|Y(x|y)fY(y)dy.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. मैं MCMC (सीधे अभिन्न प्रतिनिधित्व पर) के उपयोग से बचना चाहता हूं और, चूंकि और से नमूना लेना …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.