data-transformation पर टैग किए गए जवाब

गणितीय री-एक्सप्रेशन, अक्सर डेटा वैल्यूज़ के नॉनलाइनियर। डेटा अक्सर या तो एक सांख्यिकीय मॉडल की मान्यताओं को पूरा करने या विश्लेषण के परिणामों को अधिक व्याख्यात्मक बनाने के लिए बदल दिया जाता है।

12
मुझे शून्य सहित गैर-नकारात्मक डेटा को कैसे बदलना चाहिए?
यदि मेरे पास अत्यधिक सकारात्मक डेटा है तो मैं अक्सर लॉग लेता हूं। लेकिन मुझे अत्यधिक तिरछे गैर-नकारात्मक डेटा के साथ क्या करना चाहिए जिसमें शून्य शामिल हैं? मैंने दो परिवर्तन देखे हैं: log(x+1)लॉग इन करें⁡(एक्स+1)\log(x+1) जिसमें नीट फीचर है जो 0 मैप से 0 तक है। log(x+c)लॉग इन करें⁡(एक्स+सी)\log(x+c) …

9
R में समूह द्वारा डेटा का सारांश कैसे दिया जाए? [बन्द है]
मेरे पास इस तरह से आर डेटा फ्रेम है: age group 1 23.0883 1 2 25.8344 1 3 29.4648 1 4 32.7858 2 5 33.6372 1 6 34.9350 1 7 35.2115 2 8 35.2115 2 9 35.2115 2 10 36.7803 1 ... मुझे निम्नलिखित फ़ॉर्म में डेटा फ़्रेम प्राप्त करने …

2
आपको कब और क्यों एक वितरण (संख्याओं) का लॉग लेना चाहिए?
कहो कि मेरे पास कुछ ऐतिहासिक डेटा हैं, पिछले स्टॉक की कीमतें, एयरलाइन टिकट की कीमत में उतार-चढ़ाव, कंपनी के पिछले वित्तीय डेटा ... अब कोई (या कोई सूत्र) साथ आता है और कहता है "चलो वितरण के लॉग का उपयोग करें / उपयोग करें" और यहाँ मैं WHY कहाँ …

8
रैखिक प्रतिगमन में, वास्तविक मूल्यों के बजाय एक स्वतंत्र चर के लॉग का उपयोग करना कब उचित है?
क्या मैं प्रश्न में स्वतंत्र चर के लिए एक बेहतर व्यवहार किए गए वितरण की तलाश कर रहा हूं, या बाहर के प्रभाव को कम करने के लिए, या कुछ और?

1
गणना डेटा के लिए वर्गमूल परिवर्तन की सिफारिश क्यों की जाती है?
जब आप डेटा की गणना करते हैं तो अक्सर वर्गमूल लेने की सिफारिश की जाती है। (सीवी पर कुछ उदाहरणों के लिए, @ HarveyMotulsky का उत्तर यहां देखें , या @ व्हिबर का उत्तर यहां दें ।) दूसरी ओर, जब पॉइज़न के रूप में वितरित प्रतिक्रिया चर के साथ एक …

5
शून्य की लॉग लेने से बचने के लिए x को कितनी छोटी मात्रा में जोड़ा जाना चाहिए?
मैंने अपने डेटा का विश्लेषण किया है क्योंकि वे हैं। अब मैं सभी चर का लॉग लेने के बाद अपने विश्लेषणों को देखना चाहता हूं। कई चर में कई शून्य होते हैं। इसलिए मैं शून्य की लॉग लेने से बचने के लिए एक छोटी मात्रा जोड़ता हूं। अब तक मैंने …

8
क्या यह कभी स्पष्ट डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है?
असतत और निरंतर डेटा पर इस सवाल का जवाब देने में मैंने गौर किया कि यह शायद ही कभी डेटा को निरंतर के रूप में व्यवहार करने के लिए समझ में आता है। इसके चेहरे पर जो स्वयं स्पष्ट प्रतीत होता है, लेकिन अंतर्ज्ञान अक्सर आंकड़ों के लिए एक गरीब …

3
लॉग स्केल कब उपयुक्त हैं?
मैंने पढ़ा है कि चार्टिंग / ग्राफ़िंग का उपयोग करते समय चार्टिंग / ग्राफिंग कुछ परिस्थितियों में उचित होती है, जैसे कि समय श्रृंखला चार्ट में y- अक्ष। हालाँकि, मैं इस बारे में एक निश्चित स्पष्टीकरण नहीं पा सका हूँ कि ऐसा क्यों है, या जब यह उचित होगा। कृपया …

3
स्वतंत्र चर के लिए परिवर्तन जैसे बॉक्स-कॉक्स?
क्या स्वतंत्र चरों के लिए परिवर्तन जैसा एक बॉक्स-कॉक्स है? यही है, एक परिवर्तन जो चर का अनुकूलन करता है ताकि एक रैखिक मॉडल के लिए अधिक उचित फिट हो सके?xxxy~f(x) यदि हां, तो क्या इसके साथ कोई कार्य करना है R?

1
स्किकिट-सीख में एक-बनाम बनाम डमी एन्कोडिंग
श्रेणीबद्ध चर को एन्कोडिंग करने के दो अलग-अलग तरीके हैं। कहें, एक श्रेणीगत चर में n मान हैं। एक-हॉट एन्कोडिंग इसे n चरों में परिवर्तित करता है , जबकि डमी एन्कोडिंग इसे n-1 चरों में परिवर्तित करता है । यदि हमारे पास श्रेणीगत चर हैं, जिनमें से प्रत्येक में एन …

1
यदि प्रशिक्षण लक्ष्य है तो मानकीकरण / प्रशिक्षण और सामान्यीकरण कैसे लागू करें?
क्या मैं एक ही समय में अपने सभी डेटा या सिलवटों को बदल देता हूं (यदि CV लागू है)? जैसे (allData - mean(allData)) / sd(allData) क्या मैं ट्रेनसेट और टेस्टसेट को अलग-अलग करूंगा? जैसे (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) या क्या मैं ट्रेनसेट को बदल …

3
लॉग ट्रांसफ़ॉर्म किए गए पूर्वानुमान और / या प्रतिक्रिया की व्याख्या
मुझे आश्चर्य हो रहा है कि क्या यह व्याख्या में फर्क करता है कि क्या केवल आश्रित, आश्रित और स्वतंत्र, या केवल स्वतंत्र चर ही रूपांतरित हैं। के मामले पर विचार करें log(DV) = Intercept + B1*IV + Error मैं IV की व्याख्या प्रतिशत वृद्धि के रूप में कर सकता …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
सामान्यीकरण बनाम स्केलिंग
डेटा 'सामान्यीकरण' और डेटा 'स्केलिंग' के बीच अंतर क्या है? अब तक मुझे लगा था कि दोनों शब्द एक ही प्रक्रिया को संदर्भित करते हैं, लेकिन अब मुझे एहसास हुआ कि कुछ और है जो मुझे नहीं पता / समझ नहीं है। इसके अलावा अगर सामान्यीकरण और स्केलिंग के बीच …

1
प्रतिगमन: परिवर्तनशील चर
परिवर्तनशील चर बनाते समय, क्या आपको एक ही परिवर्तन का उपयोग करना होगा? उदाहरण के लिए, क्या मैं अलग-अलग रूपांतरित चर चुन सकता हूं, जैसे: आज्ञा देना, आयु, रोजगार की लंबाई, निवास की लंबाई और आय।x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) या, क्या आपको अपने परिवर्तनों के अनुरूप …

1
विषम डेटा के लिए एक तरफ़ा एनोवा के विकल्प
मेरे पास शैवाल बायोमास ( , , ) के 3 समूहों के डेटा हैं जिनमें असमान नमूना आकार ( , , ) हैं और मैं तुलना करना चाहूंगा कि क्या ये समूह एक ही आबादी के हैं।बी सी एन ए = 15 एन बी = 13 एन सी = 12AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.