eda पर टैग किए गए जवाब

EDA का अर्थ है "खोजपूर्ण डेटा विश्लेषण"। Tukey द्वारा पुष्टिकारक डेटा विश्लेषण या CDA (परिकल्पना का औपचारिक परीक्षण) के साथ इसके विपरीत विकसित किया गया। EDA आमतौर पर डेटा को समझने और नई अंतर्दृष्टि प्राप्त करने के लिए डेटा को आसान बनाने के लिए संख्यात्मक और ग्राफिक रूप से वर्णन करने से संबंधित है।

5
क्या प्रशिक्षण डेटासेट पर केवल खोजपूर्ण डेटा विश्लेषण करना बेहतर है?
मैं डेटासेट पर खोजपूर्ण डेटा विश्लेषण (EDA) कर रहा हूं। फिर मैं एक आश्रित चर की भविष्यवाणी करने के लिए कुछ सुविधाओं का चयन करूंगा। सवाल यह है कि क्या मुझे अपने प्रशिक्षण डेटासेट पर EDA करना चाहिए? या क्या मुझे प्रशिक्षण और परीक्षण डेटासेट में शामिल होना चाहिए, फिर …

2
क्या ईएएस में बायेसियन और अक्सरवादी दृष्टिकोण में अंतर हैं?
बहुत सीधे शब्दों में कहें: खोज डेटा विश्लेषण के लिए बायेसियन और फ़्रीक्वेंटिस्ट दृष्टिकोण में कोई अंतर हैं? मैं ईडीए के तरीकों में निहित निहित गैसों के बारे में नहीं जानता क्योंकि हिस्टोग्राम एक हिस्टोग्राम है, स्कैटरप्लॉट एक स्कैप्लेटोट है, आदि, और न ही मैंने ईएआरए को सिखाया या प्रस्तुत …

3
फ्लोचार्ट उचित विश्लेषण तकनीक और परीक्षण का चयन करने में मदद करने के लिए
जैसा कि किसी को सांख्यिकीय ज्ञान की आवश्यकता है, लेकिन औपचारिक रूप से प्रशिक्षित सांख्यिकीविद् नहीं है, मुझे एक विशेष समस्या को हल करने के लिए सही दृष्टिकोण का चयन करने में मेरी मदद करने के लिए एक फ़्लोचार्ट (या किसी प्रकार का निर्णय वृक्ष) का उपयोग करना उपयोगी होगा। …

6
चर के बीच संबंधों की पहचान के लिए आर पैकेज [बंद]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 4 साल पहले बंद हुआ । क्या कोई आर पैकेज है जिसे मैं …

4
डेटा एकत्र करने और विश्लेषण करने के सर्वोत्तम तरीके
अभी हाल ही में खुद को सिखाना शुरू किया मशीन लर्निंग और डेटा एनालिसिस मैं खुद को डेटा के बड़े सेट बनाने और क्वेरी करने के लिए एक ईंट की दीवार पर मार रहा हूं। मैं अपने पेशेवर और व्यक्तिगत जीवन में डेटा एकत्र करना चाहूंगा और उसका विश्लेषण करूंगा …

2
निर्माण स्वतंत्रता का निर्धारण करने में खोजपूर्ण और पुष्टि कारक विश्लेषण के बीच अंतर
शोधकर्ता अक्सर दो उपायों का उपयोग करते हैं जिनमें समान आइटम होते हैं और तर्क देते हैं कि वे विभिन्न चीजों को मापते हैं (उदाहरण के लिए, "मैं हमेशा चिंता करता हूं जब मैं कारों के आसपास हूं"; "मुझे कारों से डर लगता है")। कारों के उपाय और ऑटोमोबाइल स्केल …

2
यदि मेरा हिस्टोग्राम घंटी के आकार का वक्र दिखाता है, तो क्या मैं कह सकता हूं कि मेरा डेटा सामान्य रूप से वितरित किया गया है?
मैंने रिस्पोंडेंट एज के लिए एक हिस्टोग्राम बनाया और एक बहुत अच्छा घंटी के आकार का वक्र प्राप्त करने में कामयाब रहा, जिससे मैंने निष्कर्ष निकाला कि वितरण सामान्य है। फिर मैंने n = 169 के साथ SPSS में सामान्यता परीक्षण चलाया । कोलमोगोरोव-स्मिरनोव परीक्षण का p -value (Sig) 0.05 …

1
नोट किए गए बॉक्स भूखंडों की व्याख्या कैसे करें
कुछ EDA करते समय मैंने एक कारक के दो स्तरों के बीच के अंतर को दर्शाने के लिए एक बॉक्स प्लॉट का उपयोग करने का निर्णय लिया। जिस तरह से ggplot ने बॉक्स प्लॉट को प्रस्तुत किया वह संतोषजनक था, लेकिन थोड़ा सरल (नीचे पहला प्लॉट)। जबकि बॉक्स भूखंडों की …

2
"डेटा को स्वयं बोलने दें" इसका क्या उद्देश्य है?
निम्नलिखित पत्र पढ़ने में , मैं निम्नलिखित कथन पर आया: जैसा कि उल्लेख किया गया है, यह प्रायः बेंज़ेक्री [1973] के विचार के अनुसार, संभाव्य मॉडल के संदर्भ के बिना प्रस्तुत किया जाता है, "डेटा को स्वयं के लिए बोलने दें।" (उद्धरण जेपी बेंज़रेक से है। लेनिअलसे डेस डोनेस। टोम …
10 eda  quotation 

3
डेटासेट पर पहली त्वरित नज़र
कृपया मेरी अज्ञानता को क्षमा करें, लेकिन ... मैं खुद को एक स्थिति में पाता रहता हूं, जहां मुझे नए डेटा का एक गुच्छा मिला है, जिसे मैं खोजने में कामयाब रहा। यह डेटा आमतौर पर कुछ इस तरह दिखता है: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog …

4
सांख्यिकीय मॉडलिंग के साथ आरंभ करने के लिए टिप्स और ट्रिक्स?
मैं डेटा माइनिंग के क्षेत्र में काम करता हूं और आंकड़ों में बहुत कम औपचारिक स्कूली शिक्षा मिली है। हाल ही में मैंने बहुत से काम पढ़े हैं जो सीखने और खनन के लिए बायेसियन प्रतिमानों पर केंद्रित हैं, जो मुझे बहुत दिलचस्प लगते हैं। मेरा सवाल है (कई हिस्सों …

4
यह तथ्य क्यों नहीं है कि 1 मंझला दूसरे माध्यिका से कम है, इसका मतलब है कि समूह 1 में अधिकांश समूह 2 में सबसे कम हैं?
मेरा मानना ​​था कि नीचे दिए गए बॉक्सप्लॉट्स की व्याख्या "अधिकांश पुरुष अधिकांश महिलाओं की तुलना में तेज़ हैं" (इस डेटासेट में), मुख्यतः क्योंकि औसत पुरुषों का समय औसत महिलाओं के समय से कम था। लेकिन R और सांख्यिकी प्रश्नोत्तरी पर EdX पाठ्यक्रम ने मुझे बताया कि गलत है। कृपया …

2
मिश्रित मॉडल के लिए पैरामीट्रिक, सेमीपैरेट्रिक और नॉनपैमेट्रिक बूटस्ट्रैपिंग
निम्नलिखित आलेख इस लेख से लिए गए हैं । मैं बूटस्ट्रैप करने के लिए नौसिखिया हूं और R bootपैकेज के साथ रैखिक मिश्रित मॉडल के लिए पैरामीट्रिक, सेमीपैरेट्रिक और नॉनपैमेट्रिक बूटस्ट्रैपिंग बूटस्ट्रैपिंग को लागू करने की कोशिश कर रहा हूं । आर कोड यहाँ मेरा Rकोड है: library(SASmixed) library(lme4) library(boot) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
डेटा में नए ज्ञान की खोज के लिए दिशानिर्देश
मैं खुद को या किसी और को एक बिंदु बनाने के लिए कुछ साजिश करता हूं। आमतौर पर, एक प्रश्न इस प्रक्रिया को शुरू करता है, और अक्सर व्यक्ति एक विशेष उत्तर की उम्मीद करता है। मैं कम पक्षपाती तरीके से डेटा के बारे में दिलचस्प चीजें कैसे सीख सकता …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.