डेटा विज़ुअलाइज़ेशन उदाहरण, शिक्षण और अनुसंधान के लिए डेटासेट


9

मैं मौजूदा डेटासेट की खोज कर रहा हूं जिसका उपयोग हम कई डेटाविस तकनीकों का परीक्षण करने के लिए कर सकते हैं जो हम शोध कर रहे हैं।

मैं कई संसाधनों को जानता हूं जैसे कि आर में शामिल हैं ( यहां देखेंplot(Orange) या देखें )।

लेकिन मैं इसे एक कदम आगे ले जाना चाहूंगा:

  • विज़ुअलाइज़ेशन टूल का परीक्षण करने के लिए सर्वश्रेष्ठ वास्तविक दुनिया के डेटासेट कौन से हैं?
  • डेटाविस के बारे में आपने अकादमिक पेपर या शिक्षण स्लाइड में कौन से डेटासेट का उपयोग किया है?
  • रेखांकन के फायदे दिखाने के लिए वास्तविक दुनिया से सबसे अच्छा उदाहरण कौन सा है?

2
कई अच्छे वास्तविक दुनिया के उदाहरण, डेटा सेट प्रदान करने वाले कुछ लिंक्ड प्रोजेक्ट्स के साथ (लेकिन सबसे अधिक दुर्भाग्य से): infosthetics.com
WSkid

1
क्या आप स्पष्ट रूप से मुफ्त डेटा सेट की तलाश कर रहे हैं ?
फोमाइट

3
विज़ुअलाइज़ेशन संदर्भ और दर्शकों (अन्य चीजों के बीच) पर निर्भर करता है, यह सुझाव देता है कि "सर्वश्रेष्ठ" इस संदर्भ में अस्पष्ट है। आप और अधिक ध्यान केंद्रित कर सकते हैं, जो कि आपके द्वारा शोध की जा रही "तकनीकों" का संकेत देकर प्रासंगिक उत्तर देता है।
whuber

1
@ शुभ तकनीक, दृश्य के स्वचालितकरण के बारे में। सबसे अच्छा, समझाने के लिए। सर्वश्रेष्ठ, बेंचमार्क के लिए।
रोज़बोरेल्स

@EpiGrad हाँ, यथासंभव मुफ्त।
रोज़बोरेल्स

जवाबों:


5

इंटरनेट पर बड़ी संख्या में डेटाबेस उपलब्ध हैं। विषय के आधार पर, आप विभिन्न स्रोत प्राप्त कर सकते हैं।

उदाहरण के लिए, मानव विकास विषय क्षेत्र में आपके पास (http://hdrstats.undp.org/) पर डेटा स्रोत हो सकते हैं:

http://hdrstats.undp.org/en/tables/default.html

जलवायु परिवर्तन अवलोकन के लिए, उदाहरण के लिए उच्च रिज़ॉल्यूशन जलवायु डेटा (http://www.ipcc-data.org/) के साथ एक वेब है:

http://www.ipcc-data.org/obs/cru_ts2_1.html

दोनों उदाहरणों में, वास्तविक डेटा शामिल है, जो बड़ी मात्रा में डेटा के साथ प्रकाशित वैज्ञानिक पत्रों में उपयोग किया जाता है। समय संबंधी और / या अंतरिक्ष संबंधी डेटा। उन डेटा की विज़ुअलाइज़ेशन संभावनाएं अनंत हैं।


इन शानदार स्रोतों में से कौन सा संभव डेटासेट आपको सबसे अच्छा लगता है? धन्यवाद
robermorales

1
यह दृश्य के "स्वाद" के लिए उपयुक्तता पर निर्भर करता है। उदाहरण के लिए, IPCC वेब श्रृंखला का पता लगाने / दिखाने के लिए पर्याप्त डेटा है और व्यापक रूप से उपयोग किया जाता है (जाहिर है कि जलवायु परिवर्तन का विश्लेषण करने के लिए), स्थानिक डेटा दिखाने के लिए मानव विकास वेबसाइट में बहुत सारे अंतरिक्ष से संबंधित डेटा के साथ-साथ डेटा से संबंधित है समय।
जोस जुबकॉफ़

आपका पहला लिंक टूट गया है (DNS त्रुटि)।
भयावह

दुर्भाग्य से पहला लिंक टूट गया है (5 साल बाद), लेकिन वहाँ बहुत से खुले डेटा हैं: kaggle.com/datasets data.okfn.org/data data.gov data.europa.eu/euodp/en/nata
जोस जुबॉफ 16

9

मैं regcomions करते समय साजिश रचने के महत्व को दिखाने के लिए Anscombe डेटा सेट (आर में भी उपलब्ध) का उपयोग करना पसंद करता हूं । यदि आप परिचित नहीं हैं, तो आपको सभी चार डेटा सेटों से समान प्रतिगमन लाइन और डायग्नोस्टिक्स मिलते हैं, भले ही सेट खुद सभी काफी अलग दिखते हों। आप नीचे दिए गए भूखंडों को ले सकते हैं और उन्हें उन अवशिष्ट भूखंडों में बदल सकते हैं, जो उन समस्याओं का चित्रण करने के लिए हैं जिन्हें आप प्रतिगमन करने के बाद अवशेषों में देख सकते हैं।

Anscombe डेटा सेट


हाँ, हमें पता था कि डेटासेट। यह एक अच्छा शुरुआती बिंदु है।
18 फरवरी को robermorales

मुख्य समस्या यह है कि यह वास्तविक दुनिया का डेटासेट नहीं है।
राजपरिवार

3
@robermorales, काफी साफ है, लेकिन मुझे लगता है कि समस्या के "शुद्ध" संस्करण को देखने से संदेशवाहक, वास्तविक दुनिया के विज़ुअलाइज़ेशन / समस्याओं को समझना आसान हो जाता है।
चार्ली

6

रेखांकन के फायदे दिखाने के लिए वास्तविक दुनिया से सबसे अच्छा उदाहरण कौन सा है?

कोई भी बड़ी मेज। उदाहरण के लिए, "आधिकारिक जनगणना तालिका" की Google छवियां। आप नीचे दी गई चीजों को देखेंगे ।

इसके अलावा गेलमैन एट अल को देखें। (2002) आइए प्रैक्टिस व्हाट वी प्रेज़: टर्बिंग टर्ब इन ग्राफ्स। अमेरिकी सांख्यिकीविद् 56: 121-130

विशाल जटिल तालिका


अच्छा सुझाव! हम रेफरी नहीं जानते।
रोबरमोरेल्स

4

विलियम एस। क्लीवलैंड में ग्राफिक्स के महान उपयोग से भरी दो पुस्तकें हैं, और डेटा और कोड को विज़ुअलाइज़िंग डेटा में ग्राफ बनाने के लिए अपनी वेबसाइट पर है


क्लीवलैंड के कौन से डेटासेट आपको अधिक पसंद हैं? धन्यवाद
robermorales

1
@robertomorales मुझे लगता है कि वे अपने उद्देश्यों के लिए अच्छी तरह से चुने गए हैं। सांख्यिकीय ग्राफिक्स में रुचि रखने वाले किसी भी व्यक्ति को क्लीवलैंड का ध्यानपूर्वक अध्ययन करना चाहिए।
पीटर Flom

1
विज़ुअलाइज़िंग डेटा का डेटा lib.stat.cmu.edu/datasets/visualizing.data.zip पर पाया जा सकता है। मैं अब उन्हें क्लीवलैंड की अपनी वेबसाइट पर नहीं ढूंढ सकता।
निक कॉक्स

4

संभवतः आप पहले से ही इन के बारे में जानते हैं, लेकिन यहाँ वे वैसे भी हैं:

यूसीआई मशीन लर्निंग Repositor y कई सार्वजनिक रूप से सुलभ, असली दुनिया डेटा सेट हैं।

अमेरिकी सरकार अपने कई डेटासेट को data.gov पर सार्वजनिक करती है ।

यदि आप कुछ मुश्किल दृश्य डेटा चाहते हैं, तो मेरा सुझाव है कि आप एक वर्गीकरण कार्य देख रहे हैं। मुझे लगता है कि यूसीआई एमएलआर पर सेट किए गए शब्दों के थैले में कुछ अच्छे गुण हैं, लेकिन मुझे गलत किया जा सकता है (जब से मैंने इसका इस्तेमाल किया था, तब से)।


धन्यवाद! वहाँ एक हैं बहुत कुछ !
रोज़बोरेल्स

3

यहाँ कुछ है।

Sci2 टूल नमूना डेटासेट
http://wiki.cns.iu.edu/display/SCI2TUTORIAL/2.5+Sample+Datasets
नमूना डेटासेट जो Sci2 टूल के साथ बंडल किए जाते हैं।

झांकी नमूना डेटा सेट
https://public.tableau.com/s/resources?qt-overview_resources=1#qt-overview_resources
नमूना डेटा झांकी के साथ आरंभ करने के लिए सेट करता है।

विस्मयकारी सार्वजनिक डेटासेट
https://github.com/caesar0301/awesome-public-datasets/blob/master/README.rst
यह सार्वजनिक डेटा स्रोतों की सूची एकत्र की जाती है और ब्लॉग, उत्तर और उपयोगकर्ता प्रतिक्रियाओं से ख़बर ली जाती है। अधिकांश डेटा सेट मुफ्त हैं, कुछ नहीं हैं।

यह धागा बल्कि पुराना है, उम्मीद है कि इस टक्कर से कुछ नया योगदान मिलेगा!


2

मैंने यहाँ डेटासेट्स का भार देखा है:

http://www.inside-r.org/howto/finding-data-internet

पता नहीं कि क्या इसका कोई उपयोग है?

मुझे डर है कि मैं विज़ुअलाइज़ेशन नहीं सिखाता हूं इसलिए मैं आपके विशिष्ट प्रश्नों पर टिप्पणी नहीं कर सकता।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.