सांख्यिकीय ग्राफिक्स के लिए एक "हैलो, दुनिया" है?


25

कंप्यूटर प्रोग्रामिंग में, एक नई भाषा या प्रणाली सीखने / सिखाने के लिए एक क्लासिक पहला कार्यक्रम है, जिसे "हैलो, वर्ल्ड" कहा जाता है। http://en.wikipedia.org/wiki/Hello_world_program

क्या रेखांकन पैकेज का उपयोग करने के लिए एक क्लासिक पहला डेटा दृश्य है? यदि ऐसा है, तो ये क्या है? और यदि नहीं, तो अच्छे उम्मीदवार क्या होंगे?


3
हमारी साइट पर आपका स्वागत है! हमारा फ़ेक यह पूछता है कि "आपको वास्तविक समस्याओं के आधार पर केवल व्यावहारिक, उत्तर देने योग्य प्रश्न ही पूछने चाहिए।" क्या आप बता सकते हैं कि आपकी वास्तविक समस्या क्या है?
whuber

3
मैं सांख्यिकीय ग्राफिक्स के लिए "मानक परीक्षण आइटम" की पहचान करना चाहूंगा, अगर कोई मौजूद है, तो प्रशिक्षण सामग्री में शामिल करने के लिए जो मैं विकसित कर रहा हूं।
अब्राहम डी फ्लैक्समैन

2
क्योंकि चित्रमय अनुप्रयोग इतने व्यापक रूप से भिन्न होते हैं, इसलिए कुछ मानक या सार्वभौमिक ग्राफिक की कल्पना करना कठिन है। वहाँ रहे हैं इस तरह के ऐतिहासिक दृष्टि से प्रसिद्ध खरगोशों और 3 डी ग्राफिक्स के लिए teapots के रूप में उसका ग्राफ़ संकुल के कुछ प्रकार, के लिए कुछ मानकों। आपके प्रश्न का उत्तर देने योग्य होने के लिए, फिर, इसके लिए यह अधिक विशिष्ट होने में मदद करेगा कि आपके प्रशिक्षण सामग्री को किस पैकेज के लिए कवर करना है।
whuber

1
अच्छी बात है, धन्यवाद। मैं R, STATA, पायथन और जावास्क्रिप्ट में सांख्यिकीय ग्राफिक्स के बारे में कम से कम कुछ शामिल करूंगा।
अब्राहम डी फ्लैक्समैन

@AbrahamDFlaxman मैं इस "प्रशिक्षण सामग्री" के बारे में उत्सुक हूं और इसके लिए कौन और क्या इरादा है। आप और कह सकते हैं?
पीटर Flom - को पुनः स्थापित मोनिका

जवाबों:


9

दो विचार:

A. जब मैं "हैलो वर्ल्ड" के सार को प्राप्त करने की कोशिश करता हूं, तो यह न्यूनतम है कि प्रोग्रामिंग भाषा में एक मान्य प्रोग्राम उत्पन्न करने के लिए किया जाना चाहिए जो पाठ की एक पंक्ति को प्रिंट करता है। यह मुझे सुझाव देता है कि आपका "हैलो वर्ल्ड" एक अविभाज्य डेटा सेट होना चाहिए, सबसे बुनियादी चीज जिसे आप सांख्यिकीय या ग्राफिक्स प्रोग्राम में प्लग कर सकते हैं।

B. मैं किसी भी रेखांकन "हैलो वर्ल्ड" से अनजान हूँ। निकटतम मैं आ सकता है विशिष्ट डेटासेट जो विभिन्न सांख्यिकीय पैकेजों में शामिल हैं, जैसे कि आर के हवाई यात्री। आर में, एक हैलो वर्ल्ड ग्राफिंग स्टेटमेंट होगा:

plot (AirPassengers)  # Base graphics, prints line graph

या

qplot (AirPassengers) # ggplot2, prints a bar chart

या

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

व्यक्तिगत रूप से, मुझे लगता है कि सबसे सरल ग्राफ एक रेखा ग्राफ है जहां आपके पास Y और X में 1: N से आइटम हैं। लेकिन यह एक मानक नहीं है।


1
इस और अन्य उत्तरों से आम सहमति यह है कि वर्तमान में सांख्यिकीय ग्राफिक्स का "हैलो, वर्ल्ड" नहीं है। मुझे लगता है कि आपका एक यूनीवेट डेटासेट का सुझाव, जिसमें एन और वाई में आइटम 1: एन से हैं, सम्मोहक है। "हेल्लो, वर्ल्ड" के अनुरूप में, एक छोटा सा N, और यादगार Y होना अच्छा होगा। आप N = 5 और Y = (3,1,4,1,5,9) के बारे में क्या सोचते हैं (यानी पाई के अंक)? हो सकता है कि वह बहुत ज्यादा मैथी हो।
अब्राहम डी फ्लैक्समैन

1
@AbrahamDFlaxman: मुझे नहीं लगता कि यह मैथी है, मुझे लगता है कि यह बहुत अच्छा है। यादगार, छोटा और ग्राफ सिर्फ एक सीधी रेखा या कुछ भी नहीं है। डेटा की अच्छी तरह से जाना जाता है और किसी विशेष कार्यक्रम से बंधा नहीं है, और अधिक अंक चाहने वाले किसी भी व्यक्ति द्वारा मनमाने ढंग से बढ़ाया जा सकता है। मैं इसके लिए मतदान करता हूँ!
वेन

24

मैं शायद स्कैटरप्लॉट्स और डिस्प्ले के साथ शुरू करूंगा चार बदसूरत सहसंबंधों को


2
+1। लेकिन आप कुछ सामान्य पर विचार करना चाह सकते हैं, जैसे कि लाइन प्लॉट के कुछ रूप। आखिरकार, जैसे ही आप एक पंक्ति खंड खींच सकते हैं, आप कुछ भी आकर्षित कर सकते हैं । यह "हैलो, दुनिया!" के पीछे के विचार को गूँजता है: एक बार जब आप एक प्रोग्राम से पठनीय आउटपुट प्राप्त कर सकते हैं, तो आप जानते हैं कि आप कंप्यूटर के साथ संवाद कर सकते हैं और बाकी सिर्फ विवरण :-) है। (विवरण कठिन हो सकता है । आईबीएम 360 मेनफ्रेम के लिए असेंबली कोड लिखना सीखते समय, आउटपुट प्राप्त करने का सबसे सरल तरीका यह था कि इसे रैम में स्टोर करें और निष्पादन के अंत में एक त्रुटि बनाएं, जिससे सिस्टम एक हेक्साडेसिमल कोर डंप को प्रिंट कर सके। !)
whuber

मुझे लगता है कि कुल मिलाकर Anscombe की चौकड़ी में सांख्यिकीय ग्राफिक्स के "हैलो, वर्ल्ड" के रूप में उपयोग किए जाने वाले बहुत अधिक हैं, लेकिन उनके पेपर से चित्र 1 एक अच्छा उम्मीदवार हो सकता है। अन्य उत्तरों ने मामले को एक अविभाज्य डेटा सेट के लिए बनाया है, हालाँकि, मैं इसके लिए झुक रहा हूं।
अब्राहम डी फ्लैक्समैन 22

7

एक सामान्य रूप से वितरित यादृच्छिक चर के नमूने का हिस्टोग्राम।


मुझे यह पसंद है जिस तरह से यह दिखेगा, लेकिन शायद हिस्टोग्राम को स्कैटर की तुलना में अधिक डेटा प्रोसेसिंग की आवश्यकता होती है, और सामान्य वितरण से नमूनों के साथ आने से ध्यान भंग हो सकता है।
अब्राहम डी फ्लैक्समैन 23

मैंने अभी देखा कि यह Matplotlib वेब पेज से पहला उदाहरण है: matplotlib.org
अब्राहम डी फ्लैक्समैन

5

मेरा मानना ​​है कि उत्तर नहीं है"। यही है, आपके प्रश्न के उत्तर पर आम तौर पर सहमत नहीं है।

@StasK स्कैप्लेट को इंगित करता है।

लेकिन मुझे लगता है कि क्या plotकरता है R: यह डेटा पर निर्भर करता है!

आप यह तर्क दे सकते हैं कि अविभाज्य आँकड़े बिवरिएट की तुलना में सरल होते हैं। तो ... शायद सबसे बुनियादी बात एक हिस्टोग्राम है; या शायद एक बार साजिश; शायद एक घनत्व साजिश।

अगर "हैलो, वर्ल्ड!" यह दिखाना है कि आप कंप्यूटर को कुछ कर सकते हैं तो मैं कहूंगा कि कोई भी साजिश करेगा।


1
शायद एक मानक परीक्षण आइटम की अनुपस्थिति यह इंगित करती है कि आप सही हैं, और सिस्टम में जो कुछ भी प्रदर्शित किया जा रहा है उसमें सबसे सरल है इसका उपयोग करना अधिक उपयुक्त है। हालांकि, इसकी तुलना करना कठिन है।
अब्राहम डी फ्लैक्समैन

5

सुनिश्चित नहीं है कि यह वास्तव में एक हैलो दुनिया के रूप में योग्य है, लेकिन आर में कई पैकेजों में निर्मित डेमो भी हैं। जैसे

library(graphics)
demo(graphics)

पैकेज में उपलब्ध कुछ बुनियादी ग्राफिक्स के माध्यम से उपयोगकर्ता को आगे बढ़ाएगा। बुनियादी ग्राफिक्स चित्रों के माध्यम से कदम रखने के लिए बस प्रत्येक छवि पर माउस क्लिक करें। केवल दो पंक्तियों के साथ, उपयोगकर्ता को आंकड़ों के लिए आर ग्राफिक्स की प्रेरक क्षमताओं में से कुछ में पेश किया जाता है।

ग्राफिक्स बनाने के लिए कोडिंग कोड को R कंसोल में प्रदर्शित किया गया है।

यहाँ छवि विवरण दर्ज करें


2

मैं कहूंगा कि डेटा विज़ुअलाइज़ेशन के लिए दो "हैलो वर्ल्ड" प्रकार के कार्यक्रम थे:

प्रिंट ("हैलो वर्ल्ड"): सामान्य रूप से वितरित चर के हिस्टोग्राम जैसा कुछ, या शायद एक साधारण एक्स, वाई स्कैल्पलॉट।

कुछ और अधिक जटिल के लिए, जैसे कि अनुभाग हैलो वर्ल्ड के सिद्धांतों को लेता है और उपयोगकर्ता इनपुट, भागने के पात्रों और इसी तरह खेलना शुरू करता है, मैं कहता हूं कि यह आइरिस डेटा सेट के साथ खेल रहा होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.