क्या असतत डेटा के लिए लाइन भूखंडों का उपयोग करना गलत है?


13

मैंने अक्सर असतत डेटासेट्स को लाइन प्लॉट्स के रूप में देखा है, लेकिन मेरे साथ ऐसा होता है कि लाइन माप अंतरालों के बीच एक बिंदु पर एक मान को प्रभावित करती है जो असतत डेटासेट के लिए अर्थहीन है। इसलिए यह मामला असतत डेटा के लिए लाइन प्लॉट का उपयोग गलत है?

एक उदाहरण के रूप में, दो समय-श्रृंखला डेटासेट, एक निरंतर (मेरा वजन, सुबह में दैनिक मापा जाता है) और एक असतत (डोनट्स की संख्या मैं प्रति दिन खाती हूं) लेती हूं। यह पहला डेटासेट एक लाइन प्लॉट होने के लिए समझ में आता है, क्योंकि यह अनुमान लगाने के लिए उचित है कि किसी भी दोपहर में मेरा वजन मेरे वजन से पहले और निम्नलिखित सुबह से संबंधित होगा। हालाँकि, यदि डोनट्स की संख्या को रेखा ग्राफ के रूप में दर्शाया जाता है, तो डॉट्स के बीच की रेखाएं उस पंक्ति से अर्थ नहीं रखती हैं।

संपादित करें

यहाँ एक और उदाहरण है: http://mste.illipedia.edu/courses/ci330ms/youtsey/lineinfo.html पर इसकी स्थापना के बाद से संघीय प्रति घंटा न्यूनतम वेतन

जब तक मैं गलत नहीं हूँ, न्यूनतम मजदूरी परिवर्तन असतत हैं, और इसलिए कुछ मनमाने ढंग से चयनित समय को देखना संभव नहीं है और बिंदुओं को परस्पर जोड़ने वाली रेखा का उपयोग करके बिंदु पर न्यूनतम वेतन स्थापित करना संभव नहीं है।


3
(+1) प्रति घंटा न्यूनतम वेतन उदाहरण उत्कृष्ट है। आपके प्रश्न का बहुत ही आसान उत्तर एक अच्छा जवाब देता है: अर्थात्, कि एक ग्राफ पर अंक जोड़ना मान्य नहीं है जब यह पाठक को गलत (या पूरी तरह से अमान्य) प्रक्षेप बनाने का कारण होगा। असंतोष और असंतोष के बीच अंतर बनाने से आगे के विश्लेषण में मदद मिलेगी: डोनट की खपत असतत है, जबकि न्यूनतम वेतन बंद है। प्रत्येक भूखंड के एक अलग रूप के हकदार हैं।
whuber

ऐसे प्लॉट हैं जहां असतत डेटा के साथ एक स्कैटर प्लॉट लाइन प्लॉट पर भ्रामक है। Omeple के मामलों के लिए जहां घटनाओं का एक क्रम आवश्यक है (हिस्टैरिसीस), या दो स्तरों के बीच दोलन होते हैं और एक को राज्य परिवर्तनों और उनके स्थान को ट्रैक करने की आवश्यकता होती है। तो: प्रक्षेपवक्र का उपयोग करने के लिए लाइन भूखंडों का उपयोग न करें, लेकिन उचित होने पर मार्गदर्शन के रूप में उनका उपयोग करें। यह आसान विकल्प नियम बनाने के लिए पर्याप्त नहीं है, लेकिन हाथ में डेटा और मॉडल पर विचार करने की आवश्यकता है।
wirrbel

1
दिलचस्प सवाल! उसके लिए धन्यवाद। मैं बहुत समय से संबंधित डेटा के साथ काम कर रहा हूं जो आंशिक रूप से असतत मॉडल से उपजा है और आंशिक रूप से मापा गया डेटा है। असतत डेटा के लिए चरणबद्ध भूखंडों का उपयोग करने के विकल्प के बारे में क्या है (जो एक तरह से निरंतर हो सकता है लेकिन हमारे पास अभी भी एकल बिंदुओं के बीच कोई फ़ंक्शन नहीं है और निरंतर डेटा के लिए केवल एक ही नहीं हो सकता है) और नियमित हैं? इस तरह से मैं इसके साथ सौदा कर रहा हूँ ..
कॉर्ड Kaldemeyer

@CordKaldemeyer टिप्पणी के लिए धन्यवाद - मुझे चार्ट प्रकार "स्टेप्ड लाइन प्लॉट" के बारे में पता नहीं था, लेकिन यह निश्चित रूप से वह है जो मैं देख रहा हूं। मुझे यह मददगार ट्यूटोरियल एक्सेल में स्टेप्ड
user1379351

@ user1379351: खुशी है कि मैं मदद कर सकता हूँ!
कॉर्ड कलडेमेयर

जवाबों:


9

कनेक्टेड लाइन प्लॉट एकल व्याख्या तक सीमित करने के लिए बहुत उपयोगी साबित हुए हैं। कुछ प्रमुख उपयोग:

  • प्रक्षेपित मूल्य । जिस मामले का आप उल्लेख करते हैं, जहां दोनों चर निरंतर हैं और प्रत्येक व्याख्यात्मक बिंदु एक सार्थक व्याख्या के रूप में रेखा के साथ है।
  • परिवर्तन की दर । यहां तक ​​कि जब बीच में मूल्य सार्थक नहीं होते हैं, तो प्रत्येक पंक्ति खंड का ढलान परिवर्तन की दर का एक अच्छा प्रतिनिधित्व होता है। ध्यान दें कि इस व्याख्या के लिए, X और Y मानों को उचित रूप से स्थान दिया जाना चाहिए, जो कि आपके द्वारा दिए गए वेतन भूखंड में नहीं है।
  • प्रोफाइल तुलना । जब छोटे गुणकों या ओवरलैड उपायों की तुलना करते हैं, तो रेखाएँ स्पष्ट कारकों के लिए भी उपयोगी हो सकती हैं। इस मामले में, लाइनें सीमित पैटर्न मान्यता के लिए प्रतिक्रियाओं के समूहों को जोड़ने का काम करती हैं। लेबल पठनीयता के लिए Y (X के बजाय) अक्ष पर कारक के साथ peltiertech.com से एक उदाहरण दिया गया है:

यहाँ छवि विवरण दर्ज करें


1
सच है, लेकिन 2 और 3 के ग्राफ पहले की तुलना में कड़ाई से कम शक्तिशाली हैं, क्योंकि कोई भी पथरी का उपयोग नहीं कर सकता है।
मिलिंद आर

5

खैर, डोनट्स वजन से संबंधित हो सकते हैं :-)

जब मैं आपकी बात देखता हूं, तो मुझे लगता है कि यह उदाहरण इतना बुरा नहीं है क्योंकि समय (क्षैतिज अक्ष पर, जो कि लाइनों को संदर्भित करता है) निरंतर है। लाइन का अर्थ, मेरे लिए, इतना नहीं है कि, दिन के प्रत्येक समय में आपने डोनट्स की एक निश्चित संख्या खा ली है, लेकिन यह है कि प्रति दिन डोनट्स की संख्या कुछ नियमित तरीके से बदलती है। इस प्रकार, हम लाइन के लिए एक कम चिकनी की तरह कुछ जोड़ सकते हैं, और यह समझ में आता है। प्रत्येक घंटे में खाए गए डोनट्स, या यहां तक ​​कि प्रत्येक मिनट के बारे में सोचना कम से कम उचित है (हालांकि यह एक चर के साथ अधिक समझदार होगा जहां प्रति दिन गिनती अधिक थी)

क्या अधिक चिंताजनक है जब क्षैतिज अक्ष असतत है (और विशेष रूप से जब यह नाममात्र है) लेकिन लाइनें खींची जाती हैं। यह वास्तव में कोई मतलब नहीं है। उदाहरण के लिए, यदि आप संयुक्त राज्य अमेरिका के विभिन्न क्षेत्रों के निवासियों के बीच (कहते हैं) ओबामा के लिए% मतदान देख रहे हैं (कहते हैं), तो पूर्वोत्तर और मिडवेस्ट के बीच एक रेखा खींचने का कोई मतलब नहीं है; खासकर जब से क्षेत्रों का क्रम मनमाना है, लेकिन क्रम बदलने से लाइनें बदल जाएंगी। फिर भी मैंने इस तरह के रेखांकन देखे हैं।


1
इस बात से बिलकुल सहमत हैं कि वहाँ लाइन रेखांकन के बहुत खराब दुरुपयोग हैं। मुझे चिकनी दृष्टिकोण पसंद है क्योंकि यह डॉट्स को जोड़ता नहीं है, और इसलिए इसका मतलब यह नहीं है कि डेटा नहीं है। लेकिन यह डोनट खपत में चिंता की प्रवृत्ति को उजागर करने का काम करता है। धन्यवाद!
user1379351

3
आप एक चर की जगह - डोनट खपत - एक और एक के साथ प्रस्ताव करने लगते हैं; अर्थात्, डोनट खपत घनत्व (डोनट्स प्रति यूनिट समय)। यद्यपि यह अक्सर किया जाता है - विशेष रूप से दो-आयामी विश्लेषणों में (जैसे कि जनसंख्या घनत्व के नक्शे) - और बहुत प्रभावी हो सकते हैं, पाठकों के लिए यह जानना अच्छा होगा कि एक भेद है और यह विचार करना है कि वह अंतर कैसे हो सकता है रेखांकन से पता चला।
whuber

2
@ शुभंकर यह एक उचित बिंदु है; लाइन लगता है कि प्रतिस्थापन बनाने के लिए। ऐसा ग्राफ़ जो उस प्रतिस्थापन को नहीं बनाता है, केवल डॉट्स, असंबद्ध हो सकता है, लेकिन ऐसा लगता है कि कम से कम डोनट खपत में एक विशेष बिंदु पर स्थित होने का संकेत देता है। इसलिए, हम समय को निरंतर रूप से प्रस्तुत कर सकते हैं और उस समय डॉट डाल सकते हैं जब डोनट का उपभोग किया गया था।
पीटर Flom - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.