टूटी हुई कुल्हाड़ियों के विकल्प क्या हैं?


28

उपयोगकर्ताओं को अक्सर एक ही ग्राफ पर परिमाण के विभिन्न आदेशों का डेटा पेश करने के लिए अक्ष मूल्यों को तोड़ने के लिए लुभाया जाता है ( यहां देखें )। हालांकि यह सुविधाजनक हो सकता है यह हमेशा डेटा प्रदर्शित करने का पसंदीदा तरीका नहीं है (यह सबसे अच्छा भ्रामक हो सकता है)। परिमाण के कई आदेशों में डेटा को प्रदर्शित करने के वैकल्पिक तरीके क्या हैं?

मैं दो तरह से सोच सकता हूं, डेटा को लॉग-ट्रांसफ़ॉर्म करने के लिए या जाली प्लॉट्स का उपयोग करने के लिए। अन्य विकल्प क्या हैं?


1
उन एक्सेल गाइड बहुत डरावना दिखते हैं ...

5
क्या आप सोच सकते हैं कि R पर एक ट्यूटोरियल एक ऐसे व्यक्ति को कैसे देखता है जिसने अपने जीवन में कभी भी कोड की एक पंक्ति नहीं देखी है? :)
रोमन लुसट्रिक

3
ठीक है, लेकिन मैं उन सभी लोगों की कल्पना भी कर सकता हूं जो एक्सेल में दर्जनों बार ब्रेक को मैन्युअल रूप से ड्राइंग करते हैं और यह मानते हुए कि यह ऐसा करने का एकमात्र (और इस प्रकार सबसे आसान और सबसे तेज़) तरीका है। या लोग एक बड़े वर्ड डॉक्यूमेंट में फॉर्मेटिंग को एक करने की कोशिश में घंटों बिताते हैं।

1
"पिताजी, उन्हें माफ कर दें, क्योंकि वे नहीं जानते कि वे क्या कर रहे हैं।" दिमाग़ में आता है। :)
रोमन लुसट्रिक

3
ऑफिशियल बैंड ऑफ स्टैटस.स्टैकएक्सचेंज डॉट कॉम: द ब्रोकन एक्सिस।
मैट पार्कर

जवाबों:


17

मैं बार ग्राफ़ पर लघुगणक अक्षों का उपयोग करने से बहुत सावधान हूं । समस्या यह है कि आपको अक्ष का एक प्रारंभिक बिंदु चुनना होगा, और यह लगभग हमेशा मनमाना है। आप दो बार बनाने के लिए चुन सकते हैं बहुत अलग ऊंचाइयों, या लगभग एक ही ऊंचाई, केवल अक्ष पर न्यूनतम मूल्य बदलकर। ये तीन रेखांकन सभी एक ही डेटा की साजिश करते हैं: वैकल्पिक शब्द

बंद कुल्हाड़ियों का एक विकल्प, जिसका किसी ने अभी तक उल्लेख नहीं किया है, वह केवल मूल्यों की एक तालिका दिखाना है। कई मामलों में, रेखांकन ग्राफ की तुलना में समझने में आसान होते हैं।


3
वे रेखांकन बहुत धोखेबाज दिखते हैं क्योंकि आपके पास उन पर त्रुटि पट्टियाँ नहीं हैं। यदि आप त्रुटि सलाखों को जोड़ते हैं तो अंतर कम पर्याप्त दिखाई देगा। या आप बॉक्स-एंड-व्हिक्सर भूखंडों का उपयोग कर सकते हैं जो ज्यादातर इस तरह की समस्याओं से बचते हैं।
निको

5
IMHO मूल बार चार्ट्स की एक समस्या है, और इसका लघुगणक से कोई लेना-देना नहीं है। आप रैखिक कुल्हाड़ियों के साथ एक ही धोखा छाप तक पहुँच सकते हैं।
cbeleites मोनिका

@cbeleites। हाँ, आप बेसलाइन बदलकर एक रेखीय अक्ष के साथ भ्रामक बार ग्राफ़ बना सकते हैं। लेकिन एक रैखिक अक्ष के साथ, प्राकृतिक आधार रेखा शून्य है। लॉगरिदमिक कुल्हाड़ियों के साथ, अधिकांश संदर्भों में, कोई प्राकृतिक आधार रेखा नहीं है।
हार्वे मोटुलस्की

@ हर्वेमोतुलस्की: मैं असहमत हूं। डेटा की एक पूरी कक्षा है जो लॉग एक्सिस द्वारा अच्छी तरह से वर्णित है, और जिसमें एक प्राकृतिक आधार रेखा है: गुणात्मक परिवर्तन / अनुपात। आपके उदाहरण में, शायद उपचारित संकेत 15x नियंत्रण संकेत है। यदि वह धारणा आवेदन के लिए समझ में आती है, तो आपके पास लॉग के लिए "प्राकृतिक" आधार रेखा है। यदि नहीं, तो शायद एक और परिवर्तन अधिक समझदार है?
कैबीलाइट्स मोनिका

1
@cbeleites मैं मानता हूं कि यदि चर एक अनुपात है तो 1.0 एक प्राकृतिक आधार रेखा है, तो इसे लॉग पैमाने पर दिखाना समझ में आता है।
हार्वे मोटुलस्की

11

कुछ अतिरिक्त विचार:

(1) आपको अपने आप को एक लघुगणकीय परिवर्तन तक सीमित नहीं करना चाहिए। इस साइट को "डेटा-परिवर्तन" टैग के लिए खोजें, उदाहरण के लिए। कुछ डेटा रूट या लॉजिट जैसे कुछ परिवर्तनों के लिए खुद को अच्छी तरह से उधार देते हैं। (इस तरह के परिवर्तन - यहां तक ​​कि लॉग - आमतौर पर गैर-तकनीकी दर्शकों के लिए ग्राफिक्स प्रकाशित करने से बचा जाता है। दूसरी ओर, वे डेटा में पैटर्न देखने के लिए उत्कृष्ट उपकरण हो सकते हैं।)

(२) आप अपने चार्ट के भीतर या उसके आगे किसी चार्ट का विवरण अंकित करने की एक मानक कार्टोग्राफिक तकनीक उधार ले सकते हैं। विशेष रूप से, आप अपने द्वारा एक चार्ट पर सभी मानों (या) को बाकी डेटा पर सीमित सीमा के साथ अधिक सीमित अक्ष के साथ प्लॉट करेंगे, फिर दोनों को संबंधों के संकेत (दृश्य और / या लिखित) के साथ रेखांकन करें उनके बीच। यूएस के एक नक्शे के बारे में सोचें जिसमें अलास्का और हवाई विभिन्न पैमानों पर इनसेट हैं। (यह सभी प्रकार के चार्ट के साथ काम नहीं करेगा, लेकिन आपके चित्रण में बार चार्ट के साथ प्रभावी हो सकता है।) [मुझे लगता है कि यह mbq के हालिया उत्तर के समान है।]

(३) आप टूटे हुए भूखंड को एक ही भूखंड के साथ अखंड अक्ष पर दिखा सकते हैं।

(4) अपने बार चार्ट उदाहरण के मामले में, एक उपयुक्त (शायद बेहद फैला हुआ) ऊर्ध्वाधर अक्ष चुनें और एक पैनिंग उपयोगिता प्रदान करें। [यह वास्तव में उपयोगी तकनीक, IMHO से अधिक एक चाल है, लेकिन यह कुछ विशेष मामलों में उपयोगी हो सकती है।]

(5) डेटा प्रदर्शित करने के लिए एक अलग स्कीमा चुनें। मानों का प्रतिनिधित्व करने के लिए लंबाई का उपयोग करने वाले बार चार्ट के बजाय, एक चार्ट चुनें, जिसमें प्रतीकों के क्षेत्र मानों का प्रतिनिधित्व करते हैं, उदाहरण के लिए। [जाहिर है कि ट्रेड-ऑफ यहां शामिल हैं।]

तकनीक की आपकी पसंद संभवतः प्लॉट के उद्देश्य पर निर्भर करेगी: डेटा अन्वेषण के लिए बनाए गए भूखंड अक्सर सामान्य दर्शकों के लिए भूखंडों से भिन्न होते हैं, उदाहरण के लिए।


8

शायद इसे जाली के रूप में वर्गीकृत किया जा सकता है, लेकिन मैं कोशिश करूँगा; सभी पट्टियों को एक पैनल में सबसे ऊंचा करने के लिए प्लॉट करें और निचले हिस्से पर ज़ूम दिखाते हुए दूसरा पैनल लगाएं। मैंने इस तकनीक का उपयोग एक बार स्कैल्पलॉट के मामले में किया था, और परिणाम काफी अच्छा था।


8

मैं बार चार्ट की समस्या से लॉग कुल्हाड़ियों की समस्या को अलग करूँगा।


A=lgI0lgII0

यदि कोई समझदार और नियत मूल नहीं है जो एक नियंत्रण (बेसलाइन, रिक्त) की भूमिका लेता है तो बार चार्ट समझदार नहीं हो सकता। लेकिन यह लॉग कुल्हाड़ियों के साथ कुछ नहीं करना है।
बार चार्ट के लिए मेरे पास एकमात्र नियमित उपयोग हिस्टोग्राम है। लेकिन मैं सोच सकता था कि वे इस मूल को अंतर दिखाने के लिए अच्छा करते हैं (आप तुरंत यह भी देखें कि क्या अंतर सकारात्मक या नकारात्मक है)। क्योंकि पट्टियाँ किसी क्षेत्र को दर्शाती हैं, मैं एक वक्र के नीचे क्षेत्र के बहुत विवेकाधीन संस्करण के रूप में बारचार्टों के बारे में सोचता हूं। यही है, एक्स-एक्सिस का एक मीट्रिक अर्थ होना चाहिए (जो समय के साथ हो सकता है, लेकिन शहरों के साथ नहीं)।

अगर मैं अपने आप को सोच रहा हूं कि किसी चीज़ के लॉग के लिए उपयोग करने के लिए मूल क्या है जो "प्राकृतिक" मूल 0 पर था, तो मैं वापस कदम रखूंगा और थोड़ा सोचूंगा कि क्या चल रहा है। बहुत बार, ऐसी समस्याएं सिर्फ एक संकेतक हैं कि लॉग यहां एक समझदार परिवर्तन नहीं है।

अब लॉग कुल्हाड़ियों के साथ एक बार चार्ट गुणकों में होने वाली वृद्धि या घटने पर जोर देगा। समझदार उदाहरण है कि मैं अभी सोच सकता हूँ सभी के पास ब्याज के मूल्य के लिए कुछ रैखिक संबंध हैं। लेकिन शायद किसी और को इसका अच्छा उदाहरण मिल जाए।

इसलिए मुझे लगता है कि डेटा परिवर्तन हाथ में डेटा के अर्थ के संबंध में समझदार होना चाहिए। यह ऊपर वर्णित भौतिक-रासायनिक इकाइयों के साथ मामला है (ए सांद्रता के लिए आनुपातिक है, और पीएच है, उदाहरण के लिए, पीएच-मीटर में वोल्टेज के लिए एक रैखिक संबंध)। वास्तव में, यह इतना मामला है, कि लॉग यूनिट को एक नया नाम मिलता है, और एक रैखिक तरीके से उपयोग किया जाता है।

अंतिम, लेकिन कम से कम, मैं कंपन स्पेक्ट्रोस्कोपी से आता हूं, जहां टूटी हुई कुल्हाड़ियों का नियमित रूप से उपयोग किया जाता है। और मुझे लगता है कि यह उन कुछ उदाहरणों में से एक है जहां कुल्हाड़ियों को तोड़ना धोखा नहीं है। हालाँकि, परिमाण के क्रम में हमारे पास परिवर्तन नहीं हैं। हमारे पास हमारी एक्स रेंज का सिर्फ 30 - 40% का एक असंक्रामक क्षेत्र है: यहां एक उदाहरण है: स्पेक्ट्रम इस नमूने के लिए, 1800 - 2800 / सेमी के बीच के हिस्से में कोई उपयोगी जानकारी नहीं हो सकती है।
अकल्पनीय वर्णक्रमीय सीमा इसलिए हटा दी जाती है (जो वर्णक्रमीय श्रेणियों को इंगित करता है जो हम वास्तव में रसायन विज्ञान मॉडलिंग के लिए उपयोग करते हैं): स्पेक्ट्रम uninformative हिस्सा निकाल दिया गया

लेकिन डेटा की व्याख्या के लिए, हमें एक्स-स्थिति की सटीक रीडिंग की आवश्यकता है। लेकिन आम तौर पर हमें अलग-अलग रेंज में फैले हुए गुणकों की आवश्यकता नहीं होती है (जैसे कि ऐसे संबंध हैं, लेकिन अधिकांश कनेक्शन अधिक जटिल हैं। उदाहरण के लिए: 3050 / सेमी पर सिग्नल, इसलिए हमारे पास असंतृप्त या सुगंधित पदार्थ है। लेकिन 1000 / सेमी पर कोई मजबूत संकेत नहीं है। , इसलिए कोई मोनो, मेटा, और न ही 1,3,5-प्रतिस्थापित सुगंधित अंगूठी ...)
इसलिए एक्स को बड़े पैमाने पर चित्रित करना बेहतर है (वास्तव में हम अक्सर गाइड की तरह मिलीमीटर-शीट का उपयोग करते हैं या सटीक स्थानों को लेबल करते हैं)। तो, हम अक्ष को तोड़ते हैं, और एक बड़ा x स्केलिंग प्राप्त करते हैं: स्पेक्ट्रम - टूटी हुई धुरी

दरअसल, यह मुखरता बहुत पसंद है: मुखर संस्करण
लेकिन टूटी हुई धुरी IMHO इस बात पर जोर देती है कि दोनों भागों में एक्स-अक्ष का पैमाना समान हो। प्लॉट किए गए क्षेत्रों के भीतर Ie अंतराल समान हैं।

छोटी तीव्रता (y- अक्ष) पर जोर देने के लिए, हम आवर्धित इनसेट का उपयोग करते हैं:
यहाँ छवि विवरण दर्ज करें
[ ... विवरण के लिए, नीले रंग में आवर्धित (x 20) νCH क्षेत्र देखें ... ]

और यह निश्चित रूप से लिंक किए गए भूखंडों में भी उदाहरण के साथ संभव है।


2

दो विचारों को जिनके बारे में बताया गया था, लेकिन जब मैंने उत्कृष्ट उत्तरों और टिप्पणियों को देखा तो स्पष्ट रूप से वर्णित नहीं किया गया था कि आप "लेबलिंग के साथ असंगत तरीके से बार चार्ट" का उपयोग कर रहे हैं और सामान्य / आयाम रहित डेटा।

प्लॉट प्रकार:

स्टार / स्पाइडर / रडार-शैली चार्ट (लिंक) (लिंक) अक्सर कई निर्देशांक के साथ कई अलग-अलग चीजों की तुलना करने के लिए बहुत अच्छा है। बहुत से उपयोगी भूखंड हैं जो (दुख की बात है) व्यावसायिक प्रस्तुतियों में दुर्लभ हैं, संभावना है क्योंकि नेतृत्व समझ पाने के लिए जानकारी का उपयोग करने के बजाय निर्णय लेने के लिए निष्कर्ष का उपयोग करना पसंद करता है और फिर निर्णय लेने के लिए समझ का उपयोग करता है। व्यापार में कभी-कभी सर्वसम्मति का निर्माण करना बहुत मुश्किल होता है और इसलिए परिणाम-केवल दृष्टिकोण से सर्वसम्मति-पहले, निर्णय-अगले वातावरण में अधिक उपज हो सकती है। यह बार / कॉलम चार्ट की लोकप्रियता को सूचित करता है। कृपया अन्य ग्राफ़ प्रकारों के उदाहरणों पर विचार करें जो समझ पाने (लिंक) के लिए अच्छे हैं ।

परिवर्तन:

यदि आप उन मानों को विभाजित करते हैं जिन्हें आप "विशेषता" मूल्य द्वारा चार्टिंग कर रहे हैं, तो आप जानकारी को खोए बिना पठनीयता में सुधार करने के लिए स्केलिंग को बदल सकते हैं। द्रव डायनामिस्ट अपनी भविष्यवाणिय उपयोगिता और अनुप्रयोग में उनकी लोच के कारण आयाम रहित संख्या को पसंद करते हैं। वे बकिंघम पाई प्रमेय जैसी चीजों को उम्मीदवार आयामों के रूपों (लिंक) के स्रोत के रूप में देखते हैं । लोकप्रिय और उपयोगी, आयाम रहित संख्याओं में रेनॉल्ड्स नंबर, मच संख्या, बायोट संख्या, ग्राशॉफ़ संख्या, पाई, रैले संख्या, स्टोक्स संख्या और शेरवुड संख्या शामिल हैं। (संपर्क) आपको आयामहीन संख्याओं से प्यार करने के लिए भौतिक विज्ञानी होने की आवश्यकता नहीं है क्योंकि वे गैर-भौतिकी अनुप्रयोगों में उपयोगी हैं। घनत्व, समरूपता, वृत्ताकारता और सहसंयोजन जैसे उपाय छवियों, पिक्सेल क्षेत्रों, या बहुभिन्नरूपी वितरण को परिभाषित कर सकते हैं। बस एक लघुगणक, या एक ज्ञात मूल्य से एक रिश्तेदार दूरी लेने पर विचार न करें - आप अपनी वर्ग जड़ों को लेते हुए, संख्याओं को निकालने पर भी विचार कर सकते हैं।

शुभकामनाएँ। कृपया हमें बताएं कि चीजें कैसे बदल जाती हैं।


1
अधिकांश डेटा अर्थात प्राधिकरण राडार चार्ट के उपयोग का कड़ा विरोध करते हैं। उनकी व्याख्या करना कठिन है। एक बेहतर विकल्प एक समानांतर निर्देशांक चार्ट है
जॉन पेल्टियर

@JonPeltier - मैं सहमत हूं, लेकिन एक्सेल ने (उस समय जो मैंने उत्तर दिया था) में एक समानांतर समन्वय चार्ट बनाने का एक अच्छा तरीका है, इसलिए यह संभव है कि उनके दर्शकों को समझने के लिए काफी संघर्ष करना पड़ रहा है।
एंग्रीस्टूडेंट - मोनिका

1

टूट-अक्ष समाधान सबसे अच्छा काम करता है जब प्लॉट के पार एक स्पष्ट विराम होता है और ऑर्डिनेट को लेबल किया जाता है ताकि अंतर स्पष्ट हो। इसका लाभ यह है कि पैमाने को मूल्यों के दो सेटों में संरक्षित किया जाता है। विभिन्न पैमानों वाले पैनल प्लॉट निम्न और उच्च समूहों के सापेक्ष भिन्नता को व्यक्त नहीं कर सकते हैं। मुझे जूम-इन प्लॉट का विचार पसंद है, जिसे मैंने स्कैल्प्लॉट्स के लिए प्रोग्राम किया था लेकिन बार प्लॉट्स के लिए उपयोग करने के बारे में नहीं सोचा था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.