लॉग स्केल कब उपयुक्त हैं?


57

मैंने पढ़ा है कि चार्टिंग / ग्राफ़िंग का उपयोग करते समय चार्टिंग / ग्राफिंग कुछ परिस्थितियों में उचित होती है, जैसे कि समय श्रृंखला चार्ट में y- अक्ष। हालाँकि, मैं इस बारे में एक निश्चित स्पष्टीकरण नहीं पा सका हूँ कि ऐसा क्यों है, या जब यह उचित होगा। कृपया ध्यान रखें, मैं एक सांख्यिकीविद् नहीं हूं इसलिए मैं इस बिंदु को पूरी तरह से याद कर रहा हूं और यदि ऐसा है तो मैं उपचारात्मक संसाधनों के लिए दिशा की सराहना करूंगा।


10
यह एक औपचारिक उत्तर नहीं है लेकिन - जब एक चर परिमाण के कई आदेशों को फैलाता है, तो यह लॉग पैमाने पर कल्पना करने के लिए आंखों (और अधिक जानकारीपूर्ण) पर अक्सर आसान होता है।
मैक्रों

मैक्रो-यह अच्छी समझ में आता है (विशेषकर जब आपको एक दर्शक मिल गया है जो इसे समझ सकते हैं!)
dav

1
जब आप विशिष्ट उत्तरों की प्रतीक्षा कर रहे हों, तो आपको यह निकटता से संबंधित थ्रेड का उपयोग हो सकता है: आंकड़े.स्टैकएक्सचेंज . com / questions / 298 । चार्टिंग के संदर्भ में, आप "निर्भर चर" को "y अक्ष" के रूप में अच्छी तरह से व्याख्या कर सकते हैं। फिर उन कई करीबी सवालों पर एक नज़र डालें जो यहाँ दिखाई दिए हैं।
whuber

3
इसके अलावा FYI करें नाओमी रॉबिंस के विषय पर एक बहुत ही सरल लेख है और साथ ही यह भी रुचि होनी चाहिए कि मुझे अपने चार्ट और ग्राफ़ में लॉगरिदमिक स्केल का उपयोग कब करना चाहिए?
एंडी डब्ल्यू

Whuber, अतिरिक्त लिंक को इंगित करने के लिए धन्यवाद। मैंने उनमें से कुछ को देखा था, लेकिन सभी को नहीं और मैं अब उनके माध्यम से अपना काम कर रहा हूं।
'16

जवाबों:


51

यह एक बहुत ही दिलचस्प सवाल है, और एक ऐसा जिसके बारे में बहुत कम लोग सोचते हैं। कई अलग-अलग तरीके हैं जो एक लॉग स्केल उपयुक्त हो सकते हैं। सबसे पहले और सबसे अच्छी तरह से जाना जाता है कि मैक्रों ने अपनी टिप्पणी में उल्लेख किया है: लॉग तराजू को छोटे मानों के बिना एक बड़ी श्रृंखला को प्रदर्शित करने की अनुमति दी जाती है, जिसे ग्राफ के नीचे संकुचित किया जाता है।

लॉग स्केलिंग पसंद करने का एक अलग कारण उन परिस्थितियों में है जहां डेटा अधिक स्वाभाविक रूप से ज्यामितीय रूप से व्यक्त किया जाता है। एक उदाहरण है जब डेटा एक जैविक मध्यस्थ की एकाग्रता का प्रतिनिधित्व करता है। सांद्रता नकारात्मक नहीं हो सकती है और परिवर्तनशीलता लगभग अपरिवर्तनीय रूप से तराजू के साथ होती है (अर्थात विषमकोणीय विचरण है)। एक लघुगणकीय पैमाने का उपयोग करते हुए या, बराबर, लॉग एकाग्रता का उपयोग प्राथमिक के रूप में दोनों असमान परिवर्तनशीलता को 'ठीक' करता है और एक पैमाने देता है जो दोनों सिरों पर अनबाउंड है। सांद्रता शायद लॉग-सामान्य रूप से वितरित की जाती है और इसलिए लॉग स्केलिंग हमें एक बहुत ही सुविधाजनक परिणाम देता है जो यकीनन 'प्राकृतिक' है। फार्माकोलॉजी में हम नशीली दवाओं की सांद्रता के लिए एक लघुगणकीय पैमाने का उपयोग करते हैं, जो अक्सर नहीं की तुलना में अधिक होता है।

लॉग स्केल के लिए एक और अच्छा कारण, शायद वह जिसे आप समय-श्रृंखला डेटा के लिए रुचि रखते हैं, आंशिक परिवर्तन को समतुल्य बनाने के लिए लॉग स्केल की क्षमता से आता है। अपने सेवानिवृत्ति निवेशों के दीर्घकालिक प्रदर्शन के प्रदर्शन की कल्पना करें। यह (होना चाहिए) लगभग तेजी से बढ़ रहा है क्योंकि कल की दिलचस्पी आज के निवेश (मोटे तौर पर बोलने) पर निर्भर करती है। इस प्रकार, भले ही प्रतिशत के मामले में प्रदर्शन काफी स्थिर रहा हो, फंड का ग्राफ दाहिने हाथ के अंत में सबसे तेजी से बढ़ा है। लॉगरिदमिक पैमाने के साथ एक स्थिर प्रतिशत परिवर्तन को एक निरंतर ऊर्ध्वाधर दूरी के रूप में देखा जाता है इसलिए एक स्थिर विकास दर को एक सीधी रेखा के रूप में देखा जाता है। यह अक्सर एक पर्याप्त लाभ है।

लॉग स्केल चुनने के लिए एक और थोड़ा अधिक गूढ़ कारण उन परिस्थितियों में आता है जहां मूल्यों को यथोचित रूप से x या 1 / x के रूप में व्यक्त किया जा सकता है। अपने स्वयं के अनुसंधान से एक उदाहरण संवहनी प्रतिरोध है जिसे पारस्परिक रूप से, संवहनी प्रवाहकत्त्व के रूप में भी व्यक्त किया जा सकता है। (यह कुछ परिस्थितियों में रक्त वाहिकाओं के व्यास के बारे में सोचने के लिए भी समझदार है जो प्रतिरोध या चालकता की शक्ति के रूप में पैमाने पर है।) उन उपायों में से किसी में भी अन्य की तुलना में अधिक वास्तविकता नहीं है और दोनों शोध पत्रों में पाए जा सकते हैं। यदि उन्हें लघुगणक रूप से स्केल किया जाता है, तो वे बस एक दूसरे के नकारात्मक होते हैं और एक या दूसरे की पसंद से कोई भिन्न नहीं होता है। (संवहनी व्यास एक स्थिर गुणक द्वारा प्रतिरोध और चालकता से भिन्न होगा जब वे सभी लॉग स्केल होते हैं।)


शानदार उत्तर के लिए धन्यवाद! क्या आप "मूल्यों को यथोचित रूप से x के रूप में व्यक्त किया जा सकता है" पर विस्तार से बता सकते हैं?
ktdrv

4
@ktdrv कुछ चीजें समझ में भी आती हैं। कहते हैं कि आप एक मछुआरे की क्षमता का दस्तावेजीकरण करना चाहते हैं। आप प्रति दिन पकड़ी गई मछलियों की संख्या की गिनती कर सकते हैं या आप लगातार कैच के बीच के अंतराल को माप सकते हैं। या तो माप से समझ में आता है लेकिन वे एक दूसरे से गैर-रैखिक रूप से संबंधित हैं। वे एक दूसरे के प्रतिरूप हैं और इसलिए एक से दूसरे में परिवर्तित हो सकते हैं। अंतराल का लॉग और प्रति दिन संख्या का लॉग एक दूसरे से रैखिक रूप से संबंधित होते हैं और एक स्थिर (नकारात्मक) कारक से भिन्न होते हैं।
माइकल लुईस

1
माइकल, महान जवाब के लिए धन्यवाद। मुझे स्वीकार करना होगा, मुझे आपके सभी बिंदुओं के माध्यम से झारना करने में थोड़ा समय लगा (और "हेटेरोसिस्टैस्टिक विचरण" जैसे कुछ शब्दों को गूगल करना पड़ा)। मैं अभी भी एक साथ ठीक से काम कर रहा हूं, जवाब का वास्तविक प्रभाव मेरे काम के लिए क्या होगा, लेकिन मैं एक सामान्य दिशा और मुझे रास्ते में संकेत देने के लिए कुछ दिशानिर्देशों के लिए आभारी हूं।
dav

x1/xlog(x)x1/x x1/xx1/x

pH=log[H+]

29

कुछ वास्तविक जीवन के उदाहरण मुझे @Michael Lew के बहुत अच्छे उत्तर के अतिरिक्त हाथ लगाने थे।

सबसे पहले, नीचे दी गई दो टाइम सीरीज़ के प्लॉट्स न्यूज़ीलैंड से आने वाले मासिक आगंतुक के शो, सांख्यिकी न्यूज़ीलैंड से उपलब्ध हैं । दोनों भूखंडों का अपना उद्देश्य है, लेकिन मैं पहले वाले की तुलना में कई अधिक उद्देश्यों के लिए एक लघुगणकीय पैमाने पर ऊर्ध्वाधर अक्ष के साथ एक को ढूंढता हूं। उदाहरण के लिए, आप देख सकते हैं कि आवक में मौसमी आगमन के पैमाने पर लगभग आनुपातिक रहता है; और आप विकास दर (जैसे द्वितीय विश्व युद्ध के दौरान) में महत्वपूर्ण बदलाव देख सकते हैं जो मूल पैमाने पर सिर्फ अदृश्य हैं।

यहाँ छवि विवरण दर्ज करें

दूसरा, नीचे दिए गए भूखंडों की तुलना में न्यूजीलैंड में पर्यटकों द्वारा यात्रा से संबंधित कुल खर्च को दर्शाया गया है, जबकि वे वास्तव में न्यूजीलैंड में हैं। स्रोत आर्थिक विकास मंत्रालय द्वारा अंतर्राष्ट्रीय आगंतुक सर्वेक्षण है। अंतर पूर्व-यात्रा व्यय है, उदाहरण के लिए अग्रिम में भुगतान किए गए होटल या पैकेज। मूल पैमाने पर पहला कथानक, कुछ उद्देश्यों के लिए इस्तेमाल किया जा सकता है, इसके अलावा नीचे के बाएं कोने में समूहीकृत किए जा रहे डेटा की एक बहुत क्रूड (लेकिन महत्वपूर्ण) छाप है। दूसरा प्लॉट कुछ तात्कालिक व्याख्या करता है, विशेष रूप से गैर-सांख्यिकीविदों के लिए (इस वजह से, मैं आमतौर पर अब वास्तव में कुल्हाड़ियों पर एक लघुगणकीय पैमाने का उपयोग करूंगा, बजाय डेटा को बदलने और लॉगरिदमिक मूल्य दिखाने के पैमाने का), लेकिन बहुत कुछ देता है अधिक दृश्य भेदभाव।

उदाहरण के लिए, आप स्पष्ट रूप से कुछ आउटलेर्स (जो डेटा संपादन त्रुटियों के रूप में सामने आए) को स्पॉट कर सकते हैं, जहां कुल खर्च न्यूजीलैंड में खर्च से कम था। शायद अधिक महत्वपूर्ण बात, आप इस ग्राफ का उपयोग विभिन्न रंगों के साथ कर सकते हैं या दिखा सकते हैं कि विभिन्न बाजार देश या यात्रा का उद्देश्य (जैसे छुट्टी v। आने वाले मित्र और परिवार) खर्च "अंतरिक्ष" के विभिन्न हिस्सों पर कब्जा करते हैं - ऐसा कुछ जो बस अदृश्य होगा मूल कुल्हाड़ियों पर।

इस कथानक को कुछ उपयोगी बनाने से किसी तरह उच्च घनत्व डेटा (जैसे बिंदुओं के लिए कुछ पारदर्शिता जोड़कर, या घनत्व के अनुसार हेक्सागोनल डिब्बे के साथ बिंदुओं को बदलकर) के साथ काम करना शामिल होगा, लेकिन किसी भी उपयोगी दृश्य समाधान में निश्चित रूप से लॉगरिदमिक एसेस शामिल होंगे।

यहाँ छवि विवरण दर्ज करें

संपादित / जोड़

हेक्सागोनल डब्बा द्वारा जो मैं बता रहा था, उसका वर्णन करने के लिए एक और साजिश है, जब एक बड़े डेटासेट का प्रतिनिधित्व करने के लिए रंग का उपयोग किया जाता है (इस मामले में, न्यूजीलैंड में रग्बी विश्व कप के अनुभवों के बारे में एक सर्वेक्षण के बारे में 12000 उत्तरदाताओं)। ध्यान दें कि यह एक और उदाहरण है जहां मैंने खर्च के लिए एक लघुगणकीय पैमाने का उपयोग किया है।

यहाँ छवि विवरण दर्ज करें


पीटर, अतिरिक्त अंतर्दृष्टि के लिए धन्यवाद-ग्राफिक्स वास्तव में आपकी बातों को समझने में मदद करते हैं। एक अनुवर्ती प्रश्न (यदि आप बहुत झुके हुए हैं), तो आप "हेक्सागोनल" डिब्बे वाले बिंदुओं को क्यों बदलेंगे? क्या यही विचार "सनफ्लॉवर प्लॉट्स" के समान है? मैंने वह शब्द पहले नहीं सुना है।
डीएवी

नहीं, सूरजमुखी के भूखंडों के लिए अलग। यह बिंदु प्लॉटिंग क्षेत्र को हेक्सागोनल बिन में विभाजित करना है और फिर उन्हें प्रत्येक बिन में कितने बिंदुओं के अनुसार रंग (जैसे प्रकाश से अंधेरे तक) में विभाजित करना है। बड़े डेटासेट की साजिश रचने के लिए एक अच्छा तरीका हो सकता है, जो अन्यथा काले रंग के द्रव्यमान में बदलने की प्रवृत्ति है।
पीटर एलिस

@DavidVandenbos - मैंने एक उदाहरण जोड़ा है
पीटर एलिस

(शेष टिप्पणी) @PeterEllis स्पष्टीकरण के लिए धन्यवाद। यह डेटा के विज़ुअलाइज़ेशन का एक शानदार तरीका है-भौगोलिक भौगोलिक मानचित्र के समान जो मैं उपयोग करता हूं। क्या आपने इसे R में बनाया है?
डीएवी

हां, R, ggplot2 पैकेज का उपयोग करते हुए - इस उद्देश्य के लिए बहुत अच्छा है और मूल बातें प्राप्त करने के बाद काफी सीधा।
पीटर एलिस

9

लॉग स्केल के बारे में एक और बात यह है कि वे अनुपात को सममित बनाते हैं। उदाहरण के लिए, इस तरह: यहाँ छवि विवरण दर्ज करें


9
तुलनात्मक रूप से एक ही भूखंड को रेखीय पैमाने पर देखना अच्छा होगा
निको
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.