प्लॉटिंग के लिए स्केलिंग डेटा जो परिमाण के विभिन्न आदेशों पर हैं


9

निम्नलिखित डेटासेट देख रहे हैं:

 Date        Visits   Carts      carts       Orders
                      Created   converted    Created
2011-11-11    12277     161        9          36  
2011-11-12    11871     93         5          19    
2011-11-13    13072     107        8          8     
2011-11-14    13594     112        4          34    
2011-11-15    12741     129        8          43    
2011-11-16    15491     261        16         57 
2011-11-17    13418     186        17         42    

मुझे एक ग्राफ पर यह प्लॉट करने के लिए कहा गया है, तारीख का उपयोग करके एक्स-एक्सिस और वाई-एक्सिस पर बाकी डेटा है। समस्या यह है कि डेटा का पैमाना नाटकीय रूप से अलग है। जहाँ विज़िट हज़ारों में हैं और बनाया गया ऑर्डर कम टेंस में है, डेटा एक ग्राफ पर अच्छी तरह से प्लॉट नहीं करता है।

मैं सोच रहा था कि एक सांख्यिकीविद् इस परिदृश्य में क्या करेगा, मैं विज़िट को 1000 से विभाजित कर सकता हूं और फिर विवरण (विज़िट (K)) में डाल सकता हूं, लेकिन फिर मुझे कार्ट के साथ एक ही समस्या उत्पन्न हुई, जैसा कि वे हैं सैकड़ों में और सब कुछ कम दसियों में है।

इस परिदृश्य में किस तरह का काम किया जाता है?

जवाबों:


14

यह यू अक्ष के लिए अलग-अलग पैमानों पर एक्स एक्सिस (तिथियों) के साथ अलग-अलग तराजू के साथ लाइन चार्ट्स की श्रृंखला के रूप में शुरू करने के लिए अनुचित नहीं है। यहाँ छवि विवरण दर्ज करें

मुझे लगता है कि यह एक अच्छी शुरुआत है, क्योंकि यह कच्चे डेटा की जांच करने की अनुमति देता है, और विभिन्न लाइन चार्ट के बीच रुझानों की तुलना करने की अनुमति देता है। IMO आपको पहले कच्चे डेटा को देखना चाहिए, फिर कच्चे डेटा की जांच करने के बाद चार्ट को सामान्य करने के लिए रूपांतरण या तरीकों के बारे में सोचें।

जैसा कि राजा ने पहले ही उल्लेख किया है, ऐसा प्रतीत होता है कि आपके चरों के नाम और संख्या के आधार पर एक प्राकृतिक क्रम है, और यह उचित है, मैंने प्रत्येक राज्य में परिवर्तित प्रतिशत के आधार पर तीन नए चर बनाए। नए चर हैं;

% Carts Created = Carts_Created/Visits
% Orders Created = Orders_Created/Carts_Created
% Carts Converted = Carts_Converted/Orders_Created

प्रतिशत बनाना श्रृंखला को एक सामान्य पैमाने के करीब लाने का एक तरीका है, लेकिन फिर भी सभी लाइनों को एक चार्ट पर रखना (नीचे के रूप में) श्रृंखला को प्रभावी ढंग से कल्पना करना अभी भी मुश्किल है। बनाए गए और गाड़ियों के स्तर और भिन्नता ने श्रृंखला के बौनों को दूसरी श्रृंखला में परिवर्तित कर दिया। आप इस पैमाने पर बनाई गई कार्ट में कोई भिन्नता नहीं देख सकते हैं (और मुझे संदेह है कि आप जिस पर सबसे अधिक रुचि रखते हैं)। यहाँ छवि विवरण दर्ज करें

तो फिर, IMO यह जांचने का एक बेहतर तरीका है कि विभिन्न पैमानों का उपयोग किया जाए। नीचे विभिन्न पैमानों का उपयोग करते हुए प्रतिशत चार्ट है।

यहाँ छवि विवरण दर्ज करें

इन ग्राफिक्स के साथ, मुझे श्रृंखला के बीच मेरे लिए कोई वास्तविक सार्थक सहसंबंध प्रतीत नहीं होता है, लेकिन आपके पास प्रत्येक श्रृंखला (विशेषकर अनुपात रूपांतरित) के भीतर बहुत सारे दिलचस्प बदलाव हैं। क्या हो रहा है 2011-11-13? आपके पास ऑर्डर के बनाए गए अनुपात का अनुपात बहुत कम था लेकिन ऑर्डर के बनाए गए हर एक एक परिवर्तित कार्ट था। क्या आपके पास कोई अन्य हस्तक्षेप है जो साइट के दौरे या अनुपात या प्रतिशत कार्ट में बनाई गई प्रवृत्तियों की व्याख्या कर सकता है?

यह सब सिर्फ खोजपूर्ण डेटा विश्लेषण है, और किसी भी अधिक कदम उठाने के लिए मुझे डेटा में अधिक जानकारी की आवश्यकता होगी (मुझे उम्मीद है कि यह एक अच्छी शुरुआत है)। आप अन्य तरीकों से लाइन चार्ट को सामान्य कर सकते हैं, उन्हें एक तुलनीय पैमाने पर प्लॉट करने में सक्षम हो सकता है, लेकिन यह एक मुश्किल काम है, और मुझे लगता है कि प्रभावी ढंग से मनमाना तराजू चुनने के आधार पर किया जा सकता है जो जानकारीपूर्ण है जो डेटा को चुनने के विपरीत है। डिफ़ॉल्ट सामान्यीकरण योजनाएं। एक साथ कई लाइन ग्राफ देखने का एक और दिलचस्प अनुप्रयोग क्षितिज ग्राफ़ है , लेकिन यह एक ही बार में कई अलग-अलग लाइन चार्ट देखने के लिए अधिक है ।


आपके उत्तर में विस्तार के लिए धन्यवाद, मेरे पास मूल रूप से कई चार्ट थे। मेरे बॉस ने फैसला किया है कि वे ग्राफ पर सभी श्रृंखलाओं को पसंद करेंगे (मुझे लगता है कि शायद इसकी बहुत सी श्रृंखला है, लेकिन मुझे नहीं, जो इसे देख रहे होंगे :)) मुझे लगता है कि मैं डेटा को सामान्य करने पर विचार करने जा रहा हूं, शायद 0 में - 1. वे केवल रुझानों को देखने के लिए ग्राफ़ का उपयोग करना चाहते हैं, तालिका डेटा आमतौर पर ग्राफ़ के नीचे प्रदर्शित किया जाता है।
माइक

@ माइक, यह एक उचित अनुरोध है। श्रृंखला के सामान्यीकरण को प्रवृत्ति (बस प्रत्येक श्रृंखला के स्तर और भिन्नता) को नहीं बदलना चाहिए। उम्मीद है कि आपको कुछ प्रभावी, लेकिन फिर भी सार्थक तरीके से श्रृंखला को सामान्य करने के अधिक व्यावहारिक जवाब मिलेंगे। हालांकि सावधानी का एक शब्द है, आमतौर पर आप केवल एक चार्ट पर 3-5 लाइनों की साजिश करना चाहते हैं, उन सभी की तुलना करने के लिए बहुत अधिक कठिन है (छोटी बहु हालांकि इस समस्या के लिए एक काम के आसपास है)।
एंडी डब्ल्यू

1
@ माइक इस मामले में, (केवल संख्याओं के बिना डेटा की कल्पना कर रहा है), आप बस अपने डेटा को न्यूनतम / अधिकतम पैमाने पर व्यक्त कर सकते हैं, जैसा कि समानांतर डिस्प्ले में किया जाता है । तालिका के नीचे संख्या दिखाना भी एक अच्छा विचार है।
CHL

1
जैसा कि @chl ने सुझाव दिया है कि एक न्यूनतम / अधिकतम पैमाने को सामान्य करने पर बस एक और नोट। पहले कच्चे डेटा को देखना अच्छा है, अगर आपके पास कुछ बड़े बकाया हैं, तो आप सामान्यीकरण प्रक्रिया में उस मूल्य को शामिल नहीं करने पर विचार कर सकते हैं (हालांकि यह सामान्यीकृत ग्राफ में करते हैं तो यह स्पष्ट होना चाहिए, जैसे यदि आपके पास एक रेखा ग्राफ है एक उच्च / निम्न मूल्य और शेष समतल है)। मुझे लगता है कि माइकल फ्रेंडली ग्राफ़ के साथ-साथ नीचे दी गई तालिका को भी शामिल करने पर सहमत होंगे।
एंडी डब्ल्यू

2

आपके पास 2 अलग-अलग y- अक्ष, विज़िट (k) और कार्ट एक में बनाए गए हैं, अन्य 2 दूसरे में (या जो भी आपके उद्देश्य को पूरा करता है)।

यह निश्चित रूप से एक सुरुचिपूर्ण तरीका नहीं है, लेकिन मुझे याद है कि यह वर्षों पहले कर रहा था जब मैं सिर्फ समय के रुझानों की तुलना करना चाहता था।

या

यदि आप अपने उद्देश्य के अनुरूप हैं तो आप समय भर में प्रतिशत परिवर्तन की साजिश कर सकते हैं।


मैंने उस मार्ग पर विचार किया जिसका आपने 2 अलग-अलग Y अक्ष के साथ उल्लेख किया था, लेकिन मुझे इसके बारे में क्या पसंद नहीं था: यदि एक नई श्रृंखला पेश की गई थी जो कि दो Y- अक्ष में से किसी एक पर फिट नहीं होगी, तो मैं शायद अटक जाऊंगा। सुझाव के लिए धन्यवाद, और शायद एक और समय मैं इस पर अधिक विचार करूंगा :)
माइक

प्रतिशत का उपयोग करने के बारे में दूसरे सुझाव के बारे में क्या? यानी शुरू की तारीख में 100 पर सब कुछ अनुक्रमित (या जो भी तारीख आपके चार्ट को सुंदर बनाता है)। आप जितनी चाहें उतनी नई श्रृंखला जोड़ सकते हैं!
राजा

यह एक विकल्प है, मैं वर्तमान में एक्सेल पर यह पता लगाने का प्रयास कर रहा हूं कि इस डेटा को कैसे सामान्य किया जाए और यदि यह काम करता है। विफल रहा है कि मैं प्रतिशत विचार एक जाना होगा :)
माइक

2

अंत में मैंने प्रत्येक मूल्य को अधिकतम मूल्य से विभाजित करके और फिर 100 से गुणा करके डेटा को सामान्य करने का निर्णय लिया।

  1. अधिकतम मूल्य ज्ञात कीजिए:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    12277     161        9          36  
    2011-11-12    11871     93         5          19    
    2011-11-13    13072     107        8          8     
    2011-11-14    13594     112        4          34    
    2011-11-15    12741     129        8          43    
    2011-11-16    15491     261        16         57 
    2011-11-17    13418     186        17         42    
    
    maximum       15491     261        17         57
    
  2. प्रत्येक संख्या को अधिकतम से विभाजित करें और फिर 100 से गुणा करें:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    79.25     61.68      52.94      63.15  
    2011-11-12    76.63     35.63      29.41      33.33    
    2011-11-13    84.38     40.99      47.05      14.03      
    2011-11-14    87.75     42.91      23.52      59.64    
    2011-11-15    82.24     49.42      47.05      75.43    
    2011-11-16    100       100        94.11      100
    2011-11-17    86.61     71.26      100        73.68    
    
  3. मैंने तब इसे ग्राफ पर लिखा था, जाहिर है कि यह केवल प्रवृत्ति को दर्शाता है और उपयोगकर्ता के पास पृष्ठ के निचले भाग में डेटा तालिका है।


0

यह मेरा दृष्टिकोण भी होगा - - एक्स द्वारा विभाजित करके अलग-अलग आयामों को एक ही पैमाने पर समायोजित करने के लिए लेकिन मैं अधिकतम या न्यूनतम मूल्य नहीं बल्कि एवीजी मूल्य का उपयोग करूंगा। इसका कारण है - जैसा कि आप समय के साथ डेटा जोड़ते हैं, आपकी अधिकतम या न्यूनतम संभावना बदल जाएगी, और फिर पिछले चार्ट में 100% क्या था इस बार कुछ और है - चार्ट पहले चार्ट के लिए आसानी से सामंजस्यपूर्ण नहीं है - - यदि आप एवीजी का उपयोग करते हैं तो परिवर्तन उतने कठोर नहीं होते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.