आप एक खंडित फ़नल की कल्पना कैसे करेंगे? (और क्या आप इसे पायथन के साथ कर सकते हैं?)

मैंने इस पोस्ट को Moz पर देखा जिसमें एक खंडित विपणन फ़नल प्रस्तुत किया गया था: यहाँ छवि विवरण दर्ज करें

इस तरह की चीज का मेरी नौकरी में काफी महत्व होगा। मुझे नहीं पता कि इस तरह खंडित कीप दिखाने के लिए कच्चे डेटा की कल्पना कैसे की जाती है। यह विचार है कि बिक्री लीड विभिन्न स्रोतों से आती है (जिसका उपयोग हम डेटा को खंड में करने के लिए करते हैं) और जब तक वे किसी सौदे में परिवर्तित हो जाते हैं, तब तक कई चरणों से गुजरते हैं। प्रत्येक चरण से दूसरे में कुछ ड्रॉप ऑफ। प्रत्येक टुकड़ा की चौड़ाई प्रत्येक में लीड की निरपेक्ष संख्या से निर्धारित होती है। [ संपादित करें : ध्यान दें कि संदर्भ के लिए यहां उपयोग की गई छवि भ्रामक है जब यह प्रत्येक स्लाइस के दाईं ओर निर्दिष्ट संख्याओं पर आती है। प्रतीत होता है कि स्लाइस की चौड़ाई और संख्या के बीच कोई संबंध नहीं है। छवि को केवल खंडित फ़नल के डिज़ाइन के संदर्भ के रूप में लिया जाना चाहिए]।

वैसे भी, किसी भी विचार यह कल्पना कैसे करें? यदि संभव हो, तो मुझे पायथन में ऐसा करने का एक तरीका पसंद आएगा।

यहाँ कुछ डमी डेटा के साथ एक Google डॉक्टर है अगर किसी को कुछ की आवश्यकता है ...

अपनी अंतर्दृष्टि के लिए तत्पर हैं। धन्यवाद!

data-visualization python funnel-plot

— Optimesh
स्रोत

मुझे लगता है कि इसमें निर्मित विशाल लाई फैक्टर के कारण चित्रण भ्रामक है: "फ़नल" के क्रमिक स्तर विभिन्न पैमानों का उपयोग करते हैं जो अनियमित रूप से बदलते हैं। इस प्रकार बैंड की चौड़ाई प्रत्येक में पूर्ण संख्याओं द्वारा निर्धारित नहीं की जाती है - कम से कम किसी भी आसानी से समझे जाने वाले या दृश्य तरीके से नहीं। तो आप क्या पूछ रहे हैं: क्या इस तरह के डेटा की कल्पना करने के बेहतर तरीके हैं या पायथन में इस ग्राफिक को कैसे बनाया जाए?

— whuber

जो भी सॉफ़्टवेयर में काम करने के लिए, आप आमतौर पर स्टैक्ड बार के लिए एक ऑफसेट श्रेणी को शामिल कर सकते हैं और फिर इसे अदृश्य बना सकते हैं। यहाँ उसी google स्प्रेडशीट के साथ एक उदाहरण दिया गया है। आप देख सकते हैं यह एक अप्रभावी अर्थात है। उन श्रेणियों के लिए जो उस उदाहरण में कुछ भी नहीं सिकुड़ रहे हैं।

— एंडी डब्ल्यू

@ शुभंकर हाय। निश्चित नहीं कि मैं अनुसरण करूं। प्रत्येक स्तर निरपेक्ष संख्या है ... और प्रत्येक स्तर पिछले एक का एक उपसमूह है। कृपया बताएं कि स्केल अनियमित रूप से क्यों बदलता है। धन्यवाद!

— ऑप्टिमेश

शीर्ष खंड 1.5 मिलियन विज़िट का प्रतिनिधित्व करता है और मेरी स्क्रीन पर लगभग 500 पिक्सेल फैलाता है: एक पिक्सेल = 3000 विज़िट। नीचे का खंड 5000 से अधिक यात्राओं का प्रतिनिधित्व करता है और मेरी स्क्रीन पर लगभग 150 पिक्सल हैं, बजाय 2 से कम (जैसा कि @Andy ने अपने उदाहरण के साथ बताया है)। यह लगभग 100 से 1. की अतिशयोक्ति है क्योंकि इस प्रश्न में ग्राफिक इस तरह की अतिशयोक्ति की परवाह नहीं करता है, तो खंडों को फिर से जोड़ने का कोई मतलब नहीं है: आप सभी को एक ही लंबाई और ग्राफिक बनाकर बेहतर जानकारी प्राप्त करेंगे। कम कपटी होगा।

— whuber

@whuber ओह, मैं देख रहा हूं कि अब आपका क्या मतलब है। हाँ, मैं बस उस छवि को एक उदाहरण के रूप में लाया हूं जो मैं नेत्रहीन करने के लिए देख रहा हूं। संख्या स्वयं भ्रामक है, इसमें कोई संदेह नहीं है।

— ऑप्टिमेश

जवाबों:

यह भूखंड दो-तरफ़ा आकस्मिकता तालिका प्रदर्शित करता है जिसका डेटा लगभग ये हैं:

                      Branded Unbranded Social Referring Direct   RSS
First-time...          177276    472737  88638    265915 472737 59092
Return Visits...       236002    629339 118001    354003 629339 78667
4+ Visits in ...       166514    444037  83257    249771 444037 55505
10+ Visit in ...        28782     76751  14391     43172  76751  9594
At Least One Visit...    6707     17886   3354     10061  17886  2236
Last Touch...             660      1759    330       989   1759   220

इस भूखंड के निर्माण के असंख्य तरीके हैं। उदाहरण के लिए, आप रंग के प्रत्येक आयताकार पैच के पदों की गणना कर सकते हैं और प्रत्येक पैच को अलग से प्लेट कर सकते हैं। सामान्य तौर पर, हालांकि, यह इस बात का संक्षिप्त विवरण खोजने में मदद करता है कि एक भूखंड डेटा का प्रतिनिधित्व कैसे करता है।

प्रस्थान के बिंदु के रूप में, हम इसे स्टैक्ड बार चार्ट के रूपांतर के रूप में देख सकते हैं ।

इस साजिश को एक विवरण की आवश्यकता है: परिचितता के माध्यम से हम जानते हैं कि आयत की प्रत्येक पंक्ति आकस्मिक तालिका की प्रत्येक पंक्ति से मेल खाती है; आयतों की लंबाई सीधे उनकी गिनती के समानुपाती होती है; वे ओवरलैप नहीं करते हैं; और यह कि रंग तालिका के स्तंभों के अनुरूप हैं।

यदि हम इस तालिका को "डेटा फ़्रेम" या "डेटा तालिका" में परिवर्तित करते हैं $X$ फ़ील्ड नाम, कॉलम नाम और गिनती को इंगित करने वाले फ़ील्ड्स के साथ प्रति पंक्ति एक पंक्ति में होना, फिर एक उपयुक्त फ़ंक्शन को कॉल करने के लिए आमतौर पर प्लॉट करना और पंक्ति नाम, कॉलम नाम और गणना को खोजने के लिए निर्धारित करना। ग्राफिक्स कार्यान्वयन के एक व्याकरण का उपयोग (के लिए ggplot2पैकेज R) यह कुछ इस तरह दिखेगा

ggplot(X, aes(Outcome, Count, fill=Referral)) + geom_col()

ग्राफिक का विवरण, जैसे कि सलाखों की एक पंक्ति कितनी चौड़ी है और किस रंग का उपयोग करना है, आमतौर पर स्पष्ट रूप से निर्धारित किया जाना चाहिए। यह कैसे किया जाता है यह प्लॉटिंग वातावरण पर निर्भर करता है (और इसलिए अपेक्षाकृत कम रुचि है: आपको बस इसे देखना होगा)।

ग्राफिक्स के व्याकरण का यह विशेष रूप से कार्यान्वयन सलाखों की स्थिति में थोड़ा लचीलापन प्रदान करता है। कम से कम प्रयास के साथ वांछित रूप का उत्पादन करने का एक तरीका है, प्रत्येक पट्टी के आधार पर एक अदृश्य श्रेणी सम्मिलित करना ताकि सलाखों को केंद्रित किया जाए। थोड़ी सी सोच बताती है कि प्रत्येक बार को केंद्र में रखने के लिए आवश्यक नकली गणना बार की कुल लंबाई और सबसे लंबी बार की औसत होनी चाहिए। इस उदाहरण के लिए यह मानों के साथ एक प्रारंभिक कॉलम होगा

 254478.0       0.0  301115.0  897955.0  993610.5 1019817.0

यहां परिणामी स्टैक्ड बार चार्ट है जो हल्के ग्रे में नकली डेटा दिखा रहा है:

नकली कॉलम के लिए ग्राफिक्स बनाकर वांछित आकृति बनाई गई है:

भूखंड के ग्राफिक्स विवरण के व्याकरण को बदलने की आवश्यकता नहीं है: हमने बस एक ही विवरण के अनुसार प्रदान की जाने वाली एक अलग आकस्मिक तालिका की आपूर्ति की है (और नकली कॉलम के लिए डिफ़ॉल्ट रंग असाइनमेंट को ओवररोड करें)।

ये ग्राफिक्स ईमानदार हैं: प्रत्येक रंगीन पैच की क्षैतिज सीमा विरूपण के बिना अंतर्निहित डेटा के सीधे आनुपातिक है। उन्हें मूल (प्रश्न में) से तुलना करने पर पता चलता है कि इसकी विकृति कितनी चरम है (टुटे के झूठ का कारक )।

यदि यह "फ़नल" के निचले भाग में विवरण दिखाने के लिए वांछित है, तो लंबाई के बजाय क्षेत्र द्वारा गिनती का प्रतिनिधित्व करने पर विचार करें । आप सलाखों की लंबाई को कुल लंबाई के वर्गमूल के समानुपाती बना सकते हैं और उनकी चौड़ाई (ऊर्ध्वाधर दिशा में) वर्ग की जड़ों के समानुपाती भी हो सकती है। अब "फ़नल" का तल लगभग एक-चौदहवीं सबसे लंबी लंबाई होगी, बजाय इसके एक-चार-सौवें हिस्से में, कुछ विस्तार दिखाने की अनुमति होगी। दुर्भाग्य से, ggplot2कार्यान्वयन किसी को बार की चौड़ाई के लिए एक चर को मैप करने की अनुमति नहीं देता है, और इसलिए अधिक सम्मिलित कार्य-के आसपास की आवश्यकता होती है (एक जो वास्तव में प्रत्येक आयत का व्यक्तिगत रूप से वर्णन करता है)। शायद एक पायथन कार्यान्वयन है जो अधिक लचीला है।

संदर्भ

एडवर्ड टफ्टे, द विज़ुअल डिस्प्ले ऑफ़ क्वांटिटेटिव इंफॉर्मेशन । चेशायर प्रेस 1984।

लेलैंड विल्किंसन, द ग्रामर ऑफ़ ग्राफिक्स। स्प्रिंगर 2005।

— व्हीबर
स्रोत

आप इसे बनाने के लिए अजगर में अलग से खंडित फ़नल का उपयोग करने का प्रयास कर सकते हैं। यहाँ एक ट्यूटोरियल है: https://moderndata.plot.ly/segmented-funnel-charts-in-python-use-plotly/

उम्मीद है की यह मदद करेगा।

— shling
स्रोत

आप एक खंडित फ़नल की कल्पना कैसे करेंगे? (और क्या आप इसे पायथन के साथ कर सकते हैं?)

टिप्पणियाँ

संदर्भ