डेटा खनन में लिफ्ट उपाय


36

मैंने यह जानने के लिए कई वेबसाइटों को खोजा कि वास्तव में लिफ्ट क्या करेगी? मुझे जो परिणाम मिले, वे सभी अनुप्रयोगों में इसका उपयोग करने के बारे में थे, स्वयं नहीं।

मुझे समर्थन और विश्वास समारोह के बारे में पता है। विकिपीडिया से, डाटा माइनिंग में, लिफ्ट एक मॉडल के प्रदर्शन का एक अनुमान है जो मामलों की भविष्यवाणी या वर्गीकरण करने के लिए एक यादृच्छिक विकल्प मॉडल के खिलाफ मापता है। पर कैसे? आत्मविश्वास * समर्थन लिफ्ट का मूल्य है जिसे मैंने एक और सूत्र भी खोजा है, लेकिन मैं यह नहीं समझ सकता कि लिफ्ट चार्ट अनुमानित मूल्यों की सटीकता में महत्वपूर्ण क्यों हैं मेरा मतलब है कि मैं जानना चाहता हूं कि लिफ्ट के पीछे क्या नीति और कारण है?


2
यहां संदर्भ चाहिए। विपणन में, यह एक चार्ट होगा जो विभिन्न विपणन गतिविधियों से अपेक्षित बिक्री में वृद्धि का संकेत देगा, लेकिन आपके पास शायद एक अलग संदर्भ है।
zbicyclist

जवाबों:


59

मैं एक उदाहरण दूंगा कि "लिफ्ट" कैसे उपयोगी है ...

कल्पना कीजिए कि आप एक सीधा मेल अभियान चला रहे हैं जहाँ आप ग्राहकों को उन आशाओं में एक मेल भेजते हैं जो वे प्रतिक्रिया देते हैं। ऐतिहासिक डेटा से पता चलता है कि जब आप अपने ग्राहक आधार को पूरी तरह से यादृच्छिक रूप से मेल करते हैं तो उनमें से लगभग 8% मेलिंग का जवाब देते हैं (यानी वे ऑफर के साथ आते हैं और खरीदारी करते हैं)। इसलिए, यदि आप 1,000 ग्राहकों को मेल करते हैं, तो आप 80 उत्तरदाताओं की अपेक्षा कर सकते हैं।

अब, आप अपने ऐतिहासिक डेटा के लिए एक लॉजिस्टिक रिग्रेशन मॉडल फिट करने का निर्णय लेते हैं, जो ऐसे पैटर्न का अनुमान लगाते हैं कि ग्राहक मेलिंग का जवाब दे सकते हैं या नहीं। लॉजिस्टिक रिग्रेशन मॉडल का उपयोग करके प्रत्येक ग्राहक को जवाब देने की संभावना सौंपी जाती है और आप सटीकता का आकलन कर सकते हैं क्योंकि आप जानते हैं कि क्या उन्होंने वास्तव में जवाब दिया था। एक बार जब प्रत्येक ग्राहक को उनकी संभावना सौंपी जाती है, तो आप उन्हें उच्चतम से निम्नतम स्कोरिंग ग्राहक के रूप में रैंक करते हैं। फिर आप कुछ "लिफ्ट" ग्राफिक्स इन जैसे उत्पन्न कर सकते हैं:

यहाँ छवि विवरण दर्ज करें

अभी के लिए शीर्ष चार्ट पर ध्यान न दें। नीचे चार्ट कह रहा है कि जब हम ग्राहकों को उनकी प्रतिक्रिया की संभावना (उच्च से निम्न) के आधार पर छाँटते हैं, और फिर उन्हें दस बराबर डिब्बे में तोड़ देते हैं, तो बिन # 1 में प्रतिक्रिया दर (ग्राहकों का शीर्ष 10%) 29 है 29/8 = 3.63 की लिफ्ट के लिए, यादृच्छिक ग्राहकों का 8% बनाम। जब तक हम 4-बिन में ग्राहकों को स्कोर करने के लिए मिलते हैं, तब तक हम पिछले तीन को इतने पर कब्जा कर लेते हैं कि प्रतिक्रिया दर उस स्थिति से कम होती है, जिसकी हम लोगों से यादृच्छिक रूप से मेलिंग की उम्मीद करते हैं।

शीर्ष चार्ट को देखते हुए, यह क्या कहता है कि यदि हम ग्राहकों पर संभाव्यता स्कोर का उपयोग करते हैं, तो हम कुल प्रतिसाददाताओं का 60% प्राप्त कर सकते हैं, हम केवल 30% स्कोर किए गए शीर्ष ग्राहकों को मेल करके बेतरतीब ढंग से मेलिंग प्राप्त करेंगे। यही है, मॉडल का उपयोग करके हम मेल खाते की 30% के लिए अपेक्षित लाभ का 60% प्राप्त कर सकते हैं केवल 30% स्कोर किए गए ग्राहकों को मेल कर सकते हैं, और यही लिफ्ट वास्तव में संदर्भित करता है।


अच्छा स्पष्टीकरण बहुत बहुत धन्यवाद। क्या आप कृपया मुझे लिफ्ट चार्ट में बताएं कि हमें यादृच्छिक नमूने की आवश्यकता क्यों है? मैं समझ गया कि 8% यादृच्छिक से है लेकिन यादृच्छिक का पता लगाने की आवश्यकता क्यों है? मैंने एक और चार्ट देखा जो मानों के औसत का पता लगाता है और मुझे औसत के अस्तित्व का कारण भी नहीं पता है
निकोल

मुझे जो चीज़ मिली वह है लिफ्ट = 3.63 यह कह रही है कि कॉलम 4 तक हमारे पास 8% से बेहतर प्रतिक्रिया दर है, तो आप केवल कॉलम 1 मानें और 29% (अनुमान में 30%) पर विचार करके आपने कॉलम को केवल 1 माना। फिर 3.63 के साथ क्या उठा?
निकोल

1
हे भगवान! मैं अपनी गलती समझ गया 30% 29% से संबंधित नहीं है 30% का मतलब है 3/10 3 डेटा के पहले कॉलम! अब मैं पूरी तरह से समझ गया था: DI मैं बहुत खुश हूँ !!!!! धन्यवाद>: D <
निकोल

1
@ मिक्की: कहो कि प्रत्येक ग्राहक को मेल करने के लिए कागज और डाक में $ $ $ खर्च होता है। ईमानदारी से, हम एक खर्च कर सकते हैं 1 = अब 300 है और हम 48 ग्राहकों की अपेक्षा करते हैं। इसके बाद, हम अनुमान लगाएंगे कि प्रत्येक ग्राहक से कितना लाभ होने की संभावना है। हमारे पास Spend- 300-get-48-customers हैं और जो हम चुनते हैं वह लाभ-प्रति-ग्राहक पर निर्भर करता है। 1000mailingall1000customersandweexpect8300)thenweexpecttoget601000get80customersvsSpend
जोश हेमन

1
@ user1700890 शीर्ष चार्ट को अक्सर संचयी लाभ चार्ट के रूप में लेबल किया जाता है, जबकि निचला चार्ट संचयी लिफ्ट चार्ट (जहां लिफ्ट 1 से कम कभी नहीं हो सकता है) के समान नहीं है, लेकिन डेटा को दस अलग-अलग बिनों में विभाजित करता है।
राबर्टएफ

3

किसी मॉडल की प्रतिक्रिया बनाम उस मॉडल की अनुपस्थिति के बीच लिफ्ट चार्ट अनुपात का प्रतिनिधित्व करता है। आमतौर पर, यह एक्स में मामलों के प्रतिशत द्वारा प्रतिनिधित्व किया जाता है और वाई कुल्हाड़ी में प्रतिक्रिया की संख्या बेहतर होती है। उदाहरण के लिए, 10% बिंदु पर लिफ्ट = 2 के साथ एक मॉडल का मतलब है:

  • किसी भी मॉडल के बिना जनसंख्या का 10% (बिना किसी आदेश के क्योंकि कोई मॉडल नहीं) y = 1 का अनुपात y = 1 के साथ कुल जनसंख्या का 10% होगा।

  • मॉडल के साथ हमें यह अनुपात 2 गुना मिलता है, यानी, हमें y = 1.In के साथ कुल आबादी का 20% प्राप्त होने की उम्मीद है। पहला 10% शीर्ष 10% पूर्वानुमान है


3

लिफ्ट और कुछ नहीं बल्कि कॉन्फिडेंस टू एक्सपेक्टेड कॉन्फिडेंस का अनुपात है। संघ के नियमों के क्षेत्र में - "1.0 से बड़ा एक लिफ्ट अनुपात का अर्थ है कि दो सेट स्वतंत्र होने के कारण पूर्ववर्ती और परिणामी के बीच का संबंध अपेक्षा से अधिक महत्वपूर्ण होगा। लिफ्ट अनुपात जितना बड़ा होगा, संघ उतना ही महत्वपूर्ण होगा। " उदाहरण के लिए-

यदि सुपरमार्केट डेटाबेस में 100,000 पॉइंट-ऑफ-सेल लेनदेन होते हैं, जिसमें से 2,000 में ए और बी दोनों आइटम शामिल हैं, और इनमें से 800 में आइटम सी, एसोसिएशन का नियम "यदि ए और बी खरीदा जाता है, तो सी को उसी पर खरीदा जाता है। यात्रा, "में 800 लेनदेन (वैकल्पिक रूप से 0.8% = 800 / 100,000) और 40% (= 800 / 2,000) का विश्वास है। समर्थन के बारे में सोचने का एक तरीका यह है कि यह संभावना है कि डेटाबेस से एक बेतरतीब ढंग से चयनित लेनदेन में पूर्ववर्ती और परिणामी सभी आइटम शामिल होंगे, जबकि विश्वास सशर्त संभावना है कि एक यादृच्छिक रूप से चयनित लेनदेन में सभी आइटम शामिल होंगे परिणामस्वरूप, यह देखते हुए कि लेन-देन में सभी आइटम शामिल हैं।

उपरोक्त उदाहरण का उपयोग करते हुए, इस मामले में अपेक्षित आत्मविश्वास, का अर्थ है, "आत्मविश्वास, अगर ए और बी खरीदने से सी खरीदने की संभावना नहीं बढ़ती है"। यह लेनदेन की संख्या है जिसमें कुल लेनदेन की संख्या से विभाजित परिणाम शामिल हैं। मान लीजिए कि C के लिए लेनदेन की कुल संख्या 5,000 है। इस प्रकार अपेक्षित आत्मविश्वास 5,000 / 1,00,000 = 5% है। सुपरमार्केट उदाहरण के लिए लिफ्ट = आत्मविश्वास / अनुमानित आत्मविश्वास = 40% / 5% = 8. इसलिए, लिफ्ट एक ऐसा मूल्य है जो हमें यदि (पूर्ववर्ती) भाग दिए गए तो (परिणामी) की संभावना में वृद्धि के बारे में जानकारी देता है। यहाँ स्रोत लेख के लिए लिंक है


2

शासन के महत्व को मापने के लिए लिफ्ट केवल एक उपाय है

यह जाँचने का एक उपाय है कि क्या यह नियम यादृच्छिक संयोग से सूची में है या हम उम्मीद कर रहे हैं

लिफ्ट = आत्मविश्वास / भरोसे का विश्वास


0

मान लें कि हम एक किराने की दुकान के उदाहरण का उपयोग कर रहे हैं जो एक संघ के नियम की वैधता का परीक्षण कर रही है जिसमें एक पूर्ववर्ती और एक परिणाम है (उदाहरण के लिए: "यदि कोई ग्राहक रोटी खरीदता है, तो वे मक्खन भी खरीदेंगे")।

यदि आप सभी लेन-देन को देखते हैं, और यादृच्छिक पर एक की जांच करते हैं, तो संभावना है कि उस लेनदेन में परिणाम है "अपेक्षित विश्वास"। यदि आप उन सभी लेनदेन को देखते हैं जिनमें एंटेकेडेंट हैं, और इनमें से एक यादृच्छिक लेनदेन का चयन करें, तो संभावना है कि उस लेनदेन में परिणाम "कॉन्फिडेंस" होगा। "लिफ्ट" अनिवार्य रूप से इन दोनों के बीच का अंतर है। लिफ्ट के साथ, हम दो वस्तुओं के बीच संबंध की जांच कर सकते हैं जिनमें उच्च आत्मविश्वास है (यदि आत्मविश्वास कम है तो लिफ्ट अनिवार्य रूप से अप्रासंगिक है)।

यदि उनके पास उच्च आत्मविश्वास और कम लिफ्ट है, तो हम अभी भी जानते हैं कि आइटम अक्सर एक साथ खरीदे जाते हैं, लेकिन हम यह नहीं जानते हैं कि क्या परिणाम पूर्ववर्ती के कारण हो रहा है या यदि यह सिर्फ एक संयोग है (शायद वे दोनों एक साथ अक्सर खरीदे जाते हैं क्योंकि वे दोनों बहुत लोकप्रिय उत्पाद हैं, लेकिन एक दूसरे से किसी भी तरह का संबंध नहीं है)।

हालांकि, यदि आत्मविश्वास और लिफ्ट दोनों उच्च हैं, तो हम यथोचित रूप से मान सकते हैं कि परिणाम प्रतिसाद के कारण हो रहा है । लिफ्ट जितनी अधिक होती है, उतनी ही कम संभावना होती है कि दो वस्तुओं के बीच संबंध सिर्फ एक संयोग है। गणितीय शब्दों में:

लिफ्ट = आत्मविश्वास / भरोसे का विश्वास

हमारे उदाहरण में, यदि हमारे शासन का विश्वास ऊँचा था और लिफ्ट कम थी, तो इसका मतलब यह होगा कि बहुत सारे ग्राहक रोटी और मक्खन खरीद रहे हैं, लेकिन हम यह नहीं जानते हैं कि यह रोटी और मक्खन के बीच कुछ विशेष संबंध के कारण है या नहीं ब्रेड और बटर केवल व्यक्तिगत रूप से लोकप्रिय आइटम हैं और यह तथ्य कि वे अक्सर किराने की गाड़ियों में एक साथ दिखाई देते हैं, यह केवल एक संयोग है। यदि हमारे शासन में विश्वास अधिक है और लिफ्ट अधिक है, तो यह पूर्ववर्ती और परिणामी के बीच एक बहुत मजबूत सहसंबंध को इंगित करता है, जिसका अर्थ है कि हम यथोचित रूप से मान सकते हैं कि ग्राहक इस तथ्य के कारण मक्खन खरीद रहे हैं कि वे रोटी खरीद रहे हैं। लिफ्ट जितनी ऊंची है, हम इस एसोसिएशन में उतने ही अधिक आश्वस्त होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.