कॉक्स मॉडल बनाम लॉजिस्टिक रिग्रेशन


15

मान लीजिए कि हमें निम्नलिखित समस्या दी गई है:

भविष्यवाणी करें कि अगले 3 महीनों में कौन से ग्राहक हमारी दुकान में खरीदारी बंद करेंगे।
प्रत्येक ग्राहक के लिए हम उस महीने को जानते हैं जब कोई हमारी दुकान में खरीदना शुरू करता है और इसके अलावा हमारे पास मासिक समुच्चय में कई व्यवहार संबंधी विशेषताएं होती हैं। 'सबसे बड़ा' ग्राहक पचास महीने से खरीद रहा है; चलिए उस समय को निरूपित करते हैं, जब एक ग्राहक ( ) खरीदना शुरू करता है । यह माना जा सकता है कि ग्राहकों की संख्या बहुत बड़ी है। यदि कोई ग्राहक तीन महीने के लिए खरीदारी बंद कर देता है और फिर वापस आ जाता है, तो उसे एक नए ग्राहक के रूप में माना जाता है, इसलिए केवल एक बार ही एक घटना (खरीद बंद) हो सकती है।tt[0,50]

दो समाधान मेरे दिमाग में आते हैं:

लॉजिस्टिक रिग्रेशन - प्रत्येक क्लाइंट और प्रत्येक महीने के लिए (शायद 3 सबसे नए महीनों को छोड़कर), हम कह सकते हैं कि क्या ग्राहक ने खरीदना बंद कर दिया है या नहीं, इसलिए हम प्रति ग्राहक और महीने में एक अवलोकन के साथ रोलिंग नमूने कर सकते हैं। आधार खतरों के कुछ समतुल्य प्राप्त करने के लिए हम एक श्रेणीगत चर के रूप में शुरुआत से महीनों की संख्या का उपयोग कर सकते हैं।

विस्तारित कॉक्स मॉडल - इस समस्या को विस्तारित कॉक्स मॉडल का उपयोग करके भी किया जा सकता है। ऐसा लगता है कि यह समस्या उत्तरजीविता विश्लेषण के अधिक अनुकूल है।

प्रश्न: समान समस्याओं में उत्तरजीविता विश्लेषण के क्या फायदे हैं? अस्तित्व विश्लेषण का आविष्कार किसी कारण से किया गया था, इसलिए कुछ गंभीर लाभ होना चाहिए।

उत्तरजीविता विश्लेषण में मेरा ज्ञान बहुत गहरा नहीं है और मुझे लगता है कि लॉजिस्टिक रिग्रेशन का उपयोग करके कॉक्स मॉडल के अधिकांश संभावित लाभ भी प्राप्त किए जा सकते हैं।

  • स्तरीकृत कॉक्स मॉडल के समतुल्य को और स्तरीकृत चर की बातचीत का उपयोग करके प्राप्त किया जा सकता है । t
  • इंटरेक्शन कॉक्स मॉडल आबादी को कई उप-आबादी में गोता लगाकर और हर उप-आबादी के लिए एलआर का अनुमान लगाकर प्राप्त किया जा सकता है।

मेरा एकमात्र फायदा यह है कि कॉक्स मॉडल अधिक लचीला है; उदाहरण के लिए, हम आसानी से इस संभावना की गणना कर सकते हैं कि एक ग्राहक 6 महीने में खरीद बंद कर देगा।

जवाबों:


10

कॉक्स मॉडल के साथ समस्या यह है कि यह कुछ भी नहीं की भविष्यवाणी करता है। कॉक्स मॉडल में "इंटरसेप्ट" (बेसलाइन खतरा फ़ंक्शन) वास्तव में कभी भी अनुमानित नहीं है। लॉजिस्टिक रिग्रेशन का उपयोग किसी घटना के लिए जोखिम या संभाव्यता का अनुमान लगाने के लिए किया जा सकता है, इस मामले में: किसी विषय पर किसी विशिष्ट महीने में कुछ खरीदने के लिए आता है या नहीं।

साधारण लॉजिस्टिक रिग्रेशन के पीछे की धारणाओं के साथ समस्या यह है कि आप प्रत्येक व्यक्ति-महीने के अवलोकन को स्वतंत्र मानते हैं, चाहे वह एक ही व्यक्ति हो या उसी महीने जिसमें अवलोकन हुए हों। यह खतरनाक हो सकता है क्योंकि कुछ वस्तुओं को दो महीने के अंतराल में खरीदा जाता है, इसलिए महीने के अवलोकन से लगातार व्यक्ति नकारात्मक रूप से सहसंबद्ध होते हैं। वैकल्पिक रूप से, एक ग्राहक को अच्छे या बुरे अनुभवों द्वारा बनाए रखा जा सकता है या खो दिया जा सकता है, जो महीने के अवलोकन के आधार पर लगातार व्यक्ति को सकारात्मक रूप से सहसंबद्ध करता है।

मुझे लगता है कि इस भविष्यवाणी की समस्या के लिए एक अच्छी शुरुआत पूर्वानुमान के दृष्टिकोण को ले जा रही है, जहां हम अगले महीने के कारोबार के बारे में अपनी भविष्यवाणियों को सूचित करने के लिए पिछली जानकारी का उपयोग कर सकते हैं। इस समस्या के लिए एक सरल शुरुआत एक प्रभावित प्रभाव के लिए समायोजित कर रही है, या इस बात का एक संकेतक कि क्या पिछले महीने में एक विषय आया था , इस भविष्यवाणी के रूप में कि वे इस महीने आ सकते हैं ।


2
क्या स्वतंत्रता के मुद्दे को हल करने के लिए यहां बहुस्तरीय लॉजिस्टिक रिग्रेशन का इस्तेमाल नहीं किया जा सकता है? स्तर 2 ग्राहक होगा और स्तर 1 समय के साथ दोहराया जाएगा।
Forinstance

1
@ अदमो, अवरोधन का अनुमान लगाया जा सकता है, और व्यक्ति के आंशिक खतरे की भविष्यवाणी के साथ संयुक्त करके, हम अलग-अलग जीवित बछड़े बना सकते हैं। मुझे यकीन नहीं है कि आपको क्यों लगता है कि कॉक्स मॉडल "कुछ भी नहीं" की भविष्यवाणी कर सकता है।
Cam.Davidson.Pilon

@ Cam.Davidson.Pilon बेसलाइन खतरे समारोह का अनुमान एक सहायक प्रक्रिया (ब्रेस्लो स्टेप फंक्शन) है जो कॉक्स मॉडल के लिए माध्यमिक होना चाहिए। इसके अलावा, संचयी खतरे के अनुमान और मॉडल मापदंडों के बीच सहसंयोजक के रूप में अनिश्चितता की सीमा की गणना पर असहमति है। ग्रहण स्वतंत्रता के साथ -method और हॉल और Wellner सीमा मैं क्या उपयोग कर रहे हैं। δ
एडमो

भविष्यवाणी के प्रयोजनों के लिए, मुझे लगता है कि ये अवरोधक नहीं हैं। किसी एकल भविष्यवाणी को बनाने के लिए कई अनुमानों को संयोजित करना असामान्य नहीं है, और (दुर्भाग्यवश और मैं इसकी वकालत नहीं कर रहा हूं) पूर्वानुमान अंतराल आमतौर पर उपयोग नहीं किए जाते हैं या उपलब्ध नहीं होते हैं।
Cam.Davidson.Pilon

@ Cam.Davidson.Pilon मैंने यह नहीं कहा कि जोखिम पूर्वानुमान अस्तित्व के आंकड़ों से प्राप्त नहीं किया जा सकता है, मैंने कहा कि कॉक्स मॉडल जोखिम की भविष्यवाणी नहीं करते हैं। कॉल करने coxphऔर जोखिम अनुमान प्राप्त करने के बीच के कदम स्थिर और कई हैं।
एडमो

3

TjjPr(Tj>3)j3

उत्तरजीविता विश्लेषण इस तथ्य को ध्यान में रखता है कि प्रत्येक ग्राहक का अध्ययन में अपना प्रवेश समय है। तथ्य यह है कि अनुवर्ती अवधि ग्राहकों में भिन्न होती है इसलिए समस्या नहीं है।

j


रिमार्क : यहां एक पेपर है जो दिखाता है कि, कुछ बाधाओं के तहत, लॉजिस्टिक और कॉक्स मॉडल दोनों जुड़े हुए हैं।


उत्तर के लिए धन्यवाद। यदि SA ठीक से सेंसरिंग को हैंडल करता है तो इसका अर्थ है कि LR समाधान ठीक से सेंसरिंग को हैंडल नहीं करता है। इसका परिणाम कैसा होगा? मैं अभी भी खुद को नहीं समझा सकता कि एसए एक निश्चित समय लक्ष्य के लिए बेहतर है। क्या मुझे यह लेख मुफ्त में मिल सकता है?
टोमेक टारसिनेस्की

Y=0

मेरा ईमेल है: tomek.tarczynski@gmail.com बहुत बहुत धन्यवाद!
टोमेक टारसिनेस्की

@TomekTarczynski: प्राप्त हुआ?
ओकराम

हाँ, फिर से धन्यवाद! मेरे पास कल और अधिक ध्यान से पढ़ने का समय होगा। मैंने इसे स्किम किया और अगर मुझे सही तरीके से समझ आया तो यह थोड़ी अलग समस्या है। दुकान के सादृश्य का उपयोग करते हुए यह LR और COX की तुलना समस्या से करता है "क्या संभावना है कि ग्राहक शुरुआत से महीनों की निश्चित संख्या के बाद ग्राहक नहीं होगा?"
टोमेक तारकसेंस्की

2

विपणन साहित्य यहाँ या इसी तरह के एक Pareto / NBD का सुझाव देता है। आप मूल रूप से खरीद को मानते हैं - जबकि वे खरीद रहे हैं - एक नकारात्मक द्विपद वितरण का अनुसरण करता है। लेकिन आपको उस समय को मॉडल करना होगा जब ग्राहक रुक जाता है। वह दूसरा हिस्सा है।

पीट फादर और ब्रूस हार्डी के पास अबे के साथ कुछ कागजात हैं।

पारेतो / एनबीडी के लिए कई सरल दृष्टिकोण हैं, यहां तक ​​कि सिर्फ फेडर और हार्डी के विभिन्न कागजात की गिनती भी। सरल दृष्टिकोण का उपयोग न करें, जिसमें यह माना जाता है कि रुकने की संभावना समय में प्रत्येक बिंदु पर स्थिर है - इसका मतलब है कि आपके भारी ग्राहकों को जल्द ही बाहर निकालने की अधिक संभावना है। यह फिट करने के लिए एक सरल मॉडल है, लेकिन गलत है।

मैं इनमें से एक में भी फिट नहीं हूं; थोड़ा बकवास होने के लिए खेद है।

यहां एबे पेपर का संदर्भ दिया गया है, जो इस समस्या को एक श्रेणीबद्ध बेय के रूप में पुन: प्रस्तुत करता है। । अगर मैं इस क्षेत्र में फिर से काम कर रहा था, तो मुझे लगता है कि मैं इस दृष्टिकोण का परीक्षण करूंगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.