मैं समझता हूं कि वेब पर क्लिक-थ्रू दरों की भविष्यवाणी करने के लिए अक्सर लॉजिस्टिक प्रतिगमन का एक कारण यह है कि यह अच्छी तरह से कैलिब्रेटेड मॉडल का उत्पादन करता है। क्या इसके लिए एक अच्छी गणितीय व्याख्या है?
मैं समझता हूं कि वेब पर क्लिक-थ्रू दरों की भविष्यवाणी करने के लिए अक्सर लॉजिस्टिक प्रतिगमन का एक कारण यह है कि यह अच्छी तरह से कैलिब्रेटेड मॉडल का उत्पादन करता है। क्या इसके लिए एक अच्छी गणितीय व्याख्या है?
जवाबों:
हाँ।
लॉजिस्टिक रिग्रेशन से अनुमानित संभावना वेक्टर मैट्रिक्स समीकरण को संतुष्ट करता है
जहां डिजाइन मैट्रिक्स है और वाई प्रतिक्रिया वेक्टर है। इसे रैखिक समीकरणों के संग्रह के रूप में देखा जा सकता है, जो डिज़ाइन मैट्रिक्स एक्स के प्रत्येक कॉलम से उत्पन्न होता है ।
इंटरसेप्ट कॉलम (जो ट्रांसपोज़्ड मैट्रिक्स में एक पंक्ति है) के लिए विशेषज्ञता, संबंधित रैखिक समीकरण है
इसलिए समग्र औसत अनुमानित संभावना प्रतिक्रिया के औसत के बराबर है।
आमतौर पर, बाइनरी फीचर कॉलम , संबंधित रैखिक समीकरण है
इसलिए अनुमानित भविष्यवाणियों का योग (और औसत) प्रतिक्रिया के योग के बराबर होता है, यहां तक कि उन अभिलेखों के लिए विशेषज्ञता भी है जिनके लिए ।
मुझे लगता है कि मैं आपको एक आसान समझने वाला विवरण प्रदान कर सकता हूं:
हम जानते हैं कि इसके नुकसान समारोह निम्नलिखित समारोह के रूप में व्यक्त किया जा सकता:
कहाँm
की संख्या का प्रतिनिधित्व करता है सभी प्रशिक्षण के नमूने,ith नमूने के लेबल,ith नमूने की भविष्यवाणी की संभावना: । (पूर्वाग्रहαनोटिस करें यहां करें)
के बाद से प्रशिक्षण के लक्ष्य को नुकसान समारोह को कम करना है, हमें प्रत्येक पैरामीटर के संबंध में इसकी आंशिक व्युत्पन्न का मूल्यांकन करते हैं (विस्तृत व्युत्पत्ति पाया जा सकता है यहाँ ):
इसका मतलब है कि यदि मॉडल पूरी तरह से प्रशिक्षित है, तो प्रशिक्षण सेट के लिए हमें मिलने वाली अनुमानित संभावनाएं स्वयं फैल जाती हैं ताकि प्रत्येक विशेषता के लिए उस सुविधा के भारित (सभी) मूल्यों का योग उस सुविधा के मूल्यों के योग के बराबर हो सकारात्मक नमूनों की।
हम स्पष्ट रूप से देख सकते हैं कि लॉजिस्टिक रिग्रेशन अच्छी तरह से कैलिब्रेटेड है।
संदर्भ: चार्ल्स एल्कान द्वारा लॉग-रैखिक मॉडल और सशर्त यादृच्छिक फ़ील्ड