लॉजिस्टिक रिग्रेशन (और आमतौर पर, GLM) मशीन लर्निंग से संबंधित नहीं है ! बल्कि, ये तरीके पैरामीट्रिक के हैं modeling.
पैरामीट्रिक और एल्गोरिथम (एमएल) मॉडल दोनों डेटा का उपयोग करते हैं, लेकिन अलग-अलग तरीकों से। एल्गोरिथम मॉडल डेटा से सीखते हैं कि भविष्यवक्ता भविष्यवाणी करने के लिए कैसे मैप करते हैं, लेकिन वे उस प्रक्रिया के बारे में कोई धारणा नहीं बनाते हैं, जिसने टिप्पणियों (न ही किसी अन्य धारणा, वास्तव में) को उत्पन्न किया है। वे मानते हैं कि इनपुट और आउटपुट चर के बीच अंतर्निहित संबंध जटिल और अज्ञात हैं, और इस प्रकार, औपचारिक समीकरण को लागू करने के बजाय क्या चल रहा है, यह समझने के लिए एक डेटा संचालित दृष्टिकोण को अपनाएं।
दूसरी ओर, पैरामीट्रिक मॉडल का अध्ययन की गई प्रक्रिया के कुछ ज्ञान के आधार पर एक प्राथमिकता निर्धारित की जाती है, उनके मापदंडों का अनुमान लगाने के लिए डेटा का उपयोग करें, और बहुत सी अवास्तविक धारणाएं बनाएं जो शायद ही कभी व्यवहार में आती हैं (जैसे कि स्वतंत्रता, समान रूपांतर, और त्रुटियों का सामान्य वितरण)।
इसके अलावा, पैरामीट्रिक मॉडल (जैसे लॉजिस्टिक रिग्रेशन) वैश्विक मॉडल हैं। वे डेटा में स्थानीय पैटर्न कैप्चर नहीं कर सकते (एमएल तरीकों के विपरीत जो पेड़ों को अपने आधार मॉडल के रूप में उपयोग करते हैं, उदाहरण के लिए आरएफ या बूस्टेड पेड़)। इस पेपर पेज को देखें 5. एक सुधारात्मक रणनीति के रूप में, स्थानीय (यानी, नॉनपैमेट्रिक) जीएलएम का उपयोग किया जा सकता है (उदाहरण के लिए लोफिट आर पैकेज देखें)।
Often, when little knowledge about the underlying phenomenon is available, it is better to adopt a data-driven approach and to use algorithmic modeling. For instance, if you use logistic regression in a case where the interplay between input and output variables is not linear, your model will be clearly inadequate and a lot of signal will not be captured. However, when the process is well understood, parametric models have the advantage of providing a formal equation to summarize everything, which is powerful from a theoretical standpoint.
For a more detailed discussion, read this excellent paper by Leo Breiman.