मैं मार्क वैन डेर लान के कुछ पत्रों को समझने की कोशिश कर रहा हूं। वह बर्कले में एक सैद्धांतिक सांख्यिकीविद् है जो मशीन सीखने के साथ समस्याओं पर काम करता है। मेरे लिए एक समस्या (गहरी गणित के अलावा) यह है कि वह अक्सर पूरी तरह से अलग शब्दावली का उपयोग करके परिचित मशीन सीखने के दृष्टिकोण का वर्णन करता है। उनकी मुख्य अवधारणाओं में से एक "लक्षित अधिकतम संभावना प्रदर्शन" है।
TMLE का उपयोग गैर-नियंत्रित प्रयोग से सेंसर किए गए अवलोकन डेटा का इस तरह से विश्लेषण करने के लिए किया जाता है, जिससे भ्रमित कारकों की उपस्थिति में भी प्रभाव का अनुमान लगाया जा सके। मुझे दृढ़ता से संदेह है कि एक ही अवधारणा के कई अन्य क्षेत्रों में अन्य नामों के तहत मौजूद हैं, लेकिन मैं अभी तक इसे अच्छी तरह से समझ नहीं पा रहा हूं कि यह सीधे किसी भी चीज से मेल खाता है।
"कम्प्यूटेशनल डेटा एनालिसिस" के अंतर को पाटने का प्रयास यहाँ है:
डेटा विज्ञान के युग में प्रवेश: लक्षित शिक्षण और सांख्यिकी और कम्प्यूटेशनल डेटा विश्लेषण का एकीकरण
और सांख्यिकीविदों के लिए एक परिचय यहाँ है:
लक्षित अधिकतम संभावना के आधार पर अनुमान: भाग I
दूसरे से:
इस लेख में, हम कई समय बिंदु हस्तक्षेपों के कारण प्रभावों के लिए एक विशेष रूप से लक्षित अधिकतम संभावना अनुमानक विकसित करते हैं। इसमें जी-गणना सूत्र के अज्ञात कारकों का प्रारंभिक अनुमान प्राप्त करने के लिए हानि-आधारित सुपर-लर्निंग का उपयोग शामिल है, और बाद में, प्रत्येक कारक के लिए लक्ष्य-पैरामीटर विशिष्ट इष्टतम उतार-चढ़ाव फ़ंक्शन (कम से कम अनुकूल पैरामीट्रिक सबमॉडल) को लागू करना। अधिकतम संभावना अनुमान के साथ उतार-चढ़ाव पैरामीटर (एस) का आकलन करना, और अभिसरण तक प्रारंभिक कारक के इस अद्यतन चरण को पुनरावृत्त करना। यह पुनरावृत्ति लक्षित अधिकतम संभावना अद्यतन करने के कदम को कारण प्रभाव के परिणामी अनुमानक को इस अर्थ में दोगुना मजबूत बनाता है कि यह सुसंगत है यदि या तो प्रारंभिक अनुमानक सुसंगत है, या इष्टतम उतार-चढ़ाव समारोह का अनुमानक सुसंगत है। इष्टतम उतार-चढ़ाव फ़ंक्शन को सही ढंग से निर्दिष्ट किया जाता है यदि कारण ग्राफ में नोड्स के सशर्त वितरण एक हस्तक्षेप पर सही ढंग से निर्दिष्ट होते हैं।
उनकी शब्दावली में, "सुपर लर्निंग" को एक सैद्धांतिक रूप से ध्वनि गैर-नकारात्मक भार योजना के साथ सीखना है। लेकिन "प्रत्येक लक्ष्य कारक के लिए एक लक्ष्य-पैरामीटर विशिष्ट इष्टतम उतार-चढ़ाव समारोह (कम से कम अनुकूल पैरामीट्रिक सबमॉडल) को लागू करने" से उसका क्या मतलब है।
या इसे तीन अलग-अलग प्रश्नों में तोड़कर, टीएमएलई मशीन लर्निंग में एक समानांतर है, "कम से कम अनुकूल पैरामीट्रिक सबमॉडल" क्या है, और अन्य क्षेत्रों में "उतार-चढ़ाव समारोह" क्या है?