बायेसियन: "हैलो, मशीन लर्नर!"
फ़्रीक्वेंटिस्ट: "हैलो, मशीन लर्नर!"
मशीन लर्निंग: "मैंने सुना है आप लोग सामान में अच्छे हैं। यहाँ कुछ डेटा है।"
F: "हाँ, चलो एक मॉडल लिखते हैं और फिर MLE की गणना करते हैं।"
बी: "हे, एफ, यह नहीं है जो आपने कल मुझे बताया था! मेरे पास कुछ अटूट डेटा थे और मैं विचरण का अनुमान लगाना चाहता था, और मैंने एमएलई की गणना की। फिर आपने मुझ पर ध्यान दिया और मुझे n - 1 के बजाय विभाजितएन - 1n करने के लिए कहा । n द्वारा । "
एफ: "आह हां, मुझे याद दिलाने के लिए धन्यवाद। मैं अक्सर सोचता हूं कि मैं सब कुछ के लिए MLE का उपयोग करने वाला हूं, लेकिन मैं निष्पक्ष अनुमानकर्ताओं और इतने पर दिलचस्पी रखता हूं ।"
एमएल: "एह, यह किस बारे में दार्शनिक है? क्या यह मेरी मदद करेगा?"
एफ: "ठीक है, एक आकलनकर्ता एक ब्लैक बॉक्स है, आप डेटा डालते हैं और यह आपको कुछ नंबर देता है। हम फ़्रीक्वेंटर्स इस बात की परवाह नहीं करते हैं कि बॉक्स का निर्माण कैसे किया गया था, इसे डिजाइन करने के लिए किन सिद्धांतों का उपयोग किया गया था। उदाहरण के लिए, मैं। पता नहीं कैसे नियम प्राप्त करने के लिए।÷ ( n - 1 )
एमएल: "तो, आप क्या परवाह करते हैं?"
एफ: "मूल्यांकन।"
एमएल: "मुझे उस की आवाज़ पसंद है।"
एफ: "एक ब्लैक बॉक्स एक ब्लैक बॉक्स है किसी का दावा है एक विशेष आकलनकर्ता के लिए एक निष्पक्ष आकलनकर्ता है। , तो हम में से कई के मूल्यों की कोशिश θ बारी में, कुछ मान लिया मॉडल के आधार पर प्रत्येक से कई नमूने उत्पन्न, आकलनकर्ता के माध्यम से उन्हें धक्का , और औसत को खोजने का अनुमान θ । हम साबित कर सकते हैं कि उम्मीद अनुमान सही मूल्य के बराबर होती है, सभी मानों के लिए, तो हम कहते हैं कि यह निष्पक्ष नहीं है। "θθθ
एमएल: "बहुत अच्छा लगता है! ऐसा लगता है कि फ्रीक्वेंटर्स व्यावहारिक लोग हैं। आप प्रत्येक ब्लैक बॉक्स को उसके परिणामों से देखते हैं। मूल्यांकन महत्वपूर्ण है।"
एफ: "वास्तव में! मैं समझता हूं कि आप लोग एक समान दृष्टिकोण लेते हैं। क्रॉस-सत्यापन, या कुछ और? लेकिन जो मुझे गड़बड़ लगता है।"
एमएल: "गन्दा?"
एफ: "वास्तविक डेटा पर अपने अनुमानक का परीक्षण करने का विचार मुझे खतरनाक लगता है। आपके द्वारा उपयोग किए जाने वाले अनुभवजन्य डेटा में इसके साथ सभी प्रकार की समस्याएं हो सकती हैं, और मूल्यांकन के लिए हम जिस मॉडल पर सहमत हुए हैं, उसके अनुसार व्यवहार नहीं कर सकते हैं।"
θ
F: "हाँ। जबकि आपकी विधि ने एक डेटासेट (ट्रेन और परीक्षण डेटा के साथ डेटासेट) पर काम किया होगा जो आपने अपने मूल्यांकन में उपयोग किया था, मैं यह साबित कर सकता हूं कि मेरा हमेशा काम करेगा।"
एमएल: "सभी डेटासेट के लिए?"
एफ: "नहीं।"
ML: "तो मेरे तरीके को एक डेटासेट पर क्रॉस-वैरिफाई किया गया है। आपने किसी वास्तविक डेटासेट पर अपना परीक्षण नहीं किया है?"
F: "यह सही है।"
ML: "यह मुझे तब लीड में रखता है! मेरा तरीका आपसे बेहतर है। यह 90% समय तक कैंसर की भविष्यवाणी करता है। यदि आपके द्वारा ग्रहण किए गए मॉडल के अनुसार संपूर्ण डेटासेट व्यवहार करता है तो आपका 'प्रमाण' केवल मान्य है।"
एफ: "एम्म, हाँ, मुझे लगता है।"
θ
F: "यह सही है। जब तक डेटा वास्तव में iid नॉर्मल (या जो कुछ भी) है, मेरा प्रमाण बेकार है।"
एमएल: "तो मेरा मूल्यांकन अधिक भरोसेमंद और व्यापक है। यह केवल उन डेटासेटों पर काम करता है जो मैंने अब तक आज़माए हैं, लेकिन कम से कम वे असली डेटासेट्स, मौसा और सभी हैं। आप वहाँ थे, जो दावा करने की कोशिश कर रहे थे कि आप अधिक रूढ़िवादी थे।" 'और' पूरी तरह से 'और कि आप मॉडल-जाँच और सामान में रुचि रखते थे। "
बी: (विशेषण) "अरे दोस्तों, बीच में आने के लिए खेद है। मुझे कुछ अन्य मुद्दों को प्रदर्शित करने और संभवतः चीजों को संतुलित करने के लिए प्यार करना चाहिए, लेकिन मैं वास्तव में अपने अक्सर सहयोगी सहयोगी को देखना पसंद करता हूं।"
F: "वाह!"
एमएल: "ठीक है, बच्चों। यह सब मूल्यांकन के बारे में था। एक अनुमानक एक ब्लैक बॉक्स है। डेटा अंदर चला जाता है, डेटा बाहर आता है। हम मूल्यांकन के तहत आकलन करने वाले के आधार पर एक अनुमानक का अनुमोदन या अस्वीकृति करते हैं। हमें परवाह नहीं है। "रेसिपी 'या' डिजाइन सिद्धांतों 'के बारे में जो उपयोग किए जाते हैं।"
एफ: "हां। लेकिन हमारे पास बहुत अलग विचार हैं जिनके बारे में मूल्यांकन महत्वपूर्ण हैं। एमएल वास्तविक डेटा पर ट्रेन-एंड-टेस्ट करेंगे। जबकि मैं एक मूल्यांकन करूंगा जो अधिक सामान्य है (क्योंकि इसमें व्यापक रूप से लागू प्रमाण शामिल है)। यह भी अधिक सीमित है (क्योंकि मुझे नहीं पता है कि आपके डेटासेट को वास्तव में मॉडलिंग मूल्यांकन से खींचा गया है जो मैं अपना मूल्यांकन डिजाइन करते समय उपयोग करता हूं।)
एमएल: "आप किस मूल्यांकन का उपयोग करते हैं, बी?"
एफ: (विशेषण) "अरे। मुझे हंसी मत करो। वह कुछ भी मूल्यांकन नहीं करता है। वह सिर्फ अपने व्यक्तिपरक विश्वासों का उपयोग करता है और इसके साथ चलता है। या कुछ और।"
बी: "यह सामान्य व्याख्या है। लेकिन यह भी संभव है कि मूल्यांकन के द्वारा बायेसियनवाद को परिभाषित किया जाए। तब हम इस विचार का उपयोग कर सकते हैं कि हम में से कोई भी परवाह नहीं करता है कि ब्लैक बॉक्स में क्या है, हम केवल मूल्यांकन के विभिन्न तरीकों की परवाह करते हैं।"
बी जारी है: "क्लासिक उदाहरण: चिकित्सा परीक्षण। रक्त परीक्षण का परिणाम या तो सकारात्मक या नकारात्मक है। एक निरंकुश व्यक्ति को स्वस्थ लोगों में दिलचस्पी होगी, किस अनुपात में नकारात्मक परिणाम मिलता है। और इसी तरह, बीमार लोगों का अनुपात क्या है। एक पॉजिटिव प्राप्त करें। बार-बार आने वाला प्रत्येक रक्त परीक्षण विधि के लिए इनकी गणना करेगा, जो कि विचाराधीन है और फिर अनुशंसा करते हैं कि हम उस परीक्षण का उपयोग करें जिसे सर्वश्रेष्ठ जोड़ी मिली। "
एफ: "बिल्कुल। आप और अधिक क्या चाहते हैं?"
B: "उन व्यक्तियों के बारे में क्या है जिन्हें एक सकारात्मक परीक्षा परिणाम मिला है? वे जानना चाहते हैं कि जो लोग सकारात्मक परिणाम प्राप्त करते हैं, उनमें से कितने बीमार होंगे?" और 'उन लोगों को जो नकारात्मक परिणाम प्राप्त करते हैं, कितने स्वस्थ हैं?' "
एमएल: "आह हाँ, यह सवाल पूछने के लिए बेहतर जोड़ी की तरह लगता है।"
एफ: "हार्स!"
बी: "यहां हम फिर से जाते हैं। वह पसंद नहीं करता कि यह कहां जा रहा है।"
एमएल: "यह 'पादरियों' के बारे में है, है ना?"
एफ: "ईवीआईएल"।
बी: "वैसे भी, हाँ, आप सही एमएल हैं। सकारात्मक परिणाम वाले लोगों के अनुपात की गणना करने के लिए जो बीमार हैं आपको दो में से एक काम करना होगा। एक विकल्प यह है कि बहुत सारे लोगों पर परीक्षण चलाएं और बस निरीक्षण करें। प्रासंगिक अनुपात। उदाहरण के लिए, उनमें से कितने लोग बीमारी से मर जाते हैं। "
एमएल: "ऐसा लगता है कि मैं क्या करता हूं। ट्रेन और परीक्षण का उपयोग करें।"
बी: "लेकिन आप इन नंबरों की गणना अग्रिम में कर सकते हैं, यदि आप आबादी में सिकल की दर के बारे में एक धारणा बनाने के इच्छुक हैं। बार-बार आने वाला व्यक्ति भी अपने कैलकुलेशन अग्रिम में करता है, लेकिन इस जनसंख्या-स्तर बीमारी दर का उपयोग किए बिना।"
एफ: "अधिक असेंबल किए गए एसोसिएशन।"
बी: "ओह चुप रहो। इससे पहले, आपको पता चला था। एमएल ने पाया कि आप किसी के भी रूप में निराधार के शौकीन हैं। आपकी 'सिद्ध' कवरेज संभावनाएं वास्तविक दुनिया में तब तक नहीं टिकेंगी जब तक कि आपकी सभी धारणाएं खड़ी नहीं हो जाती हैं। मेरी पूर्व धारणा इतनी भिन्न क्यों है? आप मुझे पागल कहते हैं, फिर भी आप अपनी धारणाओं का ढोंग करते हैं, यह एक रूढ़िवादी, ठोस, धारणा-मुक्त विश्लेषण का काम है। "
बी (जारी): "वैसे भी, जैसा कि मैं कह रहा था, एमएलए, एक अलग तरह के मूल्यांकन की तरह बायसीयन। हम मनाया डेटा पर कंडीशनिंग में अधिक रुचि रखते हैं, और तदनुसार हमारे अनुमानक की सटीकता की गणना करते हैं। हम इस मूल्यांकन का उपयोग किए बिना नहीं कर सकते। एक पूर्व। लेकिन दिलचस्प बात यह है कि, एक बार जब हम मूल्यांकन के इस रूप पर निर्णय लेते हैं, और एक बार जब हम अपना पूर्व चुनते हैं, तो हमारे पास एक उपयुक्त आकलनकर्ता बनाने के लिए एक स्वचालित 'नुस्खा' होता है। अक्सरवादी के पास ऐसा कोई नुस्खा नहीं होता है। एक जटिल मॉडल के लिए निष्पक्ष अनुमानक, उसके पास उपयुक्त अनुमानक बनाने का कोई स्वचालित तरीका नहीं है। "
एमएल: "और आप करते हैं? आप स्वचालित रूप से एक अनुमानक का निर्माण कर सकते हैं?"
बी: "हाँ। मेरे पास एक निष्पक्ष अनुमानक बनाने के लिए एक स्वचालित तरीका नहीं है, क्योंकि मुझे लगता है कि पूर्वाग्रह एक आकलनकर्ता का मूल्यांकन करने का एक बुरा तरीका है। लेकिन सशर्त-ऑन-डेटा अनुमान जिसे मैं पसंद करता हूं, और पहले, मैंने दिया। मुझे अनुमानक देने के लिए पूर्व और संभावना को जोड़ सकते हैं। "
एमएल: "तो वैसे भी, चलो फिर से तैयार करें। हम सभी के पास अपने तरीकों का मूल्यांकन करने के लिए अलग-अलग तरीके हैं, और हम शायद कभी भी इस बात से सहमत नहीं होंगे कि कौन से तरीके सबसे अच्छे हैं।"
बी: "ठीक है, यह उचित नहीं है। हम उन्हें मिला सकते हैं और उनका मिलान कर सकते हैं। यदि हममें से किसी के पास अच्छा लेबल प्रशिक्षण डेटा है, तो हमें इसके खिलाफ परीक्षण करना चाहिए। और आम तौर पर हम सभी को जितनी मान्यताओं का परीक्षण करना चाहिए, उतना ही करना चाहिए। 'सबूत भी मजेदार हो सकते हैं, डेटा पीढ़ी के कुछ प्रकल्पित मॉडल के तहत प्रदर्शन की भविष्यवाणी। "
F: "हाँ दोस्तों। आइए मूल्यांकन के बारे में व्यावहारिक रहें। और वास्तव में, मैं अनंत-नमूना गुणों पर ध्यान देना बंद कर दूंगा। मैं वैज्ञानिकों से मुझे एक अनंत नमूना देने के लिए कह रहा हूं, लेकिन उन्होंने अभी भी ऐसा नहीं किया है।" मेरे लिए फिर से परिमित नमूनों पर ध्यान केंद्रित करने का समय। "
एमएल: "तो, हमारे पास बस एक आखिरी सवाल है। हमने अपने तरीकों का मूल्यांकन करने के बारे में बहुत तर्क दिया है , लेकिन हम इन तरीकों को कैसे बनाते हैं ।"
बी: "आह। जैसा कि मैं पहले से कर रहा था, हम बायेसियन के पास अधिक शक्तिशाली सामान्य तरीका है। यह जटिल हो सकता है, लेकिन हम हमेशा कुछ प्रकार के एल्गोरिथ्म (शायद एमसीएमसी का एक भोले रूप) लिख सकते हैं जो हमारे पीछे से नमूना होगा। "
एफ (अंतर्विरोध): "लेकिन इसमें पूर्वाग्रह हो सकते हैं।"
B: "तो आपके तरीके हो सकते हैं। मुझे आपको याद दिलाने की आवश्यकता है कि MLE अक्सर पक्षपाती होता है। कभी-कभी, आपको निष्पक्ष अनुमान लगाने वालों को खोजने में बहुत कठिनाई होती है, और तब भी जब आपके पास एक बेवकूफ अनुमानक होता है (कुछ वास्तव में जटिल मॉडल के लिए) जो कहेगा।" विचरण नकारात्मक है। और आप उस निष्पक्ष को बुलाते हैं। निष्पक्ष, हाँ। लेकिन उपयोगी, नहीं! "
ML: "ठीक है दोस्तों। आप फिर से हंगामा कर रहे हैं। मुझे आपसे एक सवाल पूछना है, क्या आपने कभी बी के तरीके के पूर्वाग्रह के साथ अपने तरीके के पूर्वाग्रह की तुलना की है, जब आप दोनों एक ही समस्या पर काम कर रहे हैं?"
एफ: "हाँ। वास्तव में, मैं इसे स्वीकार करने से नफरत करता हूं, लेकिन बी के दृष्टिकोण में कभी-कभी मेरे सीनेटर की तुलना में कम पूर्वाग्रह और एमएसई होता है!"
एमएल: "यहां सबक यह है कि, जब हम मूल्यांकन पर थोड़ा असहमत होते हैं, तो हममें से किसी का भी एकाधिकार नहीं होता है कि हम कैसे अनुमान लगाने वाले गुण पैदा कर सकते हैं जो हमें चाहिए।"
बी: "हां, हमें एक-दूसरे के काम को थोड़ा और पढ़ना चाहिए। हम एक-दूसरे को अनुमान लगाने वालों के लिए प्रेरणा दे सकते हैं। हमें लग सकता है कि दूसरे के अनुमानक हमारी अपनी समस्याओं के बारे में महान, आउट-ऑफ-द-बॉक्स काम करते हैं।"
एफ: "और मुझे पूर्वाग्रह के बारे में देखना बंद कर देना चाहिए। एक निष्पक्ष अनुमानक का हास्यास्पद रूप से विचलन हो सकता है। मुझे लगता है कि हम उन सभी विकल्पों के लिए 'जिम्मेदारी लेना' चाहते हैं जो हम मूल्यांकन करते हैं कि हम किस तरह से मूल्यांकन करते हैं और गुण जो हम अपने अनुमानकों में देखना चाहते हैं। हम एक दर्शन के पीछे नहीं जा सकते। सभी मूल्यांकन आप कर सकते हैं। और मैं अनुमान लगाने वालों के लिए नए विचारों को प्राप्त करने के लिए बायेसियन साहित्य पर एक नज़र डालते रहूँगा! "
बी: "वास्तव में, बहुत से लोग वास्तव में नहीं जानते हैं कि उनका अपना दर्शन क्या है। मुझे खुद पर भी यकीन नहीं है। अगर मैं बायेसियन नुस्खा का उपयोग करता हूं, और फिर कुछ अच्छे सैद्धांतिक परिणाम का सबूत है, तो इसका मतलब यह नहीं है कि मैं एक अस्टिविस्ट? एक फेनिस्ट को परफॉरमेंस के बारे में उपरोक्त प्रमाणों की परवाह है, वह व्यंजनों की परवाह नहीं करता है। और अगर मैं इसके बजाय (या साथ ही) कुछ ट्रेन-एंड-टेस्ट करता हूं, तो क्या इसका मतलब है कि मैं मशीन-लर्नर हूं? "
एमएल: "ऐसा लगता है कि हम सभी बहुत समान हैं।"