सामान्य तौर पर, भविष्यवाणी करने की तुलना में अनुमान करना अधिक कठिन है?


13

मेरा प्रश्न निम्नलिखित तथ्य से आता है। मैं पोस्ट, ब्लॉग, लेक्चर और साथ ही मशीन लर्निंग पर किताबें पढ़ रहा हूं। मेरी धारणा यह है कि मशीन सीखने वाले चिकित्सक उन कई चीजों के प्रति उदासीन प्रतीत होते हैं जिनकी सांख्यिकीविद् / अर्थमिति देखभाल करती है। विशेष रूप से, मशीन सीखने वाले चिकित्सक अनुमान से अधिक भविष्यवाणी सटीकता पर जोर देते हैं।

ऐसा ही एक उदाहरण तब हुआ, जब मैं कोर्टेरा पर एंड्रयू एनजी की मशीन लर्निंग ले रहा था । जब उन्होंने सिंपल लाइनियर मॉडल की चर्चा की, तो उन्होंने अनुमानकर्ताओं की BLUE संपत्ति के बारे में कुछ भी उल्लेख नहीं किया, या कैसे हेटेरोसेडासिटी विश्वास अंतराल को "अमान्य" कर देगा। इसके बजाय, वह ढाल मूल कार्यान्वयन और क्रॉस सत्यापन / आरओसी वक्र की अवधारणा पर ध्यान केंद्रित करता है। ये विषय मेरी अर्थमिति / सांख्यिकी कक्षाओं में शामिल नहीं थे।

एक और उदाहरण तब हुआ जब मैंने कागल प्रतियोगिताओं में भाग लिया। मैं अन्य लोगों के कोड और विचार पढ़ रहा था। प्रतिभागियों का एक बड़ा हिस्सा सिर्फ SVM / यादृच्छिक वन / XGBoost में सब कुछ फेंक देता है।

फिर भी एक और उदाहरण स्टेप वाइज मॉडल चयन के बारे में है। इस तकनीक का व्यापक रूप से उपयोग किया जाता है, कम से कम ऑनलाइन और कागले पर। कई शास्त्रीय मशीन सीखने वाली पाठ्यपुस्तकें भी इसे कवर करती हैं, जैसे कि सांख्यिकीय शिक्षा का परिचय। हालाँकि, इस उत्तर के अनुसार (जो काफी ठोस है), स्टेप वाइज मॉडल चयन में विशेष रूप से समस्या का सामना करना पड़ता है, जब यह "सच्चे मॉडल की खोज" के लिए नीचे आता है। ऐसा लगता है कि केवल दो संभावनाएं हैं: या तो मशीन सीखने वाले चिकित्सकों को चरणबद्ध तरीके से समस्या का पता नहीं है, या वे करते हैं, लेकिन वे परवाह नहीं करते हैं।

तो यहाँ मेरे सवाल हैं:

  1. क्या यह सच है कि (सामान्य रूप से) मशीन सीखने वाले चिकित्सक भविष्यवाणी पर ध्यान केंद्रित करते हैं और इस प्रकार बहुत सी चीजों की परवाह नहीं करते हैं जो सांख्यिकीविद् / अर्थशास्त्री ध्यान रखते हैं?
  2. अगर यह सच है, तो इसके पीछे क्या कारण है? क्या यह इसलिए है क्योंकि कुछ अर्थों में अनुमान लगाना अधिक कठिन है?
  3. ऑनलाइन मशीन लर्निंग (या भविष्यवाणी) पर बहुत सारी सामग्रियां हैं। यदि मैं निष्कर्ष निकालने के बारे में जानने में दिलचस्पी रखता हूं, हालांकि, ऑनलाइन कुछ संसाधन क्या हैं जो मैं परामर्श कर सकता हूं?

अद्यतन : मुझे बस एहसास हुआ कि "अनुमान" शब्द संभावित रूप से बहुत सारे सामान का मतलब हो सकता है। मुझे "अनुमान" से क्या मतलब था जैसे सवालों का संदर्भ देता है

  1. क्या कारण या वजह से ? या अधिक आम तौर पर, बीच कारण संबंध क्या हैं ?XYYXX1,X2,,Xn

  2. चूंकि "सभी मॉडल गलत हैं", सच्चे मॉडल से "गलत" हमारा मॉडल कैसे है?

  3. एक नमूने की जानकारी को देखते हुए, हम जनसंख्या के बारे में क्या कह सकते हैं और हम कितना आश्वस्त हो सकते हैं?

मेरे बहुत सीमित आँकड़ों के ज्ञान के कारण, मुझे यह भी पता नहीं है कि वे प्रश्न आँकड़ों के दायरे में आते हैं या नहीं। लेकिन उन प्रकार के प्रश्न हैं जो मशीन सीखने वाले चिकित्सकों की परवाह नहीं करते हैं। शायद सांख्यिकीविदों को परवाह नहीं है? मुझे नहीं पता।


2
ब्रायन डी रिप्ले उपयोग पर उद्धृत किया गया है! 2004 के साथ "उत्तेजक रूप से विरोधाभास करने के लिए, मशीन सीखने के आंकड़े और मॉडल और मान्यताओं की किसी भी जाँच के साथ ऋण है।" वाक्यांश fortunesCRAN पर पैकेज का हिस्सा बन गया है । यह सिर्फ कहने के लिए, आप इंप्रेशन के साथ अकेले नहीं हैं, कि गणितीय कठोरता हमेशा मशीन सीखने में मुख्य चिंता का विषय नहीं है।
बर्नहार्ड

लियो ब्रिमन ने 2001 के अपने पेपर "स्टैटिस्टिकल मॉडलिंग: द टू कल्चर" में इस सवाल से बिल्कुल जूझते हैं , जो कि एक बेहतरीन रीड है।
skd

जवाबों:


6

पहले, मैं मशीन लर्निंग के लिए अलग दृष्टिकोण रखता। आपने जो उल्लेख किया है, एंड्रयू एनजी के कौरसेरा व्याख्यान और कागल प्रतियोगिता मशीन सीखने का 100% नहीं है, लेकिन कुछ शाखाएं हैं जो व्यावहारिक अनुप्रयोगों पर लक्षित हैं। रियल मशीन लर्निंग अनुसंधान वह काम होना चाहिए जो यादृच्छिक वन / एसवीएम / ग्रेडिंग बूस्टिंग मॉडल का आविष्कार करता है, जो आंकड़ों / गणित के काफी करीब है।

मैं सहमत हूँ कि मशीन सीखने वाले चिकित्सक सांख्यिकीविदों / अर्थशास्त्रियों की तुलना में सटीकता पर अधिक ध्यान केंद्रित करते हैं। ऐसे कारण हैं कि लोग "सही वितरण के बारे में अनुमान लगाने" के बजाय बेहतर सटीकता प्राप्त करने में रुचि रखते हैं। मुख्य कारण यह है कि हम डेटा एकत्र करते हैं और डेटा का उपयोग पिछले दशकों में बदल दिया गया है।

आंकड़े सौ साल के लिए स्थापित किए गए थे, लेकिन अतीत में, किसी ने भी नहीं सोचा होगा कि आपके पास प्रशिक्षण के लिए अरबों डेटा और परीक्षण के लिए अन्य अरबों डेटा हैं। (उदाहरण के लिए, इंटरनेट पर छवियों की संख्या)। इसलिए, डेटा की अपेक्षाकृत कम मात्रा के साथ, कार्य करने के लिए डोमेन ज्ञान से मान्यताओं की आवश्यकता होती है। या आप मॉडल को "नियमित" करने के बारे में सोच सकते हैं। एक बार जब धारणा बना ली गई थी, तो "सच्चे" वितरण के बारे में इनफ़ेक्शन समस्याएं हैं।

हालांकि, अगर हम ध्यान से इसके बारे में सोचते हैं, तो क्या हम यह सुनिश्चित कर सकते हैं कि ये धारणाएं सही हैं, और अनुमान वैध हैं? मैं जॉर्ज बॉक्स का हवाला देता हूं:

सभी मॉडल गलत हैं लेकिन कुछ उपयोगी हैं

अब, आइए धारणा / अनुमान से अधिक सटीकता पर जोर देने के लिए व्यावहारिक दृष्टिकोण के बारे में विचार करें। यह एक अच्छा तरीका है, जब हमारे पास भारी मात्रा में डेटा है।

मान लीजिए कि हम सभी छवियों के लिए एक मॉडल बना रहे हैं जिसमें पिक्सेल स्तर पर मानव चेहरे शामिल हैं। सबसे पहले, अरबों छवियों के लिए पिक्सेल स्तर पर मान्यताओं का प्रस्ताव करना बहुत कठिन है: किसी को भी उस डोमेन का ज्ञान नहीं है। दूसरा, हम डेटा को फिट करने के सभी संभावित तरीकों के बारे में सोच सकते हैं, और क्योंकि डेटा बहुत बड़ा है, हमारे पास मौजूद सभी मॉडल पर्याप्त नहीं हो सकते हैं (लगभग फिट होने के लिए असंभव है)।

यही कारण है कि, "डीप लर्निंग / न्यूरल नेटवर्क" फिर से लोकप्रिय हो गया। बड़े डेटा की स्थिति के तहत, हम एक मॉडल चुन सकते हैं जो वास्तव में जटिल है, और इसे जितना हम कर सकते हैं उतना ही फिट है, और हम अभी भी ठीक कर सकते हैं, क्योंकि हमारे कम्प्यूटेशनल संसाधन सीमित हैं, शब्द के सभी वास्तविक डेटा की तुलना में।

अंत में, यदि हमने जो मॉडल बनाया है, वह विशाल परीक्षण डेटा सेट में अच्छा है, तो वे अच्छे और मूल्यवान हैं, हालांकि हम अंडरलाइन धारणा या सच्चे वितरण को नहीं जान सकते हैं।


मैं चाहता हूं कि "अनुमान" शब्द का अलग-अलग समुदाय में अलग-अलग अर्थ है।

  • सांख्यिकी समुदाय में, इसका अर्थ आमतौर पर पैरामीट्रिक या गैर-पैरामीट्रिक तरीके से सही वितरण की जानकारी प्राप्त करना है।
  • मशीन सीखने वाले समुदाय में, इसका मतलब आमतौर पर दिए गए वितरण से कुछ संभावनाओं की गणना करना होता है। उदाहरण के लिए मर्फी के ग्राफिकल मॉडल ट्यूटोरियल देखें ।
  • मशीन लर्निंग में, लोग "वास्तविक वितरण के मापदंडों को प्राप्त करने" का प्रतिनिधित्व करने के लिए "लर्निंग" शब्द का उपयोग करते हैं, जो सांख्यिकी समुदाय में "अनुमान" के समान है।

तो, आप देख सकते हैं, अनिवार्य रूप से, मशीन लर्निंग में कई लोग "इंसर्शन" भी कर रहे हैं।

इसके अलावा, आप शिक्षाविदों के बारे में भी सोच सकते हैं जैसे "अपने काम को फिर से ब्रांड करना और बेचना": नए शब्दों के साथ आना शोध की नवीनता दिखाने के लिए सहायक हो सकता है। वास्तव में, कृत्रिम बुद्धिमत्ता, डेटा खनन और मशीन सीखने के बीच कई ओवरलैप्स हैं। और वे आँकड़ों और एल्गोरिथ्म डिजाइन से निकटता से संबंधित हैं। फिर से "निष्कर्ष" या नहीं करने के लिए कोई स्पष्ट सीमाएं नहीं हैं।


3
मैं देख सकता हूं कि आप कहां से आ रहे हैं। एक वैकल्पिक रूप हो सकता है: भविष्यवाणी = अवलोकन किए गए चर पर ध्यान दें, निष्कर्ष = छिपे हुए चर पर ध्यान दें। तो एक तरह से अनुमान नए प्रकार के मापों को उत्पन्न करने की कोशिश कर रहा है , जबकि भविष्यवाणी मापों की नई वास्तविकताओं के बारे में अधिक है जो सिद्धांत रूप में देखे जा सकते हैं ? (यह आपके उत्तर के साथ संगत है,)
जियोमैट 22
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.