मेरा प्रश्न निम्नलिखित तथ्य से आता है। मैं पोस्ट, ब्लॉग, लेक्चर और साथ ही मशीन लर्निंग पर किताबें पढ़ रहा हूं। मेरी धारणा यह है कि मशीन सीखने वाले चिकित्सक उन कई चीजों के प्रति उदासीन प्रतीत होते हैं जिनकी सांख्यिकीविद् / अर्थमिति देखभाल करती है। विशेष रूप से, मशीन सीखने वाले चिकित्सक अनुमान से अधिक भविष्यवाणी सटीकता पर जोर देते हैं।
ऐसा ही एक उदाहरण तब हुआ, जब मैं कोर्टेरा पर एंड्रयू एनजी की मशीन लर्निंग ले रहा था । जब उन्होंने सिंपल लाइनियर मॉडल की चर्चा की, तो उन्होंने अनुमानकर्ताओं की BLUE संपत्ति के बारे में कुछ भी उल्लेख नहीं किया, या कैसे हेटेरोसेडासिटी विश्वास अंतराल को "अमान्य" कर देगा। इसके बजाय, वह ढाल मूल कार्यान्वयन और क्रॉस सत्यापन / आरओसी वक्र की अवधारणा पर ध्यान केंद्रित करता है। ये विषय मेरी अर्थमिति / सांख्यिकी कक्षाओं में शामिल नहीं थे।
एक और उदाहरण तब हुआ जब मैंने कागल प्रतियोगिताओं में भाग लिया। मैं अन्य लोगों के कोड और विचार पढ़ रहा था। प्रतिभागियों का एक बड़ा हिस्सा सिर्फ SVM / यादृच्छिक वन / XGBoost में सब कुछ फेंक देता है।
फिर भी एक और उदाहरण स्टेप वाइज मॉडल चयन के बारे में है। इस तकनीक का व्यापक रूप से उपयोग किया जाता है, कम से कम ऑनलाइन और कागले पर। कई शास्त्रीय मशीन सीखने वाली पाठ्यपुस्तकें भी इसे कवर करती हैं, जैसे कि सांख्यिकीय शिक्षा का परिचय। हालाँकि, इस उत्तर के अनुसार (जो काफी ठोस है), स्टेप वाइज मॉडल चयन में विशेष रूप से समस्या का सामना करना पड़ता है, जब यह "सच्चे मॉडल की खोज" के लिए नीचे आता है। ऐसा लगता है कि केवल दो संभावनाएं हैं: या तो मशीन सीखने वाले चिकित्सकों को चरणबद्ध तरीके से समस्या का पता नहीं है, या वे करते हैं, लेकिन वे परवाह नहीं करते हैं।
तो यहाँ मेरे सवाल हैं:
- क्या यह सच है कि (सामान्य रूप से) मशीन सीखने वाले चिकित्सक भविष्यवाणी पर ध्यान केंद्रित करते हैं और इस प्रकार बहुत सी चीजों की परवाह नहीं करते हैं जो सांख्यिकीविद् / अर्थशास्त्री ध्यान रखते हैं?
- अगर यह सच है, तो इसके पीछे क्या कारण है? क्या यह इसलिए है क्योंकि कुछ अर्थों में अनुमान लगाना अधिक कठिन है?
- ऑनलाइन मशीन लर्निंग (या भविष्यवाणी) पर बहुत सारी सामग्रियां हैं। यदि मैं निष्कर्ष निकालने के बारे में जानने में दिलचस्पी रखता हूं, हालांकि, ऑनलाइन कुछ संसाधन क्या हैं जो मैं परामर्श कर सकता हूं?
अद्यतन : मुझे बस एहसास हुआ कि "अनुमान" शब्द संभावित रूप से बहुत सारे सामान का मतलब हो सकता है। मुझे "अनुमान" से क्या मतलब था जैसे सवालों का संदर्भ देता है
क्या कारण या वजह से ? या अधिक आम तौर पर, बीच कारण संबंध क्या हैं ?
चूंकि "सभी मॉडल गलत हैं", सच्चे मॉडल से "गलत" हमारा मॉडल कैसे है?
एक नमूने की जानकारी को देखते हुए, हम जनसंख्या के बारे में क्या कह सकते हैं और हम कितना आश्वस्त हो सकते हैं?
मेरे बहुत सीमित आँकड़ों के ज्ञान के कारण, मुझे यह भी पता नहीं है कि वे प्रश्न आँकड़ों के दायरे में आते हैं या नहीं। लेकिन उन प्रकार के प्रश्न हैं जो मशीन सीखने वाले चिकित्सकों की परवाह नहीं करते हैं। शायद सांख्यिकीविदों को परवाह नहीं है? मुझे नहीं पता।
fortunes
CRAN पर पैकेज का हिस्सा बन गया है । यह सिर्फ कहने के लिए, आप इंप्रेशन के साथ अकेले नहीं हैं, कि गणितीय कठोरता हमेशा मशीन सीखने में मुख्य चिंता का विषय नहीं है।