लीनियर रिग्रेशन को "मशीन लर्निंग" कब कहा जाना चाहिए?


90

हाल ही में एक बोलचाल में, स्पीकर के सार ने दावा किया कि वे मशीन लर्निंग का उपयोग कर रहे थे। बातचीत के दौरान, मशीन लर्निंग से जुड़ी एकमात्र बात यह थी कि वे अपने डेटा पर रैखिक प्रतिगमन करते हैं। 5 डी पैरामीटर स्पेस में सर्वश्रेष्ठ-फिट गुणांक की गणना के बाद, उन्होंने एक सिस्टम में इन गुणांक की तुलना अन्य प्रणालियों के सर्वश्रेष्ठ-फिट गुणांक से की।

जब लीनियर रिग्रेशन मशीन लर्निंग होती है , तो बस एक बेहतरीन-फिट लाइन खोजने का विरोध किया जाता है? (क्या शोधकर्ता का सार भ्रामक था?)

सभी ध्यान मशीन सीखने के साथ हाल ही में शुरू किया गया है, इस तरह के भेद करना महत्वपूर्ण है।

मेरा प्रश्न इस तरह का है , सिवाय इसके कि प्रश्न "रैखिक प्रतिगमन" की परिभाषा के लिए पूछता है, जबकि मेरा पूछता है कि जब रेखीय प्रतिगमन (जिसमें आवेदनों की एक व्यापक संख्या है) उचित रूप से "मशीन लर्निंग" कहा जा सकता है।

स्पष्टीकरण

मैं यह नहीं पूछ रहा हूं कि लीनियर रिग्रेशन मशीन लर्निंग के समान ही है। जैसा कि कुछ ने बताया है, एक एकल एल्गोरिथ्म अध्ययन के क्षेत्र का गठन नहीं करता है। मैं यह पूछ रहा हूं कि यह कहना सही है कि एक एल्गोरिथम का उपयोग करते समय मशीन लर्निंग कर रही है, बस एक रैखिक प्रतिगमन है।

सभी चुटकुले एक तरफ (टिप्पणियों को देखें), मेरे द्वारा पूछे जाने वाले कारणों में से एक यह है क्योंकि यह कहना अनैतिक है कि कोई आपके नाम में कुछ सोने के सितारों को जोड़ने के लिए मशीन लर्निंग कर रहा है यदि वे वास्तव में मशीन लर्निंग नहीं कर रहे हैं । (कई वैज्ञानिकों को अपने काम के लिए सबसे फिट लाइन किसी प्रकार की गणना, लेकिन इसका मतलब यह नहीं है कि वे मशीन सीखने कर रहे हैं।) दूसरी ओर, वहाँ स्पष्ट रूप से स्थितियां हैं जब रेखीय प्रतीपगमन है मशीन सीखने के हिस्से के रूप में इस्तेमाल किया जा रहा है। मैं इन स्थितियों को वर्गीकृत करने में मेरी मदद करने के लिए विशेषज्ञों की तलाश कर रहा हूं। ;-)


13
शायद आप धागा देखना चाहते हैं: " द टू कल्चर: स्टैटिस्टिक्स बनाम मशीन लर्निंग? "।
us --r11852

75
जब भी आप अपने रेट कार्ड पर शुल्क को दोगुना करना चाहते हैं, तो आपको अपने रिग्रेशन को 'मशीन लर्निंग' के रूप में बदलना चाहिए।
साइकोरैक्स

3
इसमे अंतर है। सीखना एक प्रक्रिया है। सबसे अच्छा फिट एक उद्देश्य है। नीचे मेरा जवाब देखें। सच कहूं तो, शब्दों का एक ही अर्थ नहीं है, हालांकि एक ही संदर्भ में दिखाई दे सकता है, जैसे "पक्षी उड़ते हैं", कोई दो को जोड़ सकता है, लेकिन पक्षी उड़ान नहीं है, और हालांकि उड़ान पक्षियों के लिए है, यह एफ के लिए है -18 फाइटर जेट्स भी।
कार्ल

20
@ साइकोरेक्स और गहन शिक्षा जब आप चौगुनी करना चाहते हैं
फ्रेंक डर्नोनकोर्ट

11
@FranckDernoncourt "मशीन सीखने की समस्याओं को हल करने के लिए बड़े डेटा वातावरण में गहरी शिक्षा का उपयोग कर मैं एक डेटा वैज्ञानिक हूं" लिंक्डइन प्रोफाइल के लिए एक अच्छा हेडर लगता है;)
टिम

जवाबों:


78

एक प्रश्न के साथ अपने प्रश्न का उत्तर देना: मशीन सीखना वास्तव में क्या है? ट्रेवर हैस्टी, रॉबर्ट टीबशिरानी और जेरोम फ्राइडमैन में सांख्यिकीय लर्निंग के तत्वों में, केविन पी मर्फी मशीन लर्निंग एक संभाव्य परिप्रेक्ष्य में, क्रिस्टोफर बिशप पैटर्न पहचान और मशीन लर्निंग में, इयान गुडफेलो, योशुआ बेंगियो और हारून Courville दीप लर्निंग और के एक नंबर अन्य मशीन लर्निंग "बाईबिल" मशीन लर्निंग "एल्गोरिदम" में से एक के रूप में रैखिक प्रतिगमन का उल्लेख करते हैं। मशीन लर्निंग आंशिक रूप से लागू आँकड़ों के लिए एक मूलमंत्र है और आँकड़ों और मशीन सीखने के बीच का अंतर अक्सर धुँधला होता है।


4
सच है, लेकिन वे बड़ी मात्रा में गैर-साहित्य, विधियों और एल्गोरिदमों के साथ बड़ी मात्रा में चुपचाप अनुशासित हैं। मिसाल के तौर पर, आज की दुनिया की मशीन लर्निंग, डेटा और कंप्यूटर साइंस में फंडिंग, ग्रांट और जॉब ऑप्स के मामले में सांख्यिकीय आवेदकों से आगे हैं।
माइक हंटर

6
@DJohnson तो यह नए पैकेज के साथ आँकड़े लागू किया गया है, उच्च कीमत पर बेचा जाता है ..? मुझे नहीं लगता कि यह तथ्य यह है कि यह ट्रेंडी है यह एक चर्चा नहीं करता है। बायेसियन आँकड़ों की भी अपनी विधियाँ, पत्रिकाएँ, सम्मेलन, हस्तपुस्तिकाएँ और अनुप्रयोग हैं जो शास्त्रीय आँकड़ों के साथ आंशिक रूप से गैर-अतिव्यापी हैं - क्या यह एक ऐसा अनुशासन है जो आँकड़ों के लिए अलग है?
टिम

3
हाँ। मैंने ML प्रेक्टर्स के बारे में अपने अवलोकन को और अधिक सामान्य अवलोकन के साथ नजरअंदाज करने की उपेक्षा की, जो चुपचाप, संकीर्ण रूप से केंद्रित चिकित्सकों को हर क्षेत्र और पेशे के लिए स्थानिक हैं , न कि केवल ML। यह एक तरह का व्यावसायिक खतरा है - मानव असफलता पढ़ें - कि लोग अपनी तत्काल जरूरतों और हितों के बाहर जानकारी के लिए अंधों को विकसित करते हैं। सीवी इसका अपवाद नहीं है।
माइक हंटर

23
(+1) मैं मानता हूं कि कोई स्पष्ट अंतर नहीं है। जितना मैं मतभेदों के बारे में सोचता हूं, मैं आमतौर पर एमएल के बारे में भविष्यवाणियों के साथ अधिक से अधिक के बारे में सोचता हूं , और पैरामीटर इन्वेंशन के साथ अधिक संबंधित (उदाहरण के लिए प्रतिक्रिया सतह मॉडलिंग के लिए प्रायोगिक डिजाइन एमएल में विशिष्ट नहीं होगा?)। तो उस अर्थ में, ओपी उदाहरण - जहां प्रतिगमन गुणांक सबसे अधिक चिंता का विषय लगता है - अधिक "आँकड़े-जैसा" (?) होगा
जियोमैट

3
यह भी देखें कि लियो ब्रिमन की दो संस्कृतियाँ जो @ GeoMatt22 के समान एक बिंदु बनाती हैं: ML सटीक भविष्यवाणी पर केंद्रित है। क्या मॉडल सच है महत्वपूर्ण नहीं है। शास्त्रीय आंकड़े "सच्चे" मॉडल की तलाश में हैं, कुछ अर्थों में, या कम से कम एक मॉडल जो प्रक्रियाओं में कुछ अंतर्दृष्टि देता है जो डेटा का उत्पादन करता है।
पीटर

41

रैखिक प्रतिगमन निश्चित रूप से एक एल्गोरिथ्म है जिसे मशीन सीखने में उपयोग किया जा सकता है। लेकिन, reductio ad absurdum : एक्सेल की एक प्रति वाला कोई भी एक रैखिक मॉडल फिट कर सकता है।

यहां तक ​​कि अपने आप को रैखिक मॉडल तक सीमित करना, मशीन सीखने पर चर्चा करने पर विचार करने के लिए कुछ और चीजें हैं:

  • व्यावसायिक समस्याओं पर मशीन सीखने में बहुत अधिक डेटा शामिल हो सकता है। " बिग डेटा ", यदि आप buzzword का उपयोग करना चाहते हैं। डेटा की सफाई और तैयारी वास्तविक मॉडलिंग की तुलना में अधिक काम कर सकती है। और जब डेटा की मात्रा एकल मशीन की क्षमता से अधिक हो जाती है, तो इंजीनियरिंग चुनौतियां सांख्यिकीय चुनौतियों जितनी महत्वपूर्ण होती हैं। (अंगूठे का नियम: यदि यह मुख्य मेमोरी में फिट बैठता है तो यह बड़ा डेटा नहीं है)।
  • मशीन लर्निंग में अक्सर पारंपरिक सांख्यिकीय मॉडल की तुलना में कई अधिक व्याख्यात्मक चर (विशेषताएं) शामिल होती हैं। शायद दर्जनों, कभी-कभी उनमें से भी सैकड़ों, जिनमें से कुछ कई स्तरों के साथ श्रेणीबद्ध चर होंगे। जब ये विशेषताएं संभावित रूप से बातचीत कर सकती हैं (जैसे एक क्रॉस प्रभाव मॉडल में) तो फिट होने के लिए संभावित मॉडल की संख्या तेजी से बढ़ती है।
  • मशीन लर्निंग प्रैक्टिशनर आमतौर पर व्यक्तिगत विशेषताओं के महत्व से कम चिंतित होता है, और मॉडल से बाहर जितना संभव हो, उतनी अधिक भविष्य कहनेवाला शक्ति निचोड़ने के साथ संबंधित होता है, जो भी सुविधाओं के संयोजन का उपयोग करता है। (पी-मान स्पष्टीकरण से जुड़े हैं, न कि भविष्यवाणी के साथ।)
  • बड़ी संख्या में सुविधाओं के साथ, और इंजीनियरिंग के विभिन्न तरीकों से उन विशेषताओं, हाथ से मॉडल का चयन संभव हो जाता है। मेरी राय में, मशीन लर्निंग में वास्तविक चुनौती सुविधाओं (फीचर इंजीनियरिंग) और मॉडल विनिर्देश के अन्य पहलुओं का स्वचालित चयन है । एक रेखीय मॉडल के साथ ऐसा करने के विभिन्न तरीके हैं, आमतौर पर जानवर बल के वेरिएंट; चरण-वार प्रतिगमन, बैक एलिमिनेशन आदि सहित, जिनमें से सभी को फिर से महत्वपूर्ण कंप्यूटिंग शक्ति की आवश्यकता होती है। (अंगूठे का दूसरा नियम: यदि आप हाथ से सुविधाओं का चयन कर रहे हैं, तो आप आंकड़े सीख रहे हैं, मशीन सीखने के नहीं)।
  • जब आप स्वचालित रूप से कई विशेषताओं के साथ कई मॉडल फिट करते हैं, तो ओवर-फिटिंग एक गंभीर संभावित मुद्दा है। इस समस्या से निपटने में अक्सर क्रॉस सत्यापन का कुछ रूप शामिल होता है : यानी अभी तक अधिक क्रूर बल गणना!

मेरे दृष्टिकोण से संक्षिप्त उत्तर, यह है कि जहां मशीन लर्निंग पारंपरिक सांख्यिकीय मॉडलिंग से भटकती है, यह ब्रूट बल और मॉडल चयन के लिए संख्यात्मक दृष्टिकोणों के अनुप्रयोग में है, विशेष रूप से बड़ी मात्रा में डेटा और स्पष्टीकरण चर की एक बड़ी संख्या के साथ डोमेन में। मॉडल सत्यापन के लिए अधिक क्रूर बल के बाद, पूर्वानुमानात्मक शक्ति पर ध्यान केंद्रित करने के साथ।


2
मुझे यह भेद सामान्य रूप से पसंद है। हालांकि, "वैधानिक" मॉडल में कभी भी क्रॉस-मान्यता का उपयोग किया जाता है या क्या यह शायद ही कभी आवश्यक होता है क्योंकि वे आमतौर पर हाथ से किया जाता है? क्या फीचर इंजीनियरिंग को आँकड़े माना जाता है, जैसा कि यह हाथ से किया जाता है?
josh

3
@ जोश, हाँ, यह हो सकता है। लेकिन यदि आप क्रॉस सत्यापन टैग को देखते हैं, तो लगभग सभी प्रश्न अनुमानित मॉडलिंग के बारे में हैं।
david25272

@ david25272 मैं उत्सुक हूं कि आप बूटस्ट्रैप, .632+ बूटस्ट्रैप, और क्रमपरिवर्तन परीक्षणों के बारे में कैसे सोचते हैं - मैंने हमेशा सोचा है कि "मशीन लर्निंग" की तुलना में "लागू आंकड़ों" की तुलना में वे कैसे हैं। प्रेरित हैं, लेकिन वे इसी तरह "ब्रूट-फोर्स" को k- गुना या लीव-के-आउट-क्रॉस-वैलीडेशन के लिए करते हैं। मुझे लगता है कि L1 नियमितीकरण को एक सांख्यिकीय ढांचे के भीतर एक प्रकार के फ़ीचर चयन के रूप में भी सोचा जा सकता है ...
पैट्रिक बी।

@Patrick आँकड़े . stackexchange.com/questions/18348 मॉडल सत्यापन के लिए बूटस्ट्रैपिंग के उपयोग पर एक बेहतर उत्तर है जितना मैं दे सकता था।
david25272

@ david25272 आह, क्षमा करें, मेरा प्रश्न अधिक था कि क्या आप उन्हें "मशीन लर्निंग" तकनीक या "लागू आँकड़े" तकनीक के रूप में सोचते हैं, क्योंकि वे सांख्यिकीय रूप से प्रेरित हैं, लेकिन "जानवर बल" भी हैं। मैं मॉडल सत्यापन के लिए पूर्वाग्रह-सुधारित बूटस्ट्रैप के उपयोग से परिचित हूं।
पैट्रिक बी।

14

मुझे लगता है कि मिशेल की परिभाषा मशीन सीखने की चर्चा को आधार बनाने के लिए एक उपयोगी तरीका प्रदान करती है, पहले सिद्धांत का एक प्रकार। विकिपीडिया पर पुन : प्रस्तुत :

एक कंप्यूटर प्रोग्राम को कहा जाता है कि वह अनुभव E से कुछ कार्यों के वर्ग T और प्रदर्शन माप P के संबंध में सीखे, यदि T से कार्यों में उसका प्रदर्शन, जैसा कि P द्वारा मापा जाता है, अनुभव E से सुधरता है।

यह कुछ मायनों में मददगार है। सबसे पहले, अपने तात्कालिक प्रश्न के लिए: प्रतिगमन मशीन लर्निंग है जब इसका कार्य कुछ एप्लिकेशन में अनुमानित सुविधाओं से अनुमानित मूल्य प्रदान करना है। इसके प्रदर्शन में सुधार होना चाहिए, क्योंकि मापी गई चौकोर (या निरपेक्ष, इत्यादि) त्रुटि के रूप में मापी जाती है, क्योंकि यह अधिक डेटा का अनुभव करती है।

दूसरा, यह संबंधित शर्तों से डेलीनेट मशीन सीखने में मदद करता है, और इसका उपयोग एक विपणन चर्चा के रूप में होता है। एक मानक, ह्रासमान प्रतिगमन के साथ ऊपर कार्य का विरोध करें, जिसमें एक विश्लेषक महत्वपूर्ण संबंधों के लिए गुणांक की व्याख्या करता है। यहां कार्यक्रम एक सारांश लौटाता है: गुणांक, पी-मान, आदि। कार्यक्रम को अनुभव के साथ इस प्रदर्शन को बेहतर बनाने के लिए नहीं कहा जा सकता है; कार्य विस्तृत गणना है।

अंत में, यह मशीन लर्निंग सब फील्ड्स को एकजुट करने में मदद करता है, जो आमतौर पर इंट्रोडक्टरी एक्सपोज़र (सुपरवाइज्ड, अनसुप्राइज़) में इस्तेमाल किया जाता है, जैसे कि सुदृढीकरण सीखने या घनत्व के आकलन जैसे अन्य। (प्रत्येक के पास एक कार्य, प्रदर्शन माप और अनुभव की अवधारणा है, यदि आप उन पर पर्याप्त सोचते हैं।) यह प्रदान करता है, मुझे लगता है, एक समृद्ध परिभाषा जो दो क्षेत्रों को अनावश्यक रूप से कम करने के बिना या तो कम करने में मदद करती है। एक उदाहरण के रूप में, "एमएल भविष्यवाणी के लिए है, अनुमान के लिए आंकड़े" पर्यवेक्षण सीखने के बाहर दोनों मशीन सीखने की तकनीक की उपेक्षा करते हैं, और सांख्यिकीय तकनीक जो भविष्यवाणी पर ध्यान केंद्रित करते हैं।


12

ऐसा कोई कानून नहीं है जो कहता है कि एक कैबिनेट निर्माता एक बैरल निर्माता की आरा का उपयोग नहीं कर सकता है।

मशीन लर्निंग और सांख्यिकी अस्पष्ट लेबल हैं, लेकिन अगर अच्छी तरह से परिभाषित किया गया है तो आंकड़े और मशीन सीखने के बीच बहुत अधिक ओवरलैप है। और यह इन दो क्षेत्रों के तरीकों के साथ-साथ (और अलग से) उन लोगों के लिए जाता है जो इन दोनों क्षेत्रों के साथ खुद को लेबल करते हैं। लेकिन जहां तक ​​गणित जाता है, मशीन लर्निंग पूरी तरह से आंकड़ों के क्षेत्र में है।

रैखिक प्रतिगमन एक बहुत अच्छी तरह से परिभाषित गणितीय प्रक्रिया है। मैं इसे सांख्यिकी के क्षेत्र और ऐसे लोगों के साथ जोड़ना चाहता हूं, जो खुद को 'सांख्यिकीविद्' कहते हैं और जो 'सांख्यिकी' जैसे लेबल वाले शैक्षणिक कार्यक्रमों से बाहर आते हैं। एसवीएम (सपोर्ट वेक्टर मशीन) इसी तरह बहुत अच्छी तरह से परिभाषित गणितीय प्रक्रिया है जिसमें कुछ समान इनपुट और आउटपुट होते हैं और समान समस्याओं को हल करते हैं। लेकिन मैं इसे मशीन लर्निंग के क्षेत्र के साथ जोड़ना चाहता हूं और ऐसे लोग जो खुद को कंप्यूटर वैज्ञानिक या ऐसे लोग कहते हैं जो कृत्रिम बुद्धिमत्ता या मशीन लर्निंग में काम करते हैं जिन्हें एक विधा के रूप में कंप्यूटर विज्ञान का हिस्सा माना जाता है।

लेकिन कुछ सांख्यिकीविद् SVM का उपयोग कर सकते हैं और कुछ AI लोग लॉजिस्टिक रिग्रेशन का उपयोग करते हैं। बस स्पष्ट होने के लिए, यह अधिक संभावना है कि एक सांख्यिकीविद् या एआई शोधकर्ता वास्तव में व्यावहारिक उपयोग के लिए एक विधि विकसित करेगा ।

मैंने मशीन लर्निंग के सभी तरीकों को आंकड़ों के क्षेत्र के अंदर वर्गाकार तरीके से रखा है। यहां तक ​​कि डीप लर्निंग, आरएनएन, सीएनएन, एलएसटीएम, सीआरएफ जैसी हाल की चीजें। एक लागू सांख्यिकीविद (बायोस्टैटिस्टियन, एग्रोनोमिस्ट) अच्छी तरह से उनसे परिचित नहीं हो सकता है। वे सभी पूर्वानुमान मॉडलिंग के तरीके हैं जो आमतौर पर 'मशीन लर्निंग' के साथ लेबल किए जाते हैं, और शायद ही कभी आँकड़ों से जुड़े होते हैं। लेकिन वे कर रहे हैं पूर्वानुमान आधारित मॉडल, भत्ता कि वे सांख्यिकीय तरीकों का उपयोग कर आंका जा सकता है के साथ।

अंत में, लॉजिस्टिक रिग्रेशन को मशीन लर्निंग का हिस्सा माना जाना चाहिए।

लेकिन, हाँ, मैं देख रहा हूं और अक्सर इन शब्दों के गलत इस्तेमाल के लिए आपकी अरुचि साझा करता हूं। रेखीय प्रतिगमन सांख्यिकी नामक चीजों का एक ऐसा मूलभूत हिस्सा है जिसे इसके उपयोग को 'मशीन लर्निंग' कहना बहुत अजीब और भ्रामक लगता है

वर्णन करने के लिए, लॉजिस्टिक रिग्रेशन गणितीय रूप से डीप लर्निंग नेटवर्क के समान है जिसमें कोई छिपा नोड नहीं है और एकल आउटपुट नोड के लिए सक्रियण फ़ंक्शन के रूप में लॉजिस्टिक फ़ंक्शन है। मैं लॉजिस्टिक रिग्रेशन को मशीन लर्निंग विधि नहीं कहूंगा, लेकिन इसका उपयोग मशीन लर्निंग संदर्भों में निश्चित रूप से किया जाता है।

यह ज्यादातर उम्मीद का मुद्दा है।

ए: "मैंने हृदय की सर्जरी के बाद अस्पताल में पठन-पाठन की भविष्यवाणी करने के लिए मशीन लर्निंग का इस्तेमाल किया।"

बी: "ओह यस? डीप लर्निंग? रैंडम फ़ॉरेस्ट? !!"

एक: "ओह, नहीं, कुछ भी नहीं फैंसी के रूप में, बस लॉजिस्टिक प्रतिगमन।"

बी: बेहद निराश रूप

यह कहने जैसा है कि जब आप क्वांटम केमिस्ट्री का उपयोग कर रहे हैं तो पानी से खिड़की धो लें। ठीक है हाँ यकीन है कि तकनीकी रूप से गलत नहीं है, लेकिन आप एक बहुत अधिक क्या जरूरत से ज्यादा का मतलब है।

लेकिन वास्तव में, यह बिल्कुल एक संस्कृति अंतर बनाम एक पदार्थ अंतर है। एक शब्द और लोगों के समूहों के साथ जुड़ाव (एलआर पूरी तरह से एमएल नहीं है!) बनाम गणित और अनुप्रयोग (एलआर पूरी तरह से एमएल है!)।


3
लॉजिस्टिक रिग्रेशन भी बहुत ही समान है, व्यावहारिक रूप से और सैद्धांतिक रूप से, एसवीएम दोनों के लिए: web.stanford.edu/~hastie/Papers/svmtalk.pdf
पैट्रिक बी।

3

आम दृश्य यह है कि मशीन लर्निंग 4 क्षेत्रों से बना है:

1) आयाम में कमी

2) क्लस्टरिंग

3) वर्गीकरण

4) रिग्रेशन

रैखिक प्रतिगमन एक प्रतिगमन है। एक बार जब मॉडल को प्रशिक्षित किया जाता है, तो इसे किसी अन्य की तरह भविष्यवाणियों के लिए इस्तेमाल किया जा सकता है, कहते हैं, रैंडम फॉरेस्ट रिग्रेशन।


वास्तव में एक अंतर है, हालांकि मशीन लर्निंग का उपयोग करके रैखिक प्रतिगमन को हल किया जा सकता है। एक सामान्य प्रतिगमन लक्ष्य सामान्य कम से कम वर्ग है, जिसका अर्थ है, कि हमारा लक्ष्य हानि फ़ंक्शन, राशि चुकता अवशिष्ट, को कम से कम किया जाना है। अब, मशीन लर्निंग बस उस विधि को संदर्भित करेगा जिसके द्वारा हम एक हानि फ़ंक्शन को कम करते हैं।
कार्ल

इस प्रकार, वैचारिक रूप से, ग्रेडिएंट डिसेंट (लर्निंग) के माध्यम से रैखिक प्रतिगमन बेहतर और बेहतर सारांशित वर्ग अवशिष्ट (हानि फ़ंक्शन) चुनता है। बुनियादी अवधारणाएं बहुत अधिक उन्नत लर्निंग एल्गोरिदम के लिए समान हैं, जैसे कि तंत्रिका नेटवर्क। ये एल्गोरिदम बस रैखिक मॉडल को बहुत अधिक जटिल मॉडल के साथ बदल देते हैं - और, इसी तरह, एक अधिक जटिल लागत फ़ंक्शन।
कार्ल

1
तो ओपी सवाल का जवाब जब लीनियर रिग्रेशन मशीन लर्निंग है, जैसा कि केवल एक सबसे फिट लाइन खोजने के विपरीत है? जब लीनियर रिग्रेशन मशीन लर्निंग के एक निश्चित तत्व का उपयोग करके किया जाता है, जैसे ढाल डिसेंट , तो यह लीनियर रिग्रेशन मशीन लर्निंग का उपयोग करके किया जाता है।
कार्ल

5
@ कार्ल, यहाँ समस्या यह है कि "मशीन लर्निंग" को परिभाषित किया गया है। मेरे लिए अगर हम एक सांख्यिकीय मॉडल का उपयोग कर सकते हैं, और उस मॉडल में मशीन सीखने की भविष्यवाणी करने की क्षमता होगी। और इससे कोई फर्क नहीं पड़ता कि मॉडल के गुणांक खोजने के लिए किस दृष्टिकोण का उपयोग किया गया था।
अकवाल

1
मुझे अकवाल का जवाब बहुत स्पष्ट लगा। मेरा मानना ​​है कि अकवाल की समस्या यह है कि आपके द्वारा प्रस्तुत परिभाषा परिपत्र है, क्योंकि यह "Q: जब तकनीक X को 'मशीन लर्निंग' के रूप में गिना जाता है? एक: जब तकनीक X को मशीन सीखने के एक निश्चित तत्व का उपयोग करके प्रदर्शित किया जाता है।" (दुर्भाग्य से मुझे समझ नहीं आ रहा है कि आप जो दूसरा बिंदु बना रहे हैं, मैं उसका जवाब नहीं दे सकता।)
पैट्रिक बी।

2

रैखिक प्रतिगमन एक तकनीक है, जबकि मशीन लर्निंग एक लक्ष्य है जिसे विभिन्न साधनों और तकनीकों के माध्यम से प्राप्त किया जा सकता है।

इसलिए प्रतिगमन प्रदर्शन को मापा जाता है कि यह एक अपेक्षित रेखा / वक्र के कितने करीब है, जबकि मशीन लर्निंग को इस बात से मापा जाता है कि यह एक निश्चित समस्या को हल कर सकता है, जो भी आवश्यक हो।


2

मैं तर्क दूंगा कि मशीन सीखने और सांख्यिकीय निष्कर्ष के बीच अंतर स्पष्ट है। संक्षेप में, मशीन लर्निंग = भविष्य की टिप्पणियों की भविष्यवाणी ; आँकड़े = स्पष्टीकरण।

यहां मेरी रुचि के क्षेत्र (दवा) से एक उदाहरण है: एक दवा विकसित करते समय, हम जीन (एस) की खोज करते हैं जो एक रोग की स्थिति को सबसे अच्छी तरह से समझाते हैं, इसे दवा के साथ लक्षित करने का लक्ष्य है। हम उसके लिए स्टेटिस्टिस का उपयोग करते हैं। इसके विपरीत, जब नैदानिक ​​परीक्षण विकसित करते हैं, उदाहरण के लिए यह भविष्यवाणी करते हुए कि क्या दवा एक रोगी की मदद करेगी, तो लक्ष्य सख्ती से भविष्य के परिणाम का सबसे अच्छा भविष्यवक्ता ढूंढ रहा है, भले ही इसमें कई जीन शामिल हों और समझने के लिए बहुत जटिल हो। हम इस उद्देश्य के लिए मशीन लर्निंग का उपयोग करते हैं। कई प्रकाशित उदाहरण हैं [1], [२], [३], [४] दवा लक्ष्य की उपस्थिति यह दर्शाती है कि उपचार के परिणाम का एक अच्छा भविष्यवक्ता नहीं है, इसलिए भेद।

इसके आधार पर, यह कहना उचित होगा कि व्यक्ति मशीन लर्निंग कर रहा है जब लक्ष्य भविष्य के / पहले अनदेखी टिप्पणियों के कड़ाई से अनुमान लगा रहा है। यदि लक्ष्य एक विशेष घटना को समझ रहा है, तो यह सांख्यिकीय निष्कर्ष है, न कि मशीन सीखना। जैसा कि दूसरों ने बताया है, यह इस पद्धति की परवाह किए बिना सच है।

आपके प्रश्न का उत्तर देने के लिए: आपके द्वारा वर्णित विशिष्ट शोध में, वैज्ञानिक विभिन्न रेखीय प्रतिगमन मॉडल में कारक भूमिकाओं (भार) की तुलना कर रहे थे, मॉडल सटीकता की तुलना नहीं कर रहे थे। इसलिए, उनके आविष्कार मशीन सीखने को कॉल करना सटीक नहीं है।

[१] मेसर्समिथ वा, अहेन डीजे। कोलोरेक्टल कैंसर में ईजीएफआर को लक्षित करना। न्यू इंग्लैंड जरनल ऑफ़ मेडिसिन; 2008; 359; 17।

[२] पोग-जाइल केएल एट अल। NSABP ट्रायल B-31 में सहायक Trastuzumab से लाभ की डिग्री की भविष्यवाणी। जे नटल कैंसर का उदाहरण; 2013; 105: 1782-1788।

[३] वेमुराफेनिब के लिए पाज़दुर आर। एफडीए अनुमोदन। https://www.cancer.gov/about-cancer/treatment/drugs/fda-vemurafenib । 3 जुलाई 2013 को अपडेट किया गया।

[४] रे टी। दो ASCO स्टडीज एनएससीएलसी ड्रग ट्रायल में प्रीडिक्टिव मार्कर के रूप में मेट सिग्नलिंग का उपयोग करने की चुनौती। जीनोमवेब, 11 जून 2014।


7
मैं सहमत हूँ कि मशीन लर्निंग रिसर्च में पैरामीटर अनुमान से अधिक भविष्यवाणियों पर अधिक जोर दिया गया है। लेकिन यह एक स्पष्ट विभाजन रेखा नहीं है: सांख्यिकी अनुसंधान भविष्य कहनेवाला तरीकों से समृद्ध है।
क्लिफ एबी

4
तो कंप्यूटर के अस्तित्व में आने से पहले (या व्यापक रूप से उपलब्ध) भविष्यवाणी करने वाले सांख्यिकीविदों का क्या ? वे कागज और पेंसिल मशीन सीखने लागू कर रहे थे ?!
टिम

1
@ समय: बहुत अच्छा तर्क। मेरा मानना ​​है कि उत्तर हां है अगर वे भविष्य की टिप्पणियों पर ध्यान केंद्रित कर रहे थे, हालांकि मैं उन (दुर्लभ) मामलों में स्वीकार करता हूं कि नाम सांख्यिकीय शिक्षा अधिक उपयुक्त होगी। कंप्यूटर के आगमन के साथ, मशीन लर्निंग शब्द अधिक फैशनेबल हो गया। बिंदु नाम नहीं है, और न ही कंप्यूटर का उपयोग; यह उद्देश्य की स्पष्टता है। मेरे विचार में, पहले अनदेखी टिप्पणियों और घटना की समझ दोनों सटीक भविष्यवाणी को सफलतापूर्वक अनुकूलित करना लगभग असंभव है। उचित रूप से ध्यान केंद्रित करने के लिए बेहतर है।
लजुबोमिर

4
टाइम सीरीज़ फोरकास्टिंग (भविष्य के अवलोकन की भविष्यवाणी) लंबे समय से सांख्यिकी (और अर्थमिति) में एक लोकप्रिय समस्या थी, इसलिए मैं इसके आधार पर स्पष्ट अंतर से सहमत नहीं हूं।
रिचर्ड हार्डी

1
यह जवाब फर्जी है। भविष्यवाणी मशीन सीखने का सिर्फ एक छोटा सा हिस्सा है। सांख्यिकीविद भी भविष्यवाणी करते हैं। हालांकि मशीन लर्निंग और आंकड़ों के बीच में बदलाव करना कठिन है, लेकिन यह निश्चित रूप से सही तरीका नहीं है।
रोबिनगिनेंस

2

यह लीनियर रिग्रेशन मशीन लर्निंग को कॉल करने के लिए उपयोगी हो सकता है क्योंकि ऐसा करने से आमतौर पर एक दंपती के बारे में महत्वपूर्ण बातें पता चलती हैं कि आप अपनी समस्या को कैसे हल करते हैं:

  1. आपने तय किया कि अपने व्याख्यात्मक चर के पीछे कारण मान्यताओं और पूर्व सिद्धांत की जांच करना आवश्यक नहीं था। यह संकेत देता है कि आपका मॉडल व्याख्या करने का नहीं बल्कि भविष्यवाणी करने का था। यह बहुत सारी सेटिंग्स में उचित है, उदाहरण के लिए, कीवर्ड के आधार पर ईमेल स्पैम की भविष्यवाणी करना। वास्तव में बहुत सारा साहित्य नहीं है जिस पर शब्द स्पैम की भविष्यवाणी करते हैं, और बहुत सारे शब्द हैं जो प्रत्येक शब्द के सैद्धांतिक महत्व के माध्यम से सोचने का कोई मतलब नहीं है
  2. आपने चर महत्व की जांच नहीं की या पी-मान का उपयोग नहीं किया, बल्कि संभावित रूप से आउट-ऑफ-सैंपल प्रेडिक्टिव प्रदर्शन का आकलन करने के लिए होल्डआउट सेट या क्रॉस सत्यापन के लिए चुना। यह पूरी तरह से मान्य हो सकता है अगर - वापस ईमेल स्पैम उदाहरण के लिए - यदि वास्तव में आप सभी के बारे में परवाह है कि एक मॉडल है कि प्रभावी ढंग से स्पैम की भविष्यवाणी करता है, भले ही यह चर है कि पारंपरिक महत्व परीक्षण पास नहीं हो सकता है की कीमत पर आता है।

हालाँकि, यदि आपका मॉडल पूर्वानुमान की तुलना में व्याख्या करने के लिए अधिक इच्छुक है, और आप अपने मॉडल की सैद्धांतिक कारण धारणाओं आदि की कठोरता से जाँच करते हैं, तो हाँ, इसे मशीन लर्निंग कहना मूर्खतापूर्ण है।


2

जाहिर है, इस प्रश्न का कोई भी उत्तर वस्तुनिष्ठ तथ्य से अधिक राय है, लेकिन मैं अपने तर्क को रखने की कोशिश करूंगा कि मुझे क्यों लगता है कि उत्तर कभी नहीं है । कोई भी तथाकथित मशीन लर्निंग विशेषज्ञ या प्रशिक्षक केवल रेखीय प्रतिगमन का प्रतिनिधित्व करके अपनी अज्ञानता को प्रकट करता है।

अकादमिक विषयों का परिसीमन तरीकों की तुलना में समुदायों के परिसीमन के बारे में अधिक है। वैज्ञानिक अनुशासन हर समय अनुशासनात्मक तरीकों से उधार लेते हैं। इसके अलावा, 19 वीं शताब्दी में (जब रेखीय प्रतिगमन विकसित किया गया था) और उससे पहले, वैज्ञानिक विषयों को इतनी स्पष्ट रूप से चित्रित नहीं किया गया था जैसा कि वे आज हैं। इसलिए विशेष रूप से जब 19 वीं शताब्दी या पूर्व में तरीके विकसित किए गए थे, तो हमें उन्हें एक विशेष अनुशासन के लिए आवंटित करने के लिए सावधान रहना चाहिए।

यह कहा जा रहा है, एक अनुशासन के इतिहास को देख सकता है और उचित निष्कर्ष निकाल सकता है कि विशेष तरीके एक अनुशासन या किसी अन्य के लिए "संबंधित" हैं। आज कोई भी यह नहीं कहेगा कि कैलकुलस भौतिकी के क्षेत्र से संबंधित है, भले ही न्यूटन, जो कैलकुलस के अन्वेषकों में से एक थे, निश्चित रूप से भौतिकी में इसे लागू करने की कोशिश कर रहे थे। कैलकुलस स्पष्ट रूप से गणित के अनुशासन का है, भौतिकी का नहीं। ऐसा इसलिए है क्योंकि कैलकुलस एक सामान्य गणितीय विधि है जिसका उपयोग भौतिकी संदर्भों के बाहर पूरी तरह से किया जा सकता है।

उसी तर्क से, रैखिक प्रतिगमन आँकड़ों के अनुशासन के अंतर्गत आता है, भले ही इसका उपयोग आमतौर पर मशीन लर्निंग के संदर्भ में एक मॉडल को फिटिंग डेटा के सरल उदाहरण के रूप में किया जाता है। जिस तरह कलन का उपयोग भौतिक विज्ञान के संदर्भ में किया जा सकता है, मशीन लर्निंग के संदर्भ में रैखिक प्रतिगमन (और) का उपयोग किया जा सकता है।

मशीन लर्निंग इंस्ट्रक्टर यह बताने के लिए बुद्धिमान होंगे कि 19 वीं सदी के उत्तरार्ध से मशीन लर्निंग की आधुनिक धारणा अस्तित्व में आने से पहले से ही रैखिक प्रतिगमन उपयोग में है। उन्हें इस बात पर भी जोर देना चाहिए कि मशीन लर्निंग संभाव्यता और आंकड़ों के साथ-साथ अन्य विषयों (जैसे सूचना सिद्धांत) से कई अवधारणाओं का उपयोग करता है। हालांकि, ये अवधारणाएं मशीन सीखने या मशीन सीखने के "एल्गोरिथम" का प्रतिनिधित्व नहीं करती हैं।


1

यह मशीन है, बेवकूफ!

मैं न तो सांख्यिकीविद् हूं और न ही बिग डाटा (टीएम) विशेषज्ञ। हालांकि, मैं कहूंगा कि आवश्यक अंतर यह है कि "मशीन लर्निंग" के लिए "एक मशीन" की आवश्यकता होती है। विशेष रूप से, इसका तात्पर्य एजेंसी से है । परिणाम मानव द्वारा इत्मीनान से नहीं खाया जाएगा। बल्कि, परिणाम एक बंद चक्र के लिए इनपुट होगा जिससे एक स्वचालित प्रणाली अपने प्रदर्शन में सुधार करती है।

बंद सिस्टम

यह सीन ईस्टर के उत्तर के अनुरूप है, लेकिन मैं केवल इस बात पर जोर देना चाहता हूं कि व्यावसायिक अनुप्रयोगों में, एक मशीन परिणाम देख रही है और उन पर अभिनय कर रही है । एक क्लासिक उदाहरण सिनेमैच एल्गोरिथ्म है जो नेटफ्लिक्स पुरस्कार का लक्ष्य था। एक मानव CineMatch के उत्पादन को देख सकता है और फिल्म दर्शकों के बारे में दिलचस्प विशेषताएं सीख सकता है। लेकिन यह मौजूद नहीं है। CineMatch का उद्देश्य एक ऐसा तंत्र प्रदान करना है जिसके द्वारा Netflix सर्वर ग्राहकों को फिल्में सुझा सकते हैं कि वे आनंद लेंगे। सांख्यिकीय मॉडल का आउटपुट अनुशंसाकर्ता सेवा में चला जाता है, जो अंततः ग्राहकों की दर वाली फिल्मों के रूप में अधिक इनपुट का उत्पादन करता है, जिनमें से कुछ को सिनेमैच की सलाह पर चुना गया था।

खुली प्रणाली

दूसरी ओर, यदि एक शोधकर्ता सांख्यिकीय परिणामों का उत्पादन करने के लिए एक एल्गोरिथ्म का उपयोग करता है जो अन्य मनुष्यों के लिए एक प्रस्तुति में प्रदर्शित होते हैं, तो वह शोधकर्ता मशीन सीखने में सबसे अधिक निश्चित रूप से आकर्षक नहीं है । यह मेरे लिए काफी स्पष्ट है, मानव शिक्षा । विश्लेषण एक मशीन द्वारा किया जाता है, लेकिन यह एक ऐसी मशीन नहीं है जो सीखने का काम कर रही है , प्रति से। अब, यह "मशीन लर्निंग" है इस हद तक कि एक मानव मस्तिष्क ने सभी नमूना आदानों का अनुभव नहीं किया और सांख्यिकीय परिणामों को "जैविक रूप से" प्राप्त किया। लेकिन मैं इसे "आँकड़े" कहूंगा क्योंकि यह वही है जो क्षेत्र का आविष्कार करने के बाद से सांख्यिकीविद कर रहे हैं।

निष्कर्ष

इस प्रकार, मैं इस प्रश्न का उत्तर यह पूछ कर दूंगा: "परिणाम कौन खाता है?" यदि उत्तर है: "मनुष्य", तो यह "आंकड़े" हैं। यदि उत्तर है: "सॉफ्टवेयर", तो यह "मशीन लर्निंग" है। और जब हम कहते हैं कि "सॉफ्टवेयर परिणामों का उपभोग करता है", तो हमारा मतलब यह नहीं है कि यह इसे बाद में पुनर्प्राप्ति के लिए कहीं संग्रहीत करता है। हमारा मतलब है कि यह व्यवहार करता है जो एक बंद लूप में परिणामों से निर्धारित होता है


8
यह एक उचित बिंदु है, लेकिन मुझे लगता है कि व्यवहार में एमएल मॉडल अक्सर लोगों को व्याख्या और काम करने के लिए दिए जाते हैं।
गंग

1
मैं कहूंगा कि क्योंकि एक क्षेत्र के रूप में एमएल ने सांख्यिकीविदों द्वारा उपयोग किए जाने वाले विभिन्न प्रकार के उपयोगी उपकरणों को जन्म दिया है , भले ही वे खुद को विपणन उद्देश्यों के लिए क्या कहना चाहते हैं। ;)
Lawnmower मैन

मैं @gung से दृढ़ता से सहमत हूं; अन्य उत्तरों के समान, मैं मानता हूं कि यह अधिक बार उन लोगों के लिए प्रेरणा है जो खुद को "एमएल शोधकर्ता" कहते हैं, यह निश्चित रूप से एक परिभाषित रेखा नहीं है। दो काउंटर उदाहरण: अनुशंसाकर्ता सिस्टम को एक एमएल अनुसंधान क्षेत्र माना जाता है, लेकिन परिणाम सीधे एक मानव को खिलाया जाता है। कलमन फ़िल्टर को अक्सर ऑटो-पायलट के लिए नेविगेशन में उपयोग किया जाता है, लूप में कोई मानव नहीं है, फिर भी आमतौर पर एक सांख्यिकी पद्धति माना जाता है।
क्लिफ एबी

-1

मेरी राय में, कोई मशीन सीखने की बात कर सकता है जब कोई मशीन कुछ डेटा का उपयोग करके किसी मॉडल के अनुमानित मापदंडों के लिए प्रोग्राम की जाती है।

यदि मशीन द्वारा एक रेखीय प्रतिगमन किया जाता है, तो यह अर्हता प्राप्त करता है।

अगर हाथ से किया जाता, तो ऐसा नहीं होता।

कुछ एजेंट्स (जैसे एक्सेल), या पुनरावृत्ति सुधार (जैसे सीन ईस्टर का सुझाव है) के प्रसार पर टिका हुआ है , किसी तरह इसे आंकड़ों से अलग करने की कोशिश या परिणामों के आधार पर क्या करना असंगत साबित होगा, मेरी राय में।


3
इसलिए यदि आप कागज या पेंसिल का उपयोग करके प्रतिगमन, या केएनएन, या निर्णय पेड़ की गणना करते हैं और कंप्यूटर पर गणना के समान परिणाम प्राप्त करते हैं, तो पहले मामले में यह एक मशीन सीखने और दूसरे में नहीं होगा ..? दूसरी ओर, यदि आप अपने मॉडल के "पैरामीटर" के रूप में कुछ मानों को बेतरतीब ढंग से असाइन करने के लिए कंप्यूटर का उपयोग करते हैं, तो आप इसे मशीन सीखने के रूप में योग्य करेंगे क्योंकि यह एक मशीन द्वारा किया गया था? इस परिभाषा ... ज्यादा मतलब नहीं है प्रतीत नहीं होता है
टिम

यदि आप मशीन का उपयोग नहीं करते हैं, तो आप इसे मुश्किल से मशीन लर्निंग कह सकते हैं । यह मशीन है जो सीखती है, आखिरकार। और मैंने वास्तव में एक यादृच्छिक (मोंटे कार्लो) प्रक्रिया द्वारा अपने मापदंडों को "सीखा" मॉडल तैनात किया है। हालाँकि, मुझे यह स्वीकार करना चाहिए कि बाद में एक सत्यापन कदम शामिल था।
यत्सेन डी बोअर

2
समर्थन वेक्टर मशीनों जैसे एल्गोरिदम को ऐतिहासिक कारणों से "मशीन" कहा जाता है, क्योंकि शुरुआती दिनों में लोगों को उन्हें चलाने के लिए वास्तविक मशीनों / कंप्यूटरों का निर्माण करना होगा ( आंकड़े ।stackexchange.com / questions / 261041/… ), यह कुछ भी नहीं है। "एल्गोरिदम जो मशीनों पर चलाए जाते हैं" के साथ करते हैं। इसके अलावा, टाइम-सीरीज़ मॉडल जैसे ARIMA मशीन लर्निंग के दायरे में नहीं हैं , लेकिन आंकड़े हैं, और वे कंप्यूटर पर चलते हैं
टिम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.