मशीन लर्निंग में एक मॉडल की परिभाषा


11

यह परिभाषा काफी हद तक लागू नहीं होती है क्योंकि हम हमेशा एक अंतर्निहित वितरण नहीं मान रहे हैं। तो वास्तव में एक मॉडल क्या है? क्या निर्दिष्ट हाइपरपरमेटर्स वाले जीबीएम को एक मॉडल माना जा सकता है? क्या एक मॉडल नियमों का एक संग्रह है?


2
आप बस एक कदम आगे जेनेरिक-नेस ले सकते हैं और en.wikipedia.org/wiki/Mathematical_model को देख सकते हैं - अधिकांश एमएल मॉडल उस परिभाषा से मेल खाएंगे, भले ही वे "सांख्यिकीय मॉडल" से मेल न खाते हों (हालांकि मैं लगभग सभी प्रशिक्षित अनचाहा या पर्यवेक्षित एमएल मॉडल को सांख्यिकीय मॉडल माना जाएगा)।
नील स्लाटर

जवाबों:


7

मुझे हाल ही में इसी सवाल में दिलचस्पी थी और यह एहसास हुआ कि मशीन सीखने में "मॉडल" की कोई एक परिभाषा नहीं है। यह आपके द्वारा परामर्श किए जा रहे स्रोतों पर अत्यधिक निर्भर है, जो किसी विशेष सॉफ्टवेयर प्रोग्राम के लिए प्रलेखन हो सकता है, इसके उपयोगकर्ता समुदाय द्वारा अपनाई गई कठबोली, या प्रकाशित अकादमिक पत्रों में उपयोग की जाने वाली परिभाषाएं, जो व्यापक रूप से पत्रिका से पत्रिका में भिन्न हो सकती हैं। इसके अलावा, मुझे यह ध्यान रखना सीखना था कि इस तरह के पेपर सिर्फ मशीन लर्निंग के विशेषज्ञों द्वारा नहीं लिखे जाते हैं, बल्कि अन्य विषयों के विशेषज्ञों द्वारा भी जिन्हें मशीन लर्निंग तकनीक (जैसे कि इमेजिंग, विभिन्न चिकित्सा क्षेत्र, आदि) को लागू करने की आवश्यकता होती है। । उनमें से कई शब्द "मॉडल" को स्पष्ट रूप से परिभाषित नहीं करते हैं, जो अक्सर शिथिल रूप से उपयोग किया जाता है। यहाँ "मॉडल" I की विभिन्न परिभाषाओं की एक जोड़ी है

• सांख्यिकीय मॉडल, विशेष रूप से संभाव्यता वितरण से संबंधित आँकड़े।

• प्रतिगमन डेटा और संबंधित आँकड़े।

• गणितीय मॉडल जैसा कि ऊपर नील स्लेटर ने उल्लेख किया है।

• मशीन सीखने में उपयोग किए जाने वाले डेटा मॉडल, जैसे कि शामिल कॉलम, उनके डेटा प्रकार, डेटा स्रोत और अन्य मेटाडेटा। यह विशेष रूप से मुश्किल है क्योंकि इस परिभाषा के बारे में कुछ भी गणितीय नहीं है, जो मैंने पहले तीन सूचीबद्ध किए थे। उदाहरण के लिए, SQL सर्वर "माइनिंग मॉडल" के लिए सभी दस्तावेज़ीकरण देखें, जो मशीन सीखने के उद्देश्यों के लिए दोहरे कर्तव्य की सेवा करते हैं।

• कभी-कभी उपरोक्त सभी परिभाषाओं का विस्तार समीकरणों और मेटाडेटा के शीर्ष पर निर्मित मशीन लर्निंग संरचनाओं को शामिल करने के लिए किया जाता है, जैसे कि तंत्रिका जाल के विनिर्देश। अन्य मामलों में, इन्हें अलग निकाय माना जाता है।

स्रोत के आधार पर उपरोक्त सभी को कभी-कभी मिश्रित और एक साथ मिलाया जाता है। मुझे यकीन है कि "मॉडल" की अन्य परिभाषाएं हैं, मैंने इस सूची को छोड़ दिया है, जो आगे भी इस मामले को जटिल करेगा। इस अस्पष्टता से निपटने के लिए, मैं जब भी वे "मॉडल" शब्द का उपयोग करता हूं, लेखक के इरादों को दिव्य करने के लिए खुद को प्रशिक्षित करने की कोशिश कर रहा हूं। कभी-कभी यह संदर्भ या लेखक द्वारा कार्य किए जाने वाले क्षेत्र के आधार पर निर्धारित करना आसान होता है, लेकिन दूसरी बार मुझे यह पता लगाने से पहले एक लेख या प्रलेखन में गहराई से पढ़ना होगा। काश मैं इसके बारे में अधिक निश्चित हो सकता, लेकिन यह वास्तव में एक स्वाभाविक रूप से फजी शब्द है; वहाँ एक साधारण एक आकार फिट होने जा रहा है, इस सब के लिए जवाब नहीं है। मुझे आशा है कि वह मदद करेंगे।


1
हालांकि "मॉडल" शब्द वास्तव में बहुत सारी चीजों पर लागू हो सकता है, मशीन लर्निंग के संदर्भ में, मॉडल सीखने / प्रशिक्षण के माध्यम से बनाई गई विरूपण साक्ष्य है - जैसे कि तंत्रिका नेटवर्क के मामले में उस नेटवर्क का वजन और पूर्वाग्रह।
सियाजी

5

अमेज़न मशीन लर्निंग पर लेख से

एक एमएल मॉडल के प्रशिक्षण की प्रक्रिया में शामिल करने के लिए प्रशिक्षण डेटा के साथ एक एमएल एल्गोरिथ्म (यानी लर्निंग एल्गोरिदम) प्रदान करना शामिल है। The term ML model refers to the model artifact that is created by the training process.


5

मुझे टॉम मिशेल द्वारा दी गई मशीन लर्निंग परिभाषा पसंद है ।

कहा जाता है कि कंप्यूटर प्रोग्राम को अनुभव E से कुछ कार्यों के वर्ग T और प्रदर्शन माप P के संबंध में सीखा जाता है, यदि T से कार्यों में इसका प्रदर्शन, जैसा कि P द्वारा मापा जाता है, अनुभव E से सुधार होता है।

इसलिए, इस परिभाषा को देखते हुए, मुझे यह कहना चाहिए कि एक मॉडल कुछ कक्षा टी करने के बाद प्राप्त अनुभव है।


क्या अनुभव ई प्रशिक्षण सेट नहीं है?
इटाराम मुश्किन

3

एक मॉडल, शिथिल रूप से बोलना, किसी चीज़ या प्रक्रिया का सरलीकरण है। उदाहरण के लिए, पृथ्वी का आकार वास्तव में एक क्षेत्र नहीं है, लेकिन हम इसे एक के रूप में मान सकते हैं यदि हम एक ग्लोब डिजाइन कर रहे हैं। इसी तरह, ब्रह्मांड को नियतात्मक मानना, कुछ प्राकृतिक प्रक्रिया है जो यह निर्धारित करती है कि क्या कोई ग्राहक किसी वेबसाइट पर उत्पाद खरीदेगा। हम एक ऐसी प्रक्रिया का निर्माण कर सकते हैं जो उस प्रक्रिया का अनुमान लगाती है, जिसे हम ग्राहक के बारे में कुछ जानकारी दे सकते हैं और जो हमें बताती है कि क्या यह सोचता है कि ग्राहक एक उत्पाद खरीदेगा।

एक "मशीन लर्निंग मॉडल", फिर, एक मशीन लर्निंग सिस्टम द्वारा निर्मित मॉडल है।

(इसके लिए माफी एक कठोर जवाब नहीं है, लेकिन मुझे उम्मीद है कि यह अभी भी उपयोगी है।)


1

मशीन लर्निंग प्रतिमान में, मॉडल प्रतिमान, वर्गीकरण और सुदृढीकरण श्रेणियों के लिए क्रमशः प्रत्येक स्थान, वर्ग और कार्रवाई के लिए इनपुट स्थान धारकों के साथ-साथ मॉडल मापदंडों की गणितीय अभिव्यक्ति को संदर्भित करता है।

यह अभिव्यक्ति एकल न्यूरॉन में एक मॉडल के रूप में अंतर्निहित है।

सिंगल लेयर परसेप्ट्रॉन और डीप लर्निंग मॉडल के लिए, किसी को ऑर्डर किए गए फैशन में सक्रियण फ़ंक्शन को इकट्ठा करने और सिलाई करने के लिए न्यूरॉन्स और परतों को सावधानीपूर्वक चलते हुए इस मॉडल को निकालने की आवश्यकता होती है।


0

मशीन लर्निंग में, मॉडल गुरुत्वाकर्षण का केंद्र है और सब कुछ मॉडल के चारों ओर घूमता है। हालांकि अलग-अलग लोगों के मॉडल की अलग-अलग परिभाषा होती है। लेकिन मेरी राय में, यहां हम सबसे अच्छा है कि मॉडल को कैसे परिभाषित किया जाए "मशीन लर्निंग में मॉडल वह परिकल्पना है जो डेटा को फिट करने और अनदेखी डेटा की भविष्यवाणी करने की कोशिश करता है"।


0

मशीन लर्निंग में, एक मॉडल एक अमूर्तता है जो इनपुट मानों के एक उदाहरण के संबंध में एक भविष्यवाणी (पुनः) कार्रवाई या परिवर्तन कर सकता है। एक मॉडल एक एकल संख्या हो सकती है जैसे टिप्पणियों के एक सेट का औसत मूल्य जो अक्सर आधार रेखा मॉडल, बहुपद अभिव्यक्ति या नियमों के एक सेट (जैसे निर्णय पेड़) के रूप में उपयोग किया जाता है जो परिभाषित करते हैं कि आउटपुट कैसे प्राप्त करें।

सामान्य तौर पर, एक मॉडल नियमों और हाइपर-मापदंडों के एक सेट द्वारा परिभाषित किया जाता है जो मॉडल की संरचना और क्षमता को परिभाषित करने के लिए कार्य को हाथ से करने के लिए अनुकूलित किया जाता है। एक हाइपर-पैरामीटर बहुपद या निर्णय वृक्ष की गहराई का डिग्री हो सकता है। एक मॉडल को एक अनुकूलन प्रक्रिया के अधीन किया जा सकता है जहां मापदंडों को एक निश्चित उद्देश्य के खिलाफ अनुकूलित किया जाता है।

अनुकूलन प्रक्रिया को अक्सर फिटिंग के लिए प्रशिक्षण के रूप में संदर्भित किया जाता है और एक फिट मॉडल में परिणाम होता है, जिसे केवल मॉडल के रूप में भी संदर्भित किया जा सकता है। यदि एक मॉडल को प्रशिक्षित किया गया था या अक्सर संदर्भ से कटौती करने की आवश्यकता नहीं होती है।


0

यह एक मजेदार चर्चा है! मेरे दो सेंट हैं कि एक मॉडल एक संग्रहीत जानकारी है जिसे कंप्यूटर संभावित इनपुट के कुछ सेट से मैपिंग का अनुमान लगाने के लिए उपयुक्त आउटपुट के एक सेट में व्याख्या कर सकता है। एक मॉडल एक साधारण फ़ंक्शन की परिभाषा से अधिक या कम नहीं है जो एक अधिक जटिल फ़ंक्शन का अनुमान लगाता है। यह जटिल फ़ंक्शन के लिए वास्तविक दुनिया की घटना होना आवश्यक नहीं है, केवल मॉडल के लिए जटिल फ़ंक्शन को लगभग पूरी तरह से पुन: पेश करने के लिए पर्याप्त जानकारी संग्रहीत किए बिना।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.