यह परिभाषा काफी हद तक लागू नहीं होती है क्योंकि हम हमेशा एक अंतर्निहित वितरण नहीं मान रहे हैं। तो वास्तव में एक मॉडल क्या है? क्या निर्दिष्ट हाइपरपरमेटर्स वाले जीबीएम को एक मॉडल माना जा सकता है? क्या एक मॉडल नियमों का एक संग्रह है?
यह परिभाषा काफी हद तक लागू नहीं होती है क्योंकि हम हमेशा एक अंतर्निहित वितरण नहीं मान रहे हैं। तो वास्तव में एक मॉडल क्या है? क्या निर्दिष्ट हाइपरपरमेटर्स वाले जीबीएम को एक मॉडल माना जा सकता है? क्या एक मॉडल नियमों का एक संग्रह है?
जवाबों:
मुझे हाल ही में इसी सवाल में दिलचस्पी थी और यह एहसास हुआ कि मशीन सीखने में "मॉडल" की कोई एक परिभाषा नहीं है। यह आपके द्वारा परामर्श किए जा रहे स्रोतों पर अत्यधिक निर्भर है, जो किसी विशेष सॉफ्टवेयर प्रोग्राम के लिए प्रलेखन हो सकता है, इसके उपयोगकर्ता समुदाय द्वारा अपनाई गई कठबोली, या प्रकाशित अकादमिक पत्रों में उपयोग की जाने वाली परिभाषाएं, जो व्यापक रूप से पत्रिका से पत्रिका में भिन्न हो सकती हैं। इसके अलावा, मुझे यह ध्यान रखना सीखना था कि इस तरह के पेपर सिर्फ मशीन लर्निंग के विशेषज्ञों द्वारा नहीं लिखे जाते हैं, बल्कि अन्य विषयों के विशेषज्ञों द्वारा भी जिन्हें मशीन लर्निंग तकनीक (जैसे कि इमेजिंग, विभिन्न चिकित्सा क्षेत्र, आदि) को लागू करने की आवश्यकता होती है। । उनमें से कई शब्द "मॉडल" को स्पष्ट रूप से परिभाषित नहीं करते हैं, जो अक्सर शिथिल रूप से उपयोग किया जाता है। यहाँ "मॉडल" I की विभिन्न परिभाषाओं की एक जोड़ी है
• सांख्यिकीय मॉडल, विशेष रूप से संभाव्यता वितरण से संबंधित आँकड़े।
• प्रतिगमन डेटा और संबंधित आँकड़े।
• गणितीय मॉडल जैसा कि ऊपर नील स्लेटर ने उल्लेख किया है।
• मशीन सीखने में उपयोग किए जाने वाले डेटा मॉडल, जैसे कि शामिल कॉलम, उनके डेटा प्रकार, डेटा स्रोत और अन्य मेटाडेटा। यह विशेष रूप से मुश्किल है क्योंकि इस परिभाषा के बारे में कुछ भी गणितीय नहीं है, जो मैंने पहले तीन सूचीबद्ध किए थे। उदाहरण के लिए, SQL सर्वर "माइनिंग मॉडल" के लिए सभी दस्तावेज़ीकरण देखें, जो मशीन सीखने के उद्देश्यों के लिए दोहरे कर्तव्य की सेवा करते हैं।
• कभी-कभी उपरोक्त सभी परिभाषाओं का विस्तार समीकरणों और मेटाडेटा के शीर्ष पर निर्मित मशीन लर्निंग संरचनाओं को शामिल करने के लिए किया जाता है, जैसे कि तंत्रिका जाल के विनिर्देश। अन्य मामलों में, इन्हें अलग निकाय माना जाता है।
स्रोत के आधार पर उपरोक्त सभी को कभी-कभी मिश्रित और एक साथ मिलाया जाता है। मुझे यकीन है कि "मॉडल" की अन्य परिभाषाएं हैं, मैंने इस सूची को छोड़ दिया है, जो आगे भी इस मामले को जटिल करेगा। इस अस्पष्टता से निपटने के लिए, मैं जब भी वे "मॉडल" शब्द का उपयोग करता हूं, लेखक के इरादों को दिव्य करने के लिए खुद को प्रशिक्षित करने की कोशिश कर रहा हूं। कभी-कभी यह संदर्भ या लेखक द्वारा कार्य किए जाने वाले क्षेत्र के आधार पर निर्धारित करना आसान होता है, लेकिन दूसरी बार मुझे यह पता लगाने से पहले एक लेख या प्रलेखन में गहराई से पढ़ना होगा। काश मैं इसके बारे में अधिक निश्चित हो सकता, लेकिन यह वास्तव में एक स्वाभाविक रूप से फजी शब्द है; वहाँ एक साधारण एक आकार फिट होने जा रहा है, इस सब के लिए जवाब नहीं है। मुझे आशा है कि वह मदद करेंगे।
अमेज़न मशीन लर्निंग पर लेख से
एक एमएल मॉडल के प्रशिक्षण की प्रक्रिया में शामिल करने के लिए प्रशिक्षण डेटा के साथ एक एमएल एल्गोरिथ्म (यानी लर्निंग एल्गोरिदम) प्रदान करना शामिल है। The term ML model refers to the model artifact that is created by the training process.
मुझे टॉम मिशेल द्वारा दी गई मशीन लर्निंग परिभाषा पसंद है ।
कहा जाता है कि कंप्यूटर प्रोग्राम को अनुभव E से कुछ कार्यों के वर्ग T और प्रदर्शन माप P के संबंध में सीखा जाता है, यदि T से कार्यों में इसका प्रदर्शन, जैसा कि P द्वारा मापा जाता है, अनुभव E से सुधार होता है।
इसलिए, इस परिभाषा को देखते हुए, मुझे यह कहना चाहिए कि एक मॉडल कुछ कक्षा टी करने के बाद प्राप्त अनुभव है।
एक मॉडल, शिथिल रूप से बोलना, किसी चीज़ या प्रक्रिया का सरलीकरण है। उदाहरण के लिए, पृथ्वी का आकार वास्तव में एक क्षेत्र नहीं है, लेकिन हम इसे एक के रूप में मान सकते हैं यदि हम एक ग्लोब डिजाइन कर रहे हैं। इसी तरह, ब्रह्मांड को नियतात्मक मानना, कुछ प्राकृतिक प्रक्रिया है जो यह निर्धारित करती है कि क्या कोई ग्राहक किसी वेबसाइट पर उत्पाद खरीदेगा। हम एक ऐसी प्रक्रिया का निर्माण कर सकते हैं जो उस प्रक्रिया का अनुमान लगाती है, जिसे हम ग्राहक के बारे में कुछ जानकारी दे सकते हैं और जो हमें बताती है कि क्या यह सोचता है कि ग्राहक एक उत्पाद खरीदेगा।
एक "मशीन लर्निंग मॉडल", फिर, एक मशीन लर्निंग सिस्टम द्वारा निर्मित मॉडल है।
(इसके लिए माफी एक कठोर जवाब नहीं है, लेकिन मुझे उम्मीद है कि यह अभी भी उपयोगी है।)
मशीन लर्निंग प्रतिमान में, मॉडल प्रतिमान, वर्गीकरण और सुदृढीकरण श्रेणियों के लिए क्रमशः प्रत्येक स्थान, वर्ग और कार्रवाई के लिए इनपुट स्थान धारकों के साथ-साथ मॉडल मापदंडों की गणितीय अभिव्यक्ति को संदर्भित करता है।
यह अभिव्यक्ति एकल न्यूरॉन में एक मॉडल के रूप में अंतर्निहित है।
सिंगल लेयर परसेप्ट्रॉन और डीप लर्निंग मॉडल के लिए, किसी को ऑर्डर किए गए फैशन में सक्रियण फ़ंक्शन को इकट्ठा करने और सिलाई करने के लिए न्यूरॉन्स और परतों को सावधानीपूर्वक चलते हुए इस मॉडल को निकालने की आवश्यकता होती है।
मशीन लर्निंग में, मॉडल गुरुत्वाकर्षण का केंद्र है और सब कुछ मॉडल के चारों ओर घूमता है। हालांकि अलग-अलग लोगों के मॉडल की अलग-अलग परिभाषा होती है। लेकिन मेरी राय में, यहां हम सबसे अच्छा है कि मॉडल को कैसे परिभाषित किया जाए "मशीन लर्निंग में मॉडल वह परिकल्पना है जो डेटा को फिट करने और अनदेखी डेटा की भविष्यवाणी करने की कोशिश करता है"।
मशीन लर्निंग में, एक मॉडल एक अमूर्तता है जो इनपुट मानों के एक उदाहरण के संबंध में एक भविष्यवाणी (पुनः) कार्रवाई या परिवर्तन कर सकता है। एक मॉडल एक एकल संख्या हो सकती है जैसे टिप्पणियों के एक सेट का औसत मूल्य जो अक्सर आधार रेखा मॉडल, बहुपद अभिव्यक्ति या नियमों के एक सेट (जैसे निर्णय पेड़) के रूप में उपयोग किया जाता है जो परिभाषित करते हैं कि आउटपुट कैसे प्राप्त करें।
सामान्य तौर पर, एक मॉडल नियमों और हाइपर-मापदंडों के एक सेट द्वारा परिभाषित किया जाता है जो मॉडल की संरचना और क्षमता को परिभाषित करने के लिए कार्य को हाथ से करने के लिए अनुकूलित किया जाता है। एक हाइपर-पैरामीटर बहुपद या निर्णय वृक्ष की गहराई का डिग्री हो सकता है। एक मॉडल को एक अनुकूलन प्रक्रिया के अधीन किया जा सकता है जहां मापदंडों को एक निश्चित उद्देश्य के खिलाफ अनुकूलित किया जाता है।
अनुकूलन प्रक्रिया को अक्सर फिटिंग के लिए प्रशिक्षण के रूप में संदर्भित किया जाता है और एक फिट मॉडल में परिणाम होता है, जिसे केवल मॉडल के रूप में भी संदर्भित किया जा सकता है। यदि एक मॉडल को प्रशिक्षित किया गया था या अक्सर संदर्भ से कटौती करने की आवश्यकता नहीं होती है।
यह एक मजेदार चर्चा है! मेरे दो सेंट हैं कि एक मॉडल एक संग्रहीत जानकारी है जिसे कंप्यूटर संभावित इनपुट के कुछ सेट से मैपिंग का अनुमान लगाने के लिए उपयुक्त आउटपुट के एक सेट में व्याख्या कर सकता है। एक मॉडल एक साधारण फ़ंक्शन की परिभाषा से अधिक या कम नहीं है जो एक अधिक जटिल फ़ंक्शन का अनुमान लगाता है। यह जटिल फ़ंक्शन के लिए वास्तविक दुनिया की घटना होना आवश्यक नहीं है, केवल मॉडल के लिए जटिल फ़ंक्शन को लगभग पूरी तरह से पुन: पेश करने के लिए पर्याप्त जानकारी संग्रहीत किए बिना।