जैसा कि आपके प्रश्न के लिए टिप्पणियाँ इंगित करती हैं, बहुत सारे लोग हैं जो कुछ बेहतर खोजने पर काम कर रहे हैं। मैं हालांकि @josh द्वारा छोड़ी गई टिप्पणी का विस्तार करके इस प्रश्न का उत्तर देना चाहूंगा
सभी मॉडल गलत हैं लेकिन कुछ उपयोगी हैं (विकी)
उपरोक्त कथन एक सामान्य सत्य है जिसका उपयोग सांख्यिकीय मॉडल की प्रकृति का वर्णन करने के लिए किया जाता है। हमारे पास उपलब्ध डेटा का उपयोग करके, हम ऐसे मॉडल बना सकते हैं जो हमें अनुमानित अनुमानित मूल्य जैसे उपयोगी काम करने दें।
उदाहरण के लिए रैखिक प्रतिगमन ले लो
कई अवलोकनों का उपयोग करते हुए, हम एक मॉडल को फिट कर सकते हैं, जो हमें स्वतंत्र चर (ओं) के लिए किसी भी मूल्य पर निर्भर आश्रित चर के लिए अनुमानित मूल्य दे सकता है।
बर्नहैम, केपी; एंडरसन, डीआर (2002), मॉडल चयन और मल्टीमॉडल> आविष्कार: एक व्यावहारिक सूचना-सैद्धांतिक स्वीकृति (दूसरा संस्करण):।
"एक मॉडल वास्तविकता का एक सरलीकरण या अनुमान है और इसलिए वास्तविकता के सभी को प्रतिबिंबित नहीं करेगा ... बॉक्स ने कहा कि" सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं। "जबकि एक मॉडल कभी भी" सत्य "नहीं हो सकता है, एक मॉडल हो सकता है। बहुत उपयोगी से उपयोगी होने के लिए, कुछ हद तक उपयोगी है, आखिरकार, अनिवार्य रूप से बेकार।
हमारे मॉडल से विचलन (जैसा कि ऊपर की छवि में देखा जा सकता है) यादृच्छिक दिखाई देते हैं, कुछ अवलोकन पंक्ति के नीचे हैं और कुछ ऊपर हैं, लेकिन हमारी प्रतिगमन रेखा एक सामान्य सहसंबंध दिखाती है। जब तक हमारे मॉडल में विचलन यादृच्छिक रूप से प्रकट होते हैं, यथार्थवादी परिदृश्यों में खेलने के अन्य कारक होंगे जो इस विचलन का कारण बनते हैं। उदाहरण के लिए, कारों को देखने की कल्पना करें क्योंकि वे एक जंक्शन से गुजरती हैं जहां उन्हें आगे बढ़ने के लिए बाएं या दाएं मुड़ना चाहिए, कारें किसी विशेष पैटर्न में नहीं मुड़ती हैं। जब तक हम कह सकते हैं कि कारों की दिशा पूरी तरह से यादृच्छिक है, तो क्या प्रत्येक चालक जंक्शन पर पहुंचता है और उस बिंदु पर एक यादृच्छिक निर्णय करता है कि किस तरह से मोड़ना है? वास्तव में वे शायद एक विशिष्ट कारण के लिए कहीं विशिष्ट हो रहे हैं, और प्रत्येक कार को उनके तर्क के बारे में पूछने के लिए रोकने के प्रयास के बिना, हम केवल उनके कार्यों को यादृच्छिक रूप में वर्णित कर सकते हैं।
जहां हम एक मॉडल को न्यूनतम विचलन के साथ फिट करने में सक्षम हैं, हम कितने निश्चित हो सकते हैं कि कुछ बिंदु पर एक अज्ञात, किसी का ध्यान नहीं या अस्थिर चर हमारे मॉडल को फेंक दें? क्या ब्राजील में एक तितली के पंखों का फ्लैप टेक्सास में एक बवंडर को स्थापित करता है?
रैखिक और एसवीएन मॉडल का उपयोग करने के साथ समस्या यह है कि आप अकेले उल्लेख करते हैं कि हमें अपने चर का मैन्युअल रूप से निरीक्षण करने की आवश्यकता है और वे एक दूसरे को कैसे प्रभावित करते हैं। फिर हमें यह तय करने की आवश्यकता है कि चर क्या महत्वपूर्ण हैं और एक कार्य-विशिष्ट एल्गोरिदम लिखते हैं। यह सीधे आगे हो सकता है यदि हमारे पास केवल कुछ चर हैं, लेकिन क्या होगा यदि हमारे पास हजारों थे? क्या होगा अगर हम एक सामान्यीकृत छवि मान्यता मॉडल बनाना चाहते हैं, तो क्या इस दृष्टिकोण के साथ वास्तविक रूप से प्राप्त किया जा सकता है?
डीप लर्निंग और आर्टिफिशियल न्यूरल नेटवर्क्स (एएनएन) हमें भारी मात्रा में चर (जैसे छवि पुस्तकालय) वाले विशाल डेटा सेट के लिए उपयोगी मॉडल बनाने में मदद कर सकते हैं। जैसा कि आप उल्लेख करते हैं, समाधानों की एक समझदार संख्या है जो एएनएन का उपयोग करके डेटा को फिट कर सकता है, लेकिन क्या यह संख्या वास्तव में उन समाधानों की मात्रा से भिन्न है जिन्हें हमें परीक्षण और त्रुटि के माध्यम से विकसित करने की आवश्यकता होगी?
एएनएन के आवेदन हमारे लिए बहुत काम करते हैं, हम अपने इनपुट और हमारे वांछित आउटपुट निर्दिष्ट कर सकते हैं (और उन्हें सुधार करने के लिए बाद में ट्वीक करें) और समाधान का पता लगाने के लिए इसे एएनएन तक छोड़ दें। यही कारण है कि ANN को अक्सर "ब्लैक बॉक्स" के रूप में वर्णित किया जाता है । दिए गए इनपुट से वे एक सन्निकटन का उत्पादन करते हैं, हालांकि (सामान्य शब्दों में) इन सन्निकटन में विवरण शामिल नहीं है कि वे कैसे अनुमानित थे।
और इसलिए यह वास्तव में नीचे आता है कि आप किस समस्या को हल करने की कोशिश कर रहे हैं, क्योंकि समस्या यह बताएगी कि कौन सा मॉडल दृष्टिकोण अधिक उपयोगी है। मॉडल बिल्कुल सटीक नहीं होते हैं और इसलिए हमेशा 'गलत' होने का एक तत्व होता है, हालांकि आपके परिणाम जितने सटीक होते हैं उतने ही उपयोगी होते हैं। परिणामों में अधिक विवरण होने पर कि कैसे सन्निकटन बनाया गया था, उपयोगी भी हो सकता है, समस्या के आधार पर यह बढ़ी हुई सटीकता से भी अधिक उपयोगी हो सकता है।
यदि उदाहरण के लिए आप एक व्यक्ति क्रेडिट स्कोर की गणना कर रहे हैं, तो प्रतिगमन और एसवीएम का उपयोग करके गणना प्रदान करता है जिसे बेहतर तरीके से खोजा जा सकता है। दोनों को मॉडल को सीधे ट्विस्ट करने और ग्राहकों को समझाने में सक्षम होने के नाते अलग-अलग स्वतंत्र चर का उनके समग्र स्कोर पर प्रभाव बहुत उपयोगी है। एक ANN अधिक सटीक स्कोर प्राप्त करने के लिए बड़ी मात्रा में चर प्रसंस्करण में सहायता कर सकता है, लेकिन क्या यह सटीकता अधिक उपयोगी होगी?