इसका उदाहरण देने के लिए सबसे सरल उदाहरण XOR समस्या है (नीचे चित्र देखें)। कल्पना कीजिए कि आपको भविष्यवाणी करने के लिए एक्स और y समन्वित और बाइनरी क्लास वाले डेटा दिए गए हैं। आप अपने मशीन लर्निंग एल्गोरिदम से खुद ही सही निर्णय सीमा का पता लगाने की उम्मीद कर सकते हैं, लेकिन अगर आपने अतिरिक्त फीचर z = xy जेनरेट किया है z= एक्स वाई, तो समस्या z के रूप में तुच्छ हो जाती है > 0z> 0 आपको वर्गीकरण के लिए लगभग सही निर्णय मानदंड देता है और आपने सिर्फ साधारण अंकगणित का उपयोग किया है !
तो जबकि कई मामलों में आप समाधान खोजने के लिए एल्गोरिथम से उम्मीद कर सकते हैं, वैकल्पिक रूप से, सुविधा इंजीनियरिंग द्वारा आप समस्या को सरल बना सकते हैं । सरल समस्याएं हल करने के लिए आसान और तेज़ हैं, और कम जटिल एल्गोरिदम की आवश्यकता होती है। सरल एल्गोरिदम अक्सर अधिक मजबूत होते हैं, परिणाम अक्सर अधिक व्याख्यात्मक होते हैं, वे अधिक स्केलेबल (कम कम्प्यूटेशनल संसाधन, प्रशिक्षण के लिए समय आदि) और पोर्टेबल होते हैं। आप विन्सेन्ट डी। वार्मरडम द्वारा लन्दन में प्यादता सम्मेलन से दिए गए अद्भुत भाषण में और अधिक उदाहरण और स्पष्टीकरण पा सकते हैं ।
इसके अलावा, विश्वास मत करो कि मशीन लर्निंग विपणक आपको बताते हैं। ज्यादातर मामलों में एल्गोरिदम "स्वयं सीखेंगे" नहीं। आपके पास आमतौर पर सीमित समय, संसाधन, कम्प्यूटेशनल शक्ति है और डेटा का आमतौर पर सीमित आकार है और शोर है, न तो यह मदद करता है।
इसे चरम पर ले जाते हुए, आप अपने डेटा को प्रयोग परिणाम के हस्तलिखित नोटों की तस्वीरों के रूप में प्रदान कर सकते हैं और उन्हें जटिल तंत्रिका नेटवर्क में पास कर सकते हैं। यह पहले चित्रों पर डेटा को पहचानना सीखेगा, फिर उसे समझना और भविष्यवाणियां करना सीखेगा। ऐसा करने के लिए, आपको एक शक्तिशाली कंप्यूटर की आवश्यकता होगी और मॉडल को ट्यून करने और जटिल तंत्रिका नेटवर्क का उपयोग करने के कारण भारी मात्रा में डेटा की आवश्यकता होगी। कंप्यूटर-पढ़ने योग्य प्रारूप (संख्याओं की तालिका) के रूप में डेटा प्रदान करना, समस्या को बहुत सरल करता है, क्योंकि आपको सभी वर्ण पहचान की आवश्यकता नहीं है। आप एक अगले चरण के रूप में सुविधा इंजीनियरिंग के बारे में सोच सकते हैं, जहां आप सार्थक बनाने के लिए डेटा को इस तरह से रूपांतरित करते हैंविशेषताएं, ताकि आप एल्गोरिथ्म अपने आप ही पता लगाने के लिए कम हो। सादृश्य देने के लिए, यह वैसा ही है जैसे आप विदेशी भाषा में एक पुस्तक पढ़ना चाहते थे, ताकि आपको पहले भाषा सीखने की जरूरत पड़े, या इसे उस भाषा में अनुवादित पढना, जिसे आप समझते हैं।
टाइटैनिक डेटा उदाहरण में, आपके एल्गोरिथ्म को यह पता लगाने की आवश्यकता होगी कि "परिवार का आकार" सुविधा प्राप्त करने के लिए परिवार के सदस्यों को संक्षेप में समझ में आता है (हां, मैं इसे यहां व्यक्तिगत कर रहा हूं)। यह एक मानव के लिए एक स्पष्ट विशेषता है, लेकिन यह स्पष्ट नहीं है कि यदि आप आंकड़ों को केवल संख्याओं के कुछ स्तंभों के रूप में देखते हैं। यदि आप नहीं जानते कि अन्य स्तंभों के साथ एक साथ विचार किए जाने पर कौन से स्तंभ सार्थक हैं, तो एल्गोरिथ्म ऐसे स्तंभों के प्रत्येक संभावित संयोजन को आज़माकर पता लगा सकता है। निश्चित रूप से, हमारे पास ऐसा करने के चतुर तरीके हैं, लेकिन फिर भी, यह बहुत आसान है अगर जानकारी एल्गोरिथ्म को तुरंत दी जाती है।