इनमें से काफी ओवरलैप है, लेकिन कुछ भेद किए जा सकते हैं। आवश्यकता होने पर, मुझे कुछ चीजों को सरल बनाना होगा या दूसरों को संक्षिप्त रूप देना होगा, लेकिन मैं इन क्षेत्रों में कुछ अर्थ देने की पूरी कोशिश करूंगा।
सबसे पहले, आर्टिफिशियल इंटेलिजेंस बाकी से काफी अलग है। एआई इस बात का अध्ययन है कि बुद्धिमान एजेंटों को कैसे बनाया जाए। व्यवहार में, यह है कि एक बुद्धिमान एजेंट (कहते हैं, एक व्यक्ति) के रूप में कार्य करने और प्रदर्शन करने के लिए कंप्यूटर को कैसे प्रोग्राम करना है। इसमें सीखने या प्रेरण को शामिल करने की आवश्यकता नहीं है , यह सिर्फ 'बेहतर मूसट्रैप बनाने' का तरीका हो सकता है। उदाहरण के लिए, AI अनुप्रयोगों में चल रही प्रक्रियाओं की निगरानी और नियंत्रण के लिए कार्यक्रम शामिल हैं (उदाहरण के लिए, यदि यह बहुत कम लगता है, तो पहलू को बढ़ाएं)। ध्यान दें कि AI एक मशीन के द्वारा किए जाने वाले किसी भी चीज़ के बारे में बता सकता है, जब तक कि यह 'मूर्खतापूर्ण' नहीं करता।
व्यवहार में, हालांकि, अधिकांश कार्यों के लिए बुद्धिमत्ता की आवश्यकता होती है, उन्हें अनुभवों से नए ज्ञान को प्रेरित करने की क्षमता की आवश्यकता होती है। इस प्रकार, AI के भीतर एक बड़ा क्षेत्र मशीन लर्निंग है । एक कंप्यूटर प्रोग्राम को कुछ कार्य को अनुभव से सीखने के लिए कहा जाता है यदि कुछ प्रदर्शन माप के अनुसार कार्य में इसका प्रदर्शन अनुभव के साथ बेहतर होता है। मशीन लर्निंग में एल्गोरिदम का अध्ययन शामिल है जो स्वचालित रूप से जानकारी निकाल सकता है (यानी, ऑन-लाइन मानव मार्गदर्शन के बिना)। यह निश्चित रूप से मामला है कि इनमें से कुछ प्रक्रियाओं में शास्त्रीय सांख्यिकी से सीधे या व्युत्पन्न विचार शामिल हैं, लेकिन उनके पास नहीं हैहोने के लिए। एआई के समान, मशीन लर्निंग बहुत व्यापक है और इसमें लगभग सब कुछ शामिल हो सकता है, इसलिए जब तक कि इसमें कुछ प्रेरक घटक न हो। मशीन लर्निंग एल्गोरिदम का एक उदाहरण एक कलमन फ़िल्टर हो सकता है।
डाटा माइनिंग एक ऐसा क्षेत्र है जिसने मशीन सीखने (और कुछ, आंकड़ों से भी) से इसकी प्रेरणा और तकनीकें ज्यादा ली हैं, लेकिन अलग-अलग छोरों पर लगाई जाती हैं । डेटा माइनिंग किसी व्यक्ति द्वारा , किसी विशिष्ट स्थिति में, किसी विशेष डेटा सेट पर, एक लक्ष्य को ध्यान में रखकर किया जाता है। आमतौर पर, यह व्यक्ति विभिन्न पैटर्न मान्यता तकनीकों की शक्ति का लाभ उठाना चाहता है जिन्हें मशीन लर्निंग में विकसित किया गया है। काफी बार, डेटा सेट बड़े पैमाने पर , जटिल है , और / या विशेष समस्याएं हो सकती हैं(जैसे कि प्रेक्षणों की तुलना में अधिक चर होते हैं)। आमतौर पर, लक्ष्य या तो ऐसे क्षेत्र में कुछ प्रारंभिक अंतर्दृष्टि की खोज / उत्पन्न करना है जहां वास्तव में पहले से बहुत कम ज्ञान था, या भविष्य की टिप्पणियों का सटीक अनुमान लगाने में सक्षम होने के लिए। इसके अलावा, डेटा माइनिंग प्रक्रियाएं 'अनपर्वलाइज़्ड' (हम उत्तर - खोज नहीं जानते) या 'सुपरवाइज़्ड' (हम उत्तर - भविष्यवाणी को जानते हैं) हो सकते हैं। ध्यान दें कि लक्ष्य आम तौर पर अंतर्निहित डेटा निर्माण प्रक्रिया की अधिक परिष्कृत समझ विकसित करने के लिए नहीं है। सामान्य डेटा खनन तकनीकों में क्लस्टर विश्लेषण, वर्गीकरण और प्रतिगमन पेड़, और तंत्रिका नेटवर्क शामिल होंगे।
मुझे लगता है कि इस साइट पर क्या आँकड़े हैं , यह समझाने के लिए मुझे बहुत कुछ कहने की ज़रूरत नहीं है, लेकिन शायद मैं कुछ बातें कह सकता हूँ। शास्त्रीय आँकड़े (यहाँ मेरा अर्थ है लगातार और बायेसियन दोनों) गणित के भीतर एक उप-विषय है। मैं इसे मोटे तौर पर उस चौराहे के बारे में सोचता हूं जिसे हम संभाव्यता के बारे में जानते हैं और अनुकूलन के बारे में हम क्या जानते हैं। यद्यपि गणितीय आँकड़ों का अध्ययन केवल एक प्लेटोनिक वस्तु के रूप में किया जा सकता है, लेकिन इसे अधिक व्यावहारिक समझा जाता है और गणित के अन्य दुर्लभ क्षेत्रों की तुलना में चरित्र में लागू किया जाता है। जैसे (और विशेष रूप से ऊपर डेटा खनन के विपरीत), यह ज्यादातर कुछ विशेष डेटा बनाने की प्रक्रिया को बेहतर ढंग से समझने की दिशा में नियोजित है। इस प्रकार, यह आमतौर पर एक औपचारिक रूप से निर्दिष्ट मॉडल के साथ शुरू होता हैऔर इससे व्युत्पन्न प्रक्रियाएं उस मॉडल को शोर के उदाहरणों (यानी, अनुमान - कुछ हानि फ़ंक्शन का अनुकूलन करके) को सटीक रूप से निकालने और इसे अन्य संभावनाओं (यानी, नमूना वितरण के ज्ञात गुणों के आधार पर इनफिनिटी) से अलग करने में सक्षम होने के लिए निकाली गई हैं। प्रोटोटाइप सांख्यिकीय तकनीक प्रतिगमन है।