शर्त: मूल सांख्यिकी और एमएल के लिए जोखिम (रैखिक प्रतिगमन)
इसका उत्तर एक वाक्य में दिया जा सकता है -
वे एक जैसे हैं लेकिन उनकी परिभाषा आवश्यकताओं के अनुसार बदल जाती है।
व्याख्या
मुझे अपने कथन की व्याख्या करें। मान लीजिए कि आपके पास एक डेटासेट है, इस उद्देश्य पर विचार करें exercise.csv
। डेटासेट में प्रत्येक कॉलम को सुविधाओं के रूप में कहा जाता है। लिंग, आयु, ऊंचाई, हृदय गति, Body_temp और कैलोरी विभिन्न स्तंभों में से एक हो सकती हैं। प्रत्येक स्तंभ अलग-अलग विशेषताओं या संपत्ति का प्रतिनिधित्व करता है।
exercise.csv
User_ID Gender Age Height Weight Duration Heart_Rate Body_Temp Calories
14733363 male 68 190.0 94.0 29.0 105.0 40.8 231.0
14861698 female 20 166.0 60.0 14.0 94.0 40.3 66.0
11179863 male 69 179.0 79.0 5.0 88.0 38.7 26.0
समझ को ठोस बनाने और पहेली को साफ करने के लिए हम दो अलग-अलग समस्याओं (भविष्यवाणी मामले) को लेते हैं।
CASE1: इस मामले में हम प्रयोग करने पर विचार कर सकते हैं - व्यायाम के दौरान जलाए गए कैलोरी का अनुमान लगाने के लिए लिंग, ऊँचाई और वजन। यह भविष्यवाणी (वाई) कैलोरी यहाँ एक लेबल है । कैलोरी वह कॉलम है जिसे आप विभिन्न विशेषताओं का उपयोग करके भविष्यवाणी करना चाहते हैं जैसे - X1: लिंग, x2: ऊंचाई और x3: वजन ।
CASE2: यहां दूसरे मामले में हम एक सुविधा के रूप में जेंडर और वेट का उपयोग करके हार्ट_रेट की भविष्यवाणी करना चाहते हैं। यहाँ Heart_Rate एक लेबल है जो सुविधाओं का उपयोग करके पूर्वानुमानित है - X1: लिंग और x2: वजन ।
एक बार जब आप उपरोक्त स्पष्टीकरण को समझ गए हैं तो आप वास्तव में लेबल और विशेषताओं के साथ भ्रमित नहीं होंगे।