मशीन लर्निंग के संदर्भ में , मैंने देखा है कि ग्राउंड ट्रुथ शब्द का काफी इस्तेमाल हुआ है। मैंने बहुत खोज की है और विकिपीडिया में निम्नलिखित परिभाषा पाई है :
मशीन लर्निंग में, शब्द "जमीनी सच्चाई" से तात्पर्य पर्यवेक्षित शिक्षण तकनीकों के प्रशिक्षण सेट के वर्गीकरण की सटीकता से है। यह शोध परिकल्पना को साबित करने या उसे खारिज करने के लिए सांख्यिकीय मॉडल में उपयोग किया जाता है। "ग्राउंड ट्रूथिंग" शब्द इस परीक्षण के लिए उचित उद्देश्य (साबित) डेटा इकट्ठा करने की प्रक्रिया को संदर्भित करता है। सोने के मानक के साथ तुलना करें।
Bayesian स्पैम फ़िल्टरिंग पर्यवेक्षित शिक्षण का एक सामान्य उदाहरण है। इस प्रणाली में, एल्गोरिथ्म को मैन्युअल रूप से स्पैम और गैर-स्पैम के बीच अंतर सिखाया जाता है। यह एल्गोरिथ्म को प्रशिक्षित करने के लिए उपयोग किए जाने वाले संदेशों की जमीनी सच्चाई पर निर्भर करता है - जमीनी सच्चाई में गलतियाँ परिणामी स्पैम / गैर-स्पैम verdicts में अशुद्धि को सहसंबंधित करेंगी।
मुद्दा यह है कि मुझे वास्तव में वह नहीं मिल सकता है जिसका अर्थ है। वह यह है कि लेबल प्रत्येक के लिए इस्तेमाल किया डेटा वस्तु या लक्ष्य समारोह है जो प्रत्येक के लिए एक लेबल देता है डेटा वस्तु , या शायद कुछ और?