मशीन सीखने में बेयस त्रुटि क्या है?


15

http://www.deeplearningbook.org/contents/ml.html पृष्ठ ११६ में नीचे दिए गए त्रुटि के बारे में बताया गया है

आदर्श मॉडल एक ऐसा अणु है जो केवल डेटा को उत्पन्न करने वाले वास्तविक संभाव्यता वितरण को जानता है। यहां तक ​​कि ऐसा मॉडल अभी भी कई समस्याओं पर कुछ त्रुटि पैदा करेगा, क्योंकि वितरण में अभी भी कुछ शोर हो सकता है। पर्यवेक्षित अधिगम के मामले में, x से y तक मानचित्रण स्वाभाविक रूप से स्टोचस्टिक हो सकता है, या y एक निर्धारक कार्य हो सकता है जिसमें x के अलावा अन्य चर शामिल होते हैं। वास्तविक वितरण पी (x, y) से एक अनुमान बनाने वाली एक त्रुटि द्वारा की गई त्रुटि को बेयस त्रुटि कहा जाता है।

प्रशन

  1. कृपया बेयर्स त्रुटि को सहजता से समझाएं?
  2. यह इर्रिडियूसबल एरर से कैसे अलग है?
  3. क्या मैं कुल त्रुटि = बायस + वेरिएंस + बेस त्रुटि कह सकता हूं?
  4. "Y का अर्थ स्वाभाविक रूप से स्टोचस्टिक हो सकता है" क्या है?

जवाबों:


23

बेयस त्रुटि सबसे कम संभव भविष्यवाणी त्रुटि है जिसे प्राप्त किया जा सकता है और यह इरेड्यूसबल त्रुटि के समान है। यदि किसी को पता होगा कि डेटा किस प्रक्रिया से उत्पन्न होता है, तो प्रक्रिया यादृच्छिक होने पर भी त्रुटियां बनी रहेंगी। यह भी " स्वाभाविक रूप से स्टोकेस्टिक है" से क्या मतलब है ।y

उदाहरण के लिए, जब एक उचित सिक्का फड़फड़ाता है, तो हम जानते हैं कि वास्तव में क्या प्रक्रिया परिणाम (एक द्विपद वितरण) उत्पन्न करती है। हालाँकि, अगर हम सिक्के के फड़कने के सिलसिले के नतीजे की भविष्यवाणी करते हैं, तो भी हम गलतियाँ करेंगे, क्योंकि प्रक्रिया स्वाभाविक रूप से यादृच्छिक (यानी स्टोचैस्टिक) है।

अपने अन्य प्रश्न का उत्तर देने के लिए, आप यह बताते हुए सही हैं कि कुल त्रुटि (चुकता) पूर्वाग्रह, विचरण और इरेड्यूबल त्रुटि का योग है। यह भी देखें इस लेख के लिए एक आसान इन तीन अवधारणाओं की व्याख्या को समझने के लिए।


-2

से https://www.cs.helsinki.fi/u/jkivinen/opetus/iml/2013/Bayes.pdf । वर्गीकरण कार्य के लिए, त्रुटि के रूप में परिभाषित किया गया है:

minf=Cost(f)

क्लासिफायर को इस प्रकार परिभाषित किया गया है: argminf=Cost(f)

तो टोटल एरर = बेयस एरर + आपका मॉडल बेयस एरर से भी बदतर है _ बायस + वेरिएंस + बेयस एरर जो आपके मॉडल और "वितरण शोर" की अंतर्निहित प्रकृति पर निर्भर हो सकता है

"Y का अर्थ स्वाभाविक रूप से स्टोचस्टिक हो सकता है" क्या है? उदाहरण के लिए, । लेकिन जो आप y के रूप में इकट्ठा करते हैं, वह हमेशा रूप में प्रदूषित होता , जहाँ तो आपके पास वास्तविक y, और आपके द्वारा लागत के आकलन का कोई तरीका नहीं है। स्वाभाविक रूप से प्रदूषित। यहां तक ​​कि ओरेकल आपको सही जवाब देता है, आपको लगता है कि वे गलत हैं।y=f(x)=sin(x)y~=y+ttN(0,σ2)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.