एक Naive Bayes भविष्यवक्ता इस सूत्र का उपयोग करके अपनी भविष्यवाणियां करता है:
जहां एक सामान्यीकृत कारक है। इसके लिए डेटा से पैरामीटर P ( X i = x i | Y = y ) का आकलन करना होगा । यदि हम इसे k -smoothing के साथ करते हैं , तो हमें अनुमान मिलता है
जहाँ X i के लिए संभव मान हैं । मैं इसके साथ ठीक हूं। हालांकि, पूर्व के लिए, हमारे पास है
जहां डेटा सेट में उदाहरण हैं । क्यों हम भी पहले चिकनी नहीं है? या यों कहें, क्या हम पहले से सुचारू हैं? यदि हां, तो हम किस स्मूथिंग पैरामीटर का चयन करते हैं? यह थोड़ा मूर्खतापूर्ण लगता है कि हम भी कश्मीर का चुनाव करें , क्योंकि हम एक अलग गणना कर रहे हैं। क्या कोई सहमति है? या यह बहुत ज्यादा मायने नहीं रखता है?