मैंने जो देखा है, उससे (दूसरे क्रम का) कांसर-ने स्मूचिंग फॉर्मूला किसी तरह या किसी अन्य रूप में दिया गया है
सामान्यीकरण कारक रूप में दिया गया
और एक शब्द w_n की निरंतरता
जहां संदर्भों की संख्या है या, सरल में देखा गया था, अलग शब्दों की संख्या कि दिए गए शब्द पूर्व में होना । मैंने जो समझा है, उससे सूत्र को पुनरावर्ती रूप से लागू किया जा सकता है।
अब यह अलग-अलग n-ग्राम लंबाई के लिए अज्ञात संदर्भों में ज्ञात शब्दों को संभालता है, लेकिन यह स्पष्ट नहीं करता है कि जब आउट-ऑफ-डिक्शनरी शब्द होते हैं तो क्या करना है। मैंने इस उदाहरण का अनुसरण करने की कोशिश की, जिसमें कहा गया है कि यूनीग्राम्स के पुनरावर्तन चरण में, । दस्तावेज़ तब इसका उपयोग करता है - चेन और गुडमैन के हवाले से - उपरोक्त सूत्र को रूप में सही ठहराने के लिए । पी 1 के एन (डब्ल्यू)=पीसीओएनटी(डब्ल्यू)
मैं यह देखने में विफल हूं कि यह अज्ञात शब्द की उपस्थिति में कैसे काम करता है । इन मामलों में बाद से, जाहिर है, अज्ञात शब्द प्रशिक्षण सेट के संबंध में कुछ भी जारी नहीं रखता है। इसी तरह n- की गिनती ।पी सी ओ एन टी ( अज्ञात ) = 0 C(wn-1,अज्ञात)=0
इसके अलावा, पूरे शब्द शून्य हो सकता है यदि अज्ञात शब्दों का एक अनुक्रम - कहते हैं, OOD शब्दों का एक ट्रिगर - सामना किया गया है।
मुझे किसकी याद आ रही है?