मैं विषय मॉडलिंग करने से पहले स्टॉप शब्द हटाने की कोशिश कर रहा हूं। मैंने देखा कि कुछ नकारात्मक शब्दों (नहीं, नहीं, कभी नहीं, कोई भी नहीं ..) को आमतौर पर शब्दों को रोकने के लिए माना जाता है। उदाहरण के लिए, एनएलटीके, स्पाइस और स्केलेर में उनके स्टॉप शब्द सूची में "नहीं" शामिल हैं। हालांकि, अगर हम नीचे दिए गए इन वाक्यों से "नहीं" हटाते हैं, तो वे महत्वपूर्ण अर्थ खो देते हैं और यह विषय मॉडलिंग या भावना विश्लेषण के लिए सटीक नहीं होगा।
1). StackOverflow is helpful => StackOverflow helpful
2). StackOverflow is not helpful => StackOverflow helpful
क्या कोई यह बता सकता है कि इन नकारात्मक शब्दों को आमतौर पर शब्दों को रोकने के लिए क्यों माना जाता है?