"पाठ में व्यंग्य की पहचान" के क्षेत्र में क्या शोध किया गया है?


17

व्यंग्य की पहचान एमएल और एनएलपी के क्षेत्र में सबसे कठिन ओपन एंडेड समस्याओं में से एक के रूप में माना जाता है।

तो, क्या उस मोर्चे पर कोई काफी शोध किया गया था? यदि हाँ, तो इसकी सटीकता क्या है? कृपया एनएलपी मॉडल को भी संक्षेप में बताएं।



आह, दिलचस्प सवाल (!)
ABcDexter

जवाबों:


5

आईआईटी बॉम्बे के शोधकर्ताओं द्वारा किए गए सर्वेक्षण के बाद के लेख में हाल ही में व्यंग्य का पता लगाने के बारे में बताया गया है : Arxiv लिंक

आपके प्रश्न के संदर्भ में, मुझे नहीं लगता कि इसे या तो असाधारण रूप से कठिन या ओपन-एंड माना जाता है। हालांकि यह अस्पष्टता का परिचय देता है कि कंप्यूटर अभी तक संभाल नहीं सकते हैं, मनुष्य आसानी से व्यंग्य को समझने में सक्षम हैं, और इस प्रकार व्यंग्य का पता लगाने के लिए डेटासेट लेबल करने में सक्षम हैं।


2

उसी डोमेन में हाल ही में एक काम किया गया है जहाँ तंत्रिका नेटवर्क (सटीक होने के लिए CNN) का उपयोग किया जाता है। कुछ जानकारी। अनुसंधान के बारे में है:

उस संदर्भ को जानने के लिए, पेपर एक ऐसी विधि का वर्णन करता है जिसके द्वारा तंत्रिका नेटवर्क उपयोगकर्ता के "एम्बेडिंग" को खोजता है - अर्थात पिछले ट्वीट, संबंधित हितों और खातों की सामग्री जैसे प्रासंगिक संकेत, और इसी तरह। यह इन विभिन्न कारकों का उपयोग उपयोगकर्ता को दूसरों के साथ साजिश करने के लिए करता है, और (आदर्श रूप से) पाता है कि वे अपेक्षाकृत अच्छी तरह से परिभाषित समूह बनाते हैं।

इसलिए, पेपर पाठ में व्यंग्य का पता लगाने के लिए सीएनएन, शब्द और उपयोगकर्ता एम्बेडिंग का उपयोग करता है। उस पर एक Techcrunch लेख भी है।

पेपर ट्वीट की भावना का उपयोग करता है और अन्य समान ट्वीट की तुलना करता है:

यदि ट्वीट की भावना समान उपयोगकर्ताओं द्वारा व्यक्त की गई चीज़ों से बहुत अधिक असहमत लगती है, तो एक अच्छा मौका है कि व्यंग्य को नियोजित किया जा रहा है।

कागज से लिंक करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.