व्यंग्य की पहचान एमएल और एनएलपी के क्षेत्र में सबसे कठिन ओपन एंडेड समस्याओं में से एक के रूप में माना जाता है।
तो, क्या उस मोर्चे पर कोई काफी शोध किया गया था? यदि हाँ, तो इसकी सटीकता क्या है? कृपया एनएलपी मॉडल को भी संक्षेप में बताएं।
व्यंग्य की पहचान एमएल और एनएलपी के क्षेत्र में सबसे कठिन ओपन एंडेड समस्याओं में से एक के रूप में माना जाता है।
तो, क्या उस मोर्चे पर कोई काफी शोध किया गया था? यदि हाँ, तो इसकी सटीकता क्या है? कृपया एनएलपी मॉडल को भी संक्षेप में बताएं।
जवाबों:
आईआईटी बॉम्बे के शोधकर्ताओं द्वारा किए गए सर्वेक्षण के बाद के लेख में हाल ही में व्यंग्य का पता लगाने के बारे में बताया गया है : Arxiv लिंक ।
आपके प्रश्न के संदर्भ में, मुझे नहीं लगता कि इसे या तो असाधारण रूप से कठिन या ओपन-एंड माना जाता है। हालांकि यह अस्पष्टता का परिचय देता है कि कंप्यूटर अभी तक संभाल नहीं सकते हैं, मनुष्य आसानी से व्यंग्य को समझने में सक्षम हैं, और इस प्रकार व्यंग्य का पता लगाने के लिए डेटासेट लेबल करने में सक्षम हैं।
उसी डोमेन में हाल ही में एक काम किया गया है जहाँ तंत्रिका नेटवर्क (सटीक होने के लिए CNN) का उपयोग किया जाता है। कुछ जानकारी। अनुसंधान के बारे में है:
उस संदर्भ को जानने के लिए, पेपर एक ऐसी विधि का वर्णन करता है जिसके द्वारा तंत्रिका नेटवर्क उपयोगकर्ता के "एम्बेडिंग" को खोजता है - अर्थात पिछले ट्वीट, संबंधित हितों और खातों की सामग्री जैसे प्रासंगिक संकेत, और इसी तरह। यह इन विभिन्न कारकों का उपयोग उपयोगकर्ता को दूसरों के साथ साजिश करने के लिए करता है, और (आदर्श रूप से) पाता है कि वे अपेक्षाकृत अच्छी तरह से परिभाषित समूह बनाते हैं।
इसलिए, पेपर पाठ में व्यंग्य का पता लगाने के लिए सीएनएन, शब्द और उपयोगकर्ता एम्बेडिंग का उपयोग करता है। उस पर एक Techcrunch लेख भी है।
पेपर ट्वीट की भावना का उपयोग करता है और अन्य समान ट्वीट की तुलना करता है:
यदि ट्वीट की भावना समान उपयोगकर्ताओं द्वारा व्यक्त की गई चीज़ों से बहुत अधिक असहमत लगती है, तो एक अच्छा मौका है कि व्यंग्य को नियोजित किया जा रहा है।