प्रयोग के लिए हम सरल मात्रात्मक सीनेटमेंट विश्लेषण के लिए जमीनी सच्चाई / प्रशिक्षण डेटा के रूप में कई ट्वीट्स में एम्बेडेड इमोजी का उपयोग करना चाहते हैं । एनएलपी को अच्छी तरह से काम करने के लिए आमतौर पर ट्वीट्स भी असंरचित होते हैं।
वैसे भी, यूनिकोड 6.0 में 722 इमोजी हैं, और शायद यूनिकोड 7.0 में एक और 250 जोड़ा जाएगा।
क्या कोई डेटाबेस (जैसे SentiWordNet) है जिसमें उनके लिए भावना एनोटेशन शामिल हैं?
(ध्यान दें कि SentiWordNet अस्पष्ट अर्थों के लिए भी अनुमति देता है । उदाहरण के लिए , अजीब बात पर विचार करें , जो सिर्फ सकारात्मक नहीं है: "यह स्वाद मजेदार है" शायद सकारात्मक नहीं है ... ;-)
उदाहरण के लिए एक ही पकड़ होगा । लेकिन मुझे नहीं लगता कि यह कठिन है। इमोजी की तुलना में यह नियमित शब्दों के लिए है ...)
इसके अलावा, यदि आपके पास भावना विश्लेषण के लिए उनका उपयोग करने का अनुभव है, तो मुझे सुनने में दिलचस्पी होगी।