इस सवाल से प्रेरित होकर , मैं सोच रहा हूं कि क्या किसी भी विषय पर बहुत छोटे ग्रंथों के बड़े संग्रह के लिए कोई काम किया गया है। मेरा अंतर्ज्ञान यह है कि ट्विटर को इस तरह के मॉडल के लिए एक प्राकृतिक प्रेरणा होना चाहिए। हालांकि, कुछ सीमित प्रयोग से, ऐसा लगता है कि मानक विषय मॉडल (LDA, आदि) इस तरह के डेटा पर काफी खराब प्रदर्शन करते हैं।
क्या किसी को भी इस क्षेत्र में किए गए किसी काम का पता नहीं है? यह पेपर एलडीए को ट्विटर पर लागू करने के बारे में बात करता है, लेकिन मुझे वास्तव में दिलचस्पी है कि क्या अन्य एल्गोरिदम हैं जो शॉर्ट-डॉक्यूमेंट के संदर्भ में बेहतर प्रदर्शन करते हैं।